使用Git进行版本控制
参考:《Python编程从入门到实践》
前言
版本控制软件让你能够拍摄处于可行状态的项目的快照。修改项目(如实现新功能)后,如果项目不能正常运行,可恢复到前一个可行状态。
通过使用版本控制软件,你可以无忧无虑地改进项目,不用担心项目因你犯了错而遭到破坏。对大型项目来说,这显得尤其重要,但对于较小的项目,哪怕是只包含一个文件的程序,这也大有裨益。
在本文中,你将学习到如何安装Git,以及如何使用它来对当前开发的程序进行版本控制。Git 是当前最流行的版本控制软件,它包含很多高级工具,可帮助团队协作开发大型项目,但其最基本的功能也非常适合独立开发人员使用。Git通过跟踪对项目中的每个文件的修改来实现版本控制,如果你犯了错,只需恢复到保存的前一个状态即可。
说明:笔者使用的是CentOS 7的64位 Linux环境
1、安装、配置 Git
Git可在所有操作系统上运行,但其安装方法因操作系统而异。
1.1 在Linux系统中安装Git
要在Linux系统中安装Git,执行如下命令:
CentOS:
$ sudo yum install git
Ubuntu:
$ sudo apt-get install git
安装完成后可以通过下述命令查看安装的版本:
git --version
1.2 在OS X系统中安装Git
OS X系统可能自带Git,因此在安装前先执行命令:‘git --version’。如果在输出中查看到具体的版本号,说明系统已经安装了Git;如果看到的是提示安装或升级Git的信息,根据屏幕显示的提示信息操作即可。
也可以访问链接:https://git-scm.com/
,单击链接Downloads,再点击适合你所用的系统的安装程序。
1.3 在Windows系统中安装Git
访问:https://gitforwindows.org/
,单击Download。
1.4 配置Git
Git跟踪谁修改了项目,哪怕参与项目开发的人只有一个。为此,Git需要知道你的的用户名和电子邮件地址。用户必须提供用户名,但是可以使用虚构的电子邮件地址:
$ git config --global user.name "wsy"
$ git config --global user.email "username@example.com"
如果忘了这一步,在首次提交时,Git将提示用户提供这些信息
2、创建项目
- 在所用系统中创建一个名为
git_practice
的文件夹作为项目目录; - 在项目目录下创建空文件:module.py
- 在项目目录下创建一个简单的python程序:hello_world.py 作为需要跟踪的项目文件,输入以下内容:
import module
print('Hello Git world!')
注:这里之所以需要创建一个空的module.py文件是因为在程序hello_world.py要引用他,这样在程序运行后就会生成一个__pycache__文件夹,这个文件夹我们后续不需要让Git跟踪它,所以要对它做忽略操作。
关于__pycache__文件夹:python解释器会对 *.py 文件进行编译,并且将编译结果保存到__pycache__目录下。在下次执行工程时,如果发现这个 *.py 没有被修改过,那么就会跳过编译这一步,直接执行在__pycache__中已经完成编译的.pyc文件。而且,只有被导入的module才会生成对应的 *.pyc文件,生成的 *.pyc 文件的命名规则是: ‘module.interpreter_version.pyc’。这样做的好处是,如果需要执行比较大的工程文件,那么会节约很多时间。
整个创建流程如下:
3、忽略文件
上面说过,扩展名为 .pyc 的文件是根据 .py 文件自动生成的,因此无需让Git跟踪它们。这些文件存储在 pycache 目录中。
为了让Git忽略__pycache__目录,执行下属操作:
- 在项目目录下创建一个名为
.gitignore
的特殊文件,该文件以句点打头,且没有扩展名; - 在
.gitignore
中添加下面一行内容:
__pycache__/
这让Git忽略__pycache__目录中的所有文件。使用 .gitignore 可避免项目混乱,开发起来更容易。
注:如果你使用的编译器是 python2.7,请将这行内容改为
*.pyc
。因为python2.7不会自动创建目录 pycache,它将每个.pyc文件都存储在相应.py文件所在目录中。其中的星号(*)让Git忽略所有扩展名为.pyc的文件。
流程如下:
4、初始化仓库
至此,我们创建了一个目录,其中包含一个python文件和一个 .gitignore 文件,下面可以初始化一个Git仓库了。为此,打开一个终端窗口,切换到文件夹 git_practice,并执行如下命令:
git init
如下:
输出表明,Git在git_practice中初始化了一个空仓库。仓库里是程序中被Git主动跟踪的一组文件。Git用来管理仓库的文件都存储在隐藏的 *.git/
中,用户无需与该目录打交道,但是千万不能删除该目录,否则将丢失项目的所有历史记录。
5、检查状态
执行其它操作前,先执行下述命令来看一下项目的状态:
git status
在Git中,分支(master)是项目的一个版本。从上述输出可以看出,目前项目位于分支master上。用户每次查看项目状态时,输出都将指出你位于分支master上。接下来的输出表明,我们将进行初始提交。提交是项目在特定时间点的快照。
接着,Git指出了项目中未被跟踪的文件,因为到目前为止我们还没有告诉它要跟踪哪些文件,从这里就可以看出,被我们忽略掉的__pycache__目录就不被跟踪。
最后,输出提示我们“提交为空,但是存在尚未跟踪的文件”,并告知如何建立跟踪,即使用 git add。
所以下面的任务就是将文件加入到仓库中。
6、将文件加入到仓库中
下面将上述指出的文件加入到仓库中,并再次检查状态。
可以通过下述两种方法进行添加:
1、逐个文件添加
git add .gitignore
git add hello_world.py
git add module.py
2、整体添加
git add .
命令 git add .
将项目中未被跟踪的所有文件都加入到仓库中,不需要一个文件一个文件的添加,这对于改动文件较多的项目来说很方便。它不提交这些文件,而只是让Git开始关注它们。下面我们再检查项目状态时,发现Git找出了需要提交的一些修改,且标出了新添加到仓库中的文件。
也可以理解为,通过 git add 将文件从工作目录添加到了一个暂存区。
7、执行提交
下面开始执行第一次提交,提交结束后再次查看项目状态,如下:
我们执行命令:commit -m "Started project."
以拍摄项目的快照。其中,标志 -m 让Git将接下来的消息(Started project.)记录到项目的历史记录中(也可以把这个消息当成是本次提交的一个title,用于辨识)。输出表明我们在分支 master上,且有3个文件被修改了。
现在我们再检查状态时,发现我们在分支master上,且工作目录是干净的。这是用户每次提交项目的可行状态时都希望看到的结果。如果显示的消息不是这样的,请仔细阅读,很可能是在提交前忘记了添加文件。
8、查看提交历史
Git记录所有的项目提交,通过命令 git log
即可查看提交历史,下面来看一下提交历史:
用户每次提交时,Git都会生成一个包含40字符的独一无二的引用ID,它记录提交是谁执行的、提交的时间以及提交时指定的消息。并非在任何情况下你都需要所有的这些信息,因此Git提供了一个选项,让你能够打印提交历史条目更加简单的版本:
标志 --pretty=oneline
指定显示两项最重要的信息:提交的引用ID以及为提交记录的消息(title)。
9、第二次提交
为了展示版本控制的强大之处,下面需要对项目进行修改,并提交所做的修改。为此,我们在 hello_world.py 中再添加一行代码:
import module
print('Hello Git world!')
print('Hello everyone.')
此时如果再查看项目状态,将发现Git已经注意到了这个文件的变化:
输出指出了我们当前所在的分支、被修改了的文件名称,还指出了所做的修改尚未提交。下面来提交所做的修改,并再次查看状态:
理论上来说,这里修改了文件后,应该先执行 git add . 或 git add hello_world.py 将新文件添加到仓库中,然后再使用 git commit … 命令执行提交。这里没有这样做,而是直接使用了 git commit 命令,辅之以 -am
选项,这是因为标志 -a 就是让Git将仓库中所有修改了的文件都加入到当前提交当中,而 -m 还是起到让Git在提交历史中记录一条消息的作用,这样简化了将文件添加到仓库中的步骤。
10、撤销修改
下面来看看如何放弃所做的修改,恢复到前一个可行状态。为此,首先在 hello_world.py 中再添加一行代码:
import module
print('Hello Git world!')
print('Hello everyone.')
print('Oh no, I broke the project!')
保存并运行这个文件,再查看状态,发现Git注意到了所做的修改:
现在,我们可以提交所做的修改,但这次我们不提交修改,而是要恢复到上一次提交(也就是本次修改之前的状态)。为此,不对 hello_world.py 执行任何操作——不删除刚刚添加的代码,也不使用文本编辑器的撤销功能,而是在终端中执行如下命令:
git checkout .
如图:
命令git checkout
让用户能够将项目恢复到以前的任何提交。命令git checkout .
放弃自最后一次提交后的所有修改,将项目恢复到最后一次提交状态。
此时,再查看文本内容,发现之前添加的一行代码已经没有了。
就这个项目而言,恢复到前一个状态微不足道,但如果我们开发的是大型项目,其中数十个文件都被修改了,那么恢复到前一个状态,将撤销自最后一次提交后对这些文件的所有修改。这个更能很有用:实现新功能时,你可以根据需要做任意数量的修改,如果这些修改不可行,可撤销它们,而不会对项目有任何伤害。
11、检出以前的提交
用户可以检出提交历史中的任何提交,而不仅仅是最后一次提交,为此可在命令 git checkout 末尾指定该提交的引用ID的前6个字符(而不是句点)。通过检出以前的提交,用户可以对其进行审核,然后返回到最后一次提交,或者放弃最近所做的工作,并选择以前的提交:
检出以前的提交后,你将离开分支master,并进入Git所说的分离头指针(detached HEAD)状态。HEAD表示项目的当前状态,之所以说我们处于分离状态,是因为我们离开了一个命名分支(这里是master分支)。
要回到master分支,可检出它:
git checkout master
这样就回到了分支master,除非你要使用Git的高级功能,否则在检出以前的提交后,最好不要对项目做任何修改。然而,如果参与项目开发的人只有你自己,而你又想放弃较近的所有提交,并恢复到以前的状态,也可以将项目重置到以前的提交。为此,可在处于分支master分支上的情况下,执行如下命令:
我们首先查看了状态,确认在master分支上。查看提交历史时,我们看到了两个提交。接下来,执行git reset --hard
,并在其中指定了要永久地恢复到的提交的引用ID前6个字符。再次查看状态,仍然在master分支上,且没有需要提交的修改。最后,查看提交历史,发现第二次提交历史已经不存在了,,我们处于要从它重新开始的提交中。
12、删除仓库
有时候,仓库的历史记录可能会被搞乱,且已经不知道如何恢复,在这种情况下,是可以继续使用这些文件的,但是需要把项目的历史记录删除——删除 .git。这不会影响任何文件的当前状态,而只会删除所有的提交,因此用户将无法检出项目的其他任何状态。
为此,我们下面通过终端将目录 .git 删除,然后重新创建一个仓库,以重新对修改进行跟踪,过程如下(直接复制终端的操作过程,不截图了):
wsy@localhost:~/WSY/git_practice$ pwd
/home/wsy/WSY/git_practice
wsy@localhost:~/WSY/git_practice$ ls -a
. .. .git .gitignore hello_world.py module.py __pycache__
wsy@localhost:~/WSY/git_practice$ rm -rf .git
wsy@localhost:~/WSY/git_practice$ git status
fatal: Not a git repository (or any of the parent directories): .git
wsy@localhost:~/WSY/git_practice$ git init
初始化空的 Git 版本库于 /home/wsy/WSY/git_practice/.git/
wsy@localhost:~/WSY/git_practice$ git status
# 位于分支 master
#
# 初始提交
#
# 未跟踪的文件:
# (使用 "git add <file>..." 以包含要提交的内容)
#
# .gitignore
# hello_world.py
# module.py
提交为空,但是存在尚未跟踪的文件(使用 "git add" 建立跟踪)
wsy@localhost:~/WSY/git_practice$ git add .
wsy@localhost:~/WSY/git_practice$ git status
# 位于分支 master
#
# 初始提交
#
# 要提交的变更:
# (使用 "git rm --cached <file>..." 撤出暂存区)
#
# 新文件: .gitignore
# 新文件: hello_world.py
# 新文件: module.py
#
wsy@localhost:~/WSY/git_practice$ git commit -m "Starting over."
[master(根提交) f04a84e] Starting over.
3 files changed, 4 insertions(+)
create mode 100644 .gitignore
create mode 100644 hello_world.py
create mode 100644 module.py
wsy@localhost:~/WSY/git_practice$ git status
# 位于分支 master
无文件要提交,干净的工作区
wsy@localhost:~/WSY/git_practice$
上述终端操作中,首先查看了状态,发现工作目录是干净的。接下来使用命令 rm -rf .git(在Windows系统中,应该使用的命令是 rmdir ./s .git)删除目录 .git。删除后再次查看状态时,就被告知这不是一个Git仓库了。Git用来跟踪仓库的信息都存储在文件夹 .git中,因此删除该文件夹就相当于删除了整个仓库。
接下来使用 git init新建一个全新的仓库,然后依次执行建立跟踪、提交等操作了。
结束语
Git在研发中,特别是在团队合作开发项目中的作用很大,笔者是今年夏天在公司实习时第一次接触到该工具。实习过程中由于知识有限,很多命令在使用时一知半解。最近在重翻《Python编程从入门到实践》这本书的时候从附录中发现了有关于Git工具的使用介绍,因此自己系统的学习了一下,顺便记录。此外,本文记录的关于Git的使用是建立在本地的项目开发,比较基础,实习中是通过git push
从远程分支拉取项目并进行开发、维护。后续还会继续深入学习,顺便推荐一个Git学习网站:Git 教程
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!