兴趣是最好的老师
--爱因斯坦

精通Git不得不了解的基本概念

如果你仔细阅读了之前一片文章 花10分钟开始使用Git 你可能会有如下几个疑问:

  1. 为什么“下载”源代码到本地确切的说是“创建一个远程代码仓库的一个本地克隆“?
  2. 为什么对同一个文件的不同更改要多次执行git add?Git这样设计是出于什么考虑?
  3. 如何知道git add了哪些文件?
  4. 为什么git commit之后还要执行push操作才能让其他人看到你的改动?
  5. git add之后想撤销怎么办?

带着这些问题,我们先来了解下Git的基础概念和设计理念。初看起来Git和其它版本控制工具并无二致,其实设计理念完全不同。一旦你了解了这些内容便可以更加高效的使用Git。可能有同学看到概念二字,下意识就会觉得这会不会很难?其实不然。因为Git设计初衷之一就是:简单。基本上你只要像看小说一样就能理解这些内容。

Git有别于其它版本控制系统的特点

  1. Git本地代码仓库记录着整个项目的历史
    这就使得Git几乎所有的操作都在本地离线进行。在没有联网的情况下可以进行查看历史记录,对比版本不同,提交本地仓库的更改等操作。这是SVN和微软的TFS所无非比拟的优势。想象下,如果你的公司源代码服务器保存在局域网内,你不在公司的情况下,采用传统的源代码控制工具SVN或者TFS,几乎没法进行任何操作。
  2. Git版本历史不是记录各个版本的差异,更像是记录快照(snapshot)
    Git中每个版本的历史记录都像是一个快照。在用户看来,每个版本就像你对某个时期文件系统拍了一张照片一样。当然为了优化存储对于没有改动的文件,Git也不会每份快照都重复保存的。

Git的三种工作区域

这个部分内容是关于Git最重要知识,乍看起来可能会觉得有点复杂,因为git引入了暂存区(staging area)的概念,这是其他源代码版本控制系统所没有的。不过也正是暂存区的引入使Git变的更加灵活。Git的三种工作区域分别是:

  1. 工作目录(Working Directory)
    你能从文件系统看到的文件,和你系统其他目录没有什么区别。
  2. Git仓库(Git Repository)
    在被Git管理的项目下,有个.git文件夹,该文件夹里面存储了所有和该项目相关的所有历史记录。每次git commit的结果都被保存在这里。
  3. 暂存区(Staging Area)
    可以理解成git所提供用来暂存被改动文件的存储空间[1]。简单来说就是每次git add添加的文件都是被添加到这个暂存区内。暂存区内所存储的文件会被下次执行git commit的时候作为一个新版本提交到Git仓库。如果你直接在工作目录里修改了文件,简单git commit[2]是不会被提交到Git仓库的。暂存区机制的好处在于可以多次暂存不同甚至相同的文件改动,想commit的时候批量commit即可。一个文件一旦被暂存了,相当于git复制了该文件此时的版本到暂存区,你可以继续改动工作目录的同一个文件,暂存区的文件不会被修改,除非你再执行git add暂存最新的改动,每次git commit执行也只是提交暂存区内的文件,工作目录内文件无论修改与否git都会忽略,只commit暂存区的文件版本。

你也用不刻意去记忆暂存了和改动了哪些文件,只要简单运行git status即可以显示出哪些文件被修改了,哪些文件被暂存了,一目了然。

Git三种工作区域和各种命令对其影响

关于远程代码仓库

通过之前对git代码仓库的描述,我们知道git commit其实只是提交了新版本到本地代码仓库,要想其他人看到你的改动,之后必须push到一个公开的server上才可以。实际上这台server上的代码仓库和你本地的代码仓库并无二致,只是大家都用这个server上的代码仓库作为标准版本而已。

结束语

如果你觉得有的概念枯燥和难记,可以结合之后的文章[实例分析和练习]来看。
相信此时你应该能够轻松回答本篇文章最开始的大部分问题问题。其中#5限于篇幅打算在下一篇文章中详细阐述。

参考文档

  1. Pro Git book
  2. git - the simple guide

  1. 暂存区里面的文件实际上也是被保存在.git文件夹下的。 
  2. git commit其实也提供了-a 选项直接把工作目录中已经修改的文件自动放入暂存区再提交。