下载git0.0.1版本的源码,第一次开源代码,只有几个文件,最能了解项目的意图

如下图

 

git源码阅读_git

git 源码解析(一)init-db


 

Git目录结构:

当在一个新目录或已有目录执行 git init 时,Git 会创建一个 .git 目录。 这个目录包含了几乎所有 Git 存储和操作的对象。 如若想备份或复制一个版本库,只需把这个目录拷贝至另一处即可。 本章探讨的所有内容,均位于这个目录内。 该目录的结构如下所示:

$ ls -F1

HEAD

config*

description

hooks/

info/

objects/

refs/

该目录下可能还会包含其他文件,不过对于一个全新的 git init 版本库,这将是你看到的默认结构。 description 文件仅供 GitWeb 程序使用,我们无需关心。 config 文件包含项目特有的配置选项。 info 目录包含一个全局性排除(global exclude)文件,用以放置那些不希望被记录在 .gitignore 文件中的忽略模式(ignored patterns)。 hooks 目录包含客户端或服务端的钩子脚本(hook scripts),在 Git 钩子 中这部分话题已被详细探讨过。

剩下的四个条目很重要:HEAD 文件、(尚待创建的)index 文件,和 objects 目录、refs 目录。 这些条目是 Git 的核心组成部分。 objects 目录存储所有数据内容;refs 目录存储指向数据(分支)的提交对象的指针;HEAD 文件指示目前被检出的分支;index 文件保存暂存区信息

Git的数据内容存储:

https://www.git-scm.com/book/zh/v2/Git-%E5%86%85%E9%83%A8%E5%8E%9F%E7%90%86-Git-%E5%AF%B9%E8%B1%A1

 

Git的对象:

Git对象

树对象

提交对象

标签对象

 

 

  1. Git服务器为何占用内存高?
  2. Git的数据存储方式?

问题1,2在以下文章中解答


 

我们这次遇到的file mode跟linux 中的又不太一样,因为他多了100。其实100表示普通文件,其他常见类型如下所示:

0100000000000000 (040000): Directory

1000000110100100 (100644): Regular non-executable file

1000000110110100 (100664): Regular non-executable group-writeable file

1000000111101101 (100755): Regular executable file

1010000000000000 (120000): Symbolic link

1110000000000000 (160000): Gitlink

之后可以使用如下命令让git忽略文件权限的改变,可以在.git/config中查看到相关设置是否生效。

git config --add core.filemode false

 

 

 

总结:通过以上几个网页的信息,以及观看第一版本的源码,主要根据git官网信息的介绍,跟着敲一遍,基本上就解决了我的疑惑,我的疑惑的问题是,git是怎样做到上传下载中保持文件的权限不变的?原因是git采用文件记录的方式在上传文件,将文件视为git对象,将目录视为树对象,将各个文件的权限以及文件类型,记录在树对象中,这样就会知道每一个文件的权限了。

 

 

 

Git中运用了zlib库对文件进行压缩,使用sha-1对文件数据进行处理。