关于git:git-merge-不为人知的秘密

丹尼尔：Hi，蛋兄，周杰伦都出新专辑了，你咋还不更新啊，真的打算半年一更啊？

蛋学生：如同的确是这样，要不，择日不如撞日，明天聊聊？

丹尼尔：好啊，那聊些啥呢？

蛋学生：最近搞的事件须要实现两个利用我的项目的代码合并，逻辑就齐全参照 git merge 的根本准则，那就聊聊 git merge 吧

丹尼尔：git merge 我倒是常常用，不过却从未关怀过它外部是怎么实现的。那你跟我讲一下它的工作原理呗。

合并的根本准则: three-way

蛋学生：git merge 的根本准则是 three-way

丹尼尔：3 条路？啥东东？

蛋学生：简略讲就是有 3 个分支。假如就叫 a, o, b，其中 a 和 b 都来自于 o，如下所示：

丹尼尔：嗯，而后呢？

蛋学生：当初 a 和 b 要进行合并。假如你以后在 a 分支，而后运行 git merge b，那么合并后果是依据 a, o, b 之间的内容比拟后果剖析得出的。

丹尼尔：哦，嗯，比拟逻辑是什么呢？

蛋学生：Very 简略。只有 a, o, b 任意两个的内容统一，就放弃 o 的内容；如果都不一样，就抵触。如下图所示

丹尼尔：只有…

蛋学生：我还是列举下所有的场景吧，而后你就会明确了

1). o == a, o != b

假如内容如下：
o: daniel
a: daniel
b: dx-b

a merge b 的后果: dx-b

2). o == b, o != a

假如内容如下：
o: daniel
a: dx-a
b: daniel

a merge b 的后果: dx-a

3). a == b, o != a

假如内容如下：
o: daniel
a: dx-ab
b: dx-ab

a merge b 的后果: dx-ab

4). o != a, o != b, a != b

假如内容如下：
o: dx-o
a: dx-a
b: dx-b

a merge b 的后果: 抵触

<<<<<<< a  
dx-a  
=======  
dx-b  
>>>>>>> b

丹尼尔：哦，懂了，就是以 o 为基准来判断该保留哪个分支的内容，如果判断不了，就提醒抵触，自行解决。

蛋学生：没错

丹尼尔：下面是假如 3 个分支要比照的文件都存在，那如果某个分支的文件被删除或有新文件，该怎么解决呢？

蛋学生：你能够把短少的文件当作空内容文件来解决。嗯，这样说如同也不太精确。我还是再列举下场景吧。以下假如要比拟各分支的 dx.txt 文件

1). o 有, a 有, b 没

假如 1: o == a

合并后果：删除文件

因为 o == a，所以取 b 的后果

假如 2: o != a

合并后果：保留文件，内容为 a 的内容

因为 o, a, b 互不雷同，后果为抵触，但 b 没有文件，所以抵触后果间接取 a 的内容

2). o 有, a 没, b 有

与（1）相似，相当于把 a 换成 b

3). o 有, a 没, b 没

合并后果：删除文件

a == b，所以取 a 或 b 的后果，即删除

4). o 没, a 有, b 没

合并后果：取 a 的内容

o == b，所以取 a 的内容

5). o 没, a 没, b 有

与 (4) 相似，相当于把 a 换成 b

6). o 没, a 有, b 有

假如 1: a == b

合并后果：取 a（或 b）的内容

假如 2: a != b

合并后果：抵触

丹尼尔：丑陋，这下我齐全搞懂了合并逻辑了。

Diff 的实现算法：最长公共子序列

丹尼尔：但我还有一个疑难，比照文件内容的时候，是一行一行内容比照的吧

蛋学生：那是当然了

丹尼尔：那如果我加多一行，成心错开，岂不是都对不上了

蛋学生：当然…是不会犯这样低级的谬误的。在实现 diff 的时候，是利用了 LCS（Longest Common Sequence，即最长公共子序列）的算法。用下图来简略理解一下

假如有两个字符串 S1 和 S2，那它们的最长公共子序列就是 abcd

S1: "abcde"  
S2: " a1bc2d"

丹尼尔：哦。但这是字符串，该怎么利用到文件内容的 diff 上呢？

蛋学生：把图转一转，每个方块代表文件的一行内容，是不是就一样了

丹尼尔：是哦。通过 LCS 的算法，就算我成心错开了行，也不影响比拟，因为雷同内容的行总是能对得上

蛋学生：恩，不过这里只是两个文件的比拟，而 three-way 是三个文件内容的比拟，要略微多做点事

丹尼尔：能讲得具体一点吗？

蛋学生：上个图吧。假如咱们要合并 a 和 b 分支的 dx.txt 文件，先应用 LCS 来计算三个分支该文件内容的最长公共子序列（下图就是连线的内容为a,c,e的行），而后以这些子序列对各个文件的内容行进行宰割，宰割的块（下图中芜杂曲线的局部）就是不雷同的局部，对这些块的内容进行 three-way 剖析，即可得出这些内容块合并后的后果

丹尼尔：恩，究竟还是有图有假相啊，图一看就明确了。讲了这么多，要不间接 show 下代码吧

蛋学生：一样的思路，能够有各种各样的实现。我自个实现了一个简略的版本，请移步到 codepen.io 查看。也能够去瞧瞧 node-diff3 的代码实现，它比拟谨严，毕竟是一个可上生产的模块

丹尼尔：好咧，等会就去观摩观摩

小插曲

丹尼尔：我刚刚特意上网查了一下，git merge <branch> 的默认策略是 recursive，为啥叫递归呢？

蛋学生：还记得 git merge 的根本准则是 three-way 吗？a 和 b 的独特先人是 o，但有些状况下，a 和 b 的独特先人可能不止一个，这时就须要将这些独特先人通过 three-way 进行合并，这个动作会始终往上递归到根先人分支，所以这也是策略叫 recursive 的起因。

丹尼尔：除了 recursive，git merge 还有哪些合并策略呢？

蛋学生：这个就要看你装置的 git 的版本了。git merge 能够指定合并策略。这里有个小技巧，你能够成心给个不存在的策略名称，git 就会显示出所有可用的策略名称，如下所示：

$ git merge -s dx
Could not find merge strategy 'dx'.
Available strategies are: octopus ours recursive resolve subtree.

最初

丹尼尔：要不是我买了周杰伦的专辑，才想起你也好久没更新了，也就不会有明天这一出了

蛋学生：感激揭示，合作愉快

丹尼尔：真快，又到了说再见的时候了

蛋学生：See you next time!

关于git:git-merge-不为人知的秘密

合并的根本准则: three-way

Diff 的实现算法：最长公共子序列

小插曲

最初

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于git:git-merge-不为人知的秘密

合并的根本准则: three-way

Diff 的实现算法：最长公共子序列

小插曲

最初

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复