Git 分支 - rebase 變基
變基
在 Git 中整合來自不同分支的修改主要有兩種方法:merge
以及 rebase
。 在本節中我們將學習什麼是“變基”,怎樣使用“變基”,並將展示該操作的驚豔之處,以及指出在何種情況下你應避免使用它。
變基的基本操作
請回顧之前在 分支的合併 中的一個例子,你會看到開發任務分叉到兩個不同分支,又各自提交了更新。
Figure 35. 分叉的提交歷史
之前介紹過,整合分支最容易的方法是 merge
命令。 它會把兩個分支的最新快照(C3
和 C4
)以及二者最近的共同祖先(C2
)進行三方合併,合併的結果是生成一個新的快照(並提交)。
Figure 36. 通過合併操作來整合分叉了的歷史
其實,還有一種方法:你可以提取在 C4
中引入的補丁和修改,然後在 C3
的基礎上應用一次。 在 Git 中,這種操作就叫做 變基。 你可以使用 rebase
命令將提交到某一分支上的所有修改都移至另一分支上,就好像“重新播放”一樣。
在上面這個例子中,執行:
$ git checkout experiment $ git rebase master First, rewinding head to replay your work on top of it... Applying: added staged command
它的原理是首先找到這兩個分支(即當前分支 experiment
、變基操作的目標基底分支 master
)的最近共同祖先 C2
,然後對比當前分支相對於該祖先的歷次提交,提取相應的修改並存為臨時檔案,然後將當前分支指向目標基底 C3
, 最後以此將之前另存為臨時檔案的修改依序應用。(譯註:寫明瞭 commit id,以便理解,下同)
Figure 37. 將 C4
中的修改變基到 C3
上
現在回到 master
分支,進行一次快進合併。
$ git checkout master $ git merge experiment
Figure 38. master 分支的快進合併
此時,C4'
指向的快照就和上面使用 merge
命令的例子中 C5
指向的快照一模一樣了。 這兩種整合方法的最終結果沒有任何區別,但是變基使得提交歷史更加整潔。 你在檢視一個經過變基的分支的歷史記錄時會發現,儘管實際的開發工作是並行的,但它們看上去就像是序列的一樣,提交歷史是一條直線沒有分叉。
一般我們這樣做的目的是為了確保在向遠端分支推送時能保持提交歷史的整潔——例如向某個其他人維護的專案貢獻程式碼時。 在這種情況下,你首先在自己的分支裡進行開發,當開發完成時你需要先將你的程式碼變基到 origin/master
上,然後再向主專案提交修改。 這樣的話,該專案的維護者就不再需要進行整合工作,只需要快進合併便可。
請注意,無論是通過變基,還是通過三方合併,整合的最終結果所指向的快照始終是一樣的,只不過提交歷史不同罷了。 變基是將一系列提交按照原有次序依次應用到另一分支上,而合併是把最終結果合在一起。
更有趣的變基例子
在對兩個分支進行變基時,所生成的“重放”並不一定要在目標分支上應用,你也可以指定另外的一個分支進行應用。 就像 從一個特性分支裡再分出一個特性分支的提交歷史 中的例子那樣。 你建立了一個特性分支 server
,為服務端添加了一些功能,提交了 C3
和 C4
。 然後從 C3
上建立了特性分支 client
,為客戶端添加了一些功能,提交了 C8
和 C9
。 最後,你回到 server
分支,又提交了 C10
。
Figure 39. 從一個特性分支裡再分出一個特性分支的提交歷史
假設你希望將 client
中的修改合併到主分支併發布,但暫時並不想合併 server
中的修改,因為它們還需要經過更全面的測試。 這時,你就可以使用 git rebase
命令的 --onto
選項,選中在 client
分支裡但不在 server
分支裡的修改(即 C8
和 C9
),將它們在 master
分支上重放:
$ git rebase --onto master server client
以上命令的意思是:“取出 client
分支,找出處於 client
分支和 server
分支的共同祖先之後的修改,然後把它們在 master
分支上重放一遍”。 這理解起來有一點複雜,不過效果非常酷。
Figure 40. 擷取特性分支上的另一個特性分支,然後變基到其他分支
現在可以快進合併 master
分支了。(如圖 快進合併 master 分支,使之包含來自 client 分支的修改):
$ git checkout master
$ git merge client
Figure 41. 快進合併 master 分支,使之包含來自 client 分支的修改
接下來你決定將 server
分支中的修改也整合進來。 使用 git rebase [basebranch] [topicbranch]
命令可以直接將特性分支(即本例中的 server
)變基到目標分支(即 master
)上。這樣做能省去你先切換到 server
分支,再對其執行變基命令的多個步驟。
$ git rebase master server
如圖 將 server 中的修改變基到 master 上 所示,server
中的程式碼被“續”到了 master
後面。
Figure 42. 將 server 中的修改變基到 master 上
然後就可以快進合併主分支 master 了:
$ git checkout master
$ git merge server
至此,client
和 server
分支中的修改都已經整合到主分支裡了,你可以刪除這兩個分支,最終提交歷史會變成圖 最終的提交歷史 中的樣子:
$ git branch -d client
$ git branch -d server
Figure 43. 最終的提交歷史
變基的風險
呃,奇妙的變基也並非完美無缺,要用它得遵守一條準則:
不要對在你的倉庫外有副本的分支執行變基。
如果你遵循這條金科玉律,就不會出差錯。 否則,人民群眾會仇恨你,你的朋友和家人也會嘲笑你,唾棄你。
變基操作的實質是丟棄一些現有的提交,然後相應地新建一些內容一樣但實際上不同的提交。 如果你已經將提交推送至某個倉庫,而其他人也已經從該倉庫拉取提交併進行了後續工作,此時,如果你用 git rebase
命令重新整理了提交併再次推送,你的同伴因此將不得不再次將他們手頭的工作與你的提交進行整合,如果接下來你還要拉取並整合他們修改過的提交,事情就會變得一團糟。
讓我們來看一個在公開的倉庫上執行變基操作所帶來的問題。 假設你從一箇中央伺服器克隆然後在它的基礎上進行了一些開發。 你的提交歷史如圖所示:
Figure 44. 克隆一個倉庫,然後在它的基礎上進行了一些開發
然後,某人又向中央伺服器提交了一些修改,其中還包括一次合併。 你抓取了這些在遠端分支上的修改,並將其合併到你本地的開發分支,然後你的提交歷史就會變成這樣:
Figure 45. 抓取別人的提交,合併到自己的開發分支
接下來,這個人又決定把合併操作回滾,改用變基;繼而又用 git push --force
命令覆蓋了伺服器上的提交歷史。 之後你從伺服器抓取更新,會發現多出來一些新的提交。
Figure 46. 有人推送了經過變基的提交,並丟棄了你的本地開發所基於的一些提交
結果就是你們兩人的處境都十分尷尬。 如果你執行 git pull
命令,你將合併來自兩條提交歷史的內容,生成一個新的合併提交,最終倉庫會如圖所示:
Figure 47. 你將相同的內容又合併了一次,生成了一個新的提交
此時如果你執行 git log
命令,你會發現有兩個提交的作者、日期、日誌居然是一樣的,這會令人感到混亂。 此外,如果你將這一堆又推送到伺服器上,你實際上是將那些已經被變基拋棄的提交又找了回來,這會令人感到更加混亂。 很明顯對方並不想在提交歷史中看到 C4
和 C6
,因為之前就是他把這兩個提交通過變基丟棄的。
用變基解決變基
如果你 真的 遭遇了類似的處境,Git 還有一些高階魔法可以幫到你。 如果團隊中的某人強制推送並覆蓋了一些你所基於的提交,你需要做的就是檢查你做了哪些修改,以及他們覆蓋了哪些修改。
實際上,Git 除了對整個提交計算 SHA-1 校驗和以外,也對本次提交所引入的修改計算了校驗和—— 即 “patch-id”。
如果你拉取被覆蓋過的更新並將你手頭的工作基於此進行變基的話,一般情況下 Git 都能成功分辨出哪些是你的修改,並把它們應用到新分支上。
舉個例子,如果遇到前面提到的 有人推送了經過變基的提交,並丟棄了你的本地開發所基於的一些提交 那種情境,如果我們不是執行合併,而是執行 git rebase teamone/master
, Git 將會:
-
檢查哪些提交是我們的分支上獨有的(C2,C3,C4,C6,C7)
-
檢查其中哪些提交不是合併操作的結果(C2,C3,C4)
-
檢查哪些提交在對方覆蓋更新時並沒有被納入目標分支(只有 C2 和 C3,因為 C4 其實就是 C4')
-
把查到的這些提交應用在
teamone/master
上面
從而我們將得到與 你將相同的內容又合併了一次,生成了一個新的提交 中不同的結果,如圖 在一個被變基然後強制推送的分支上再次執行變基 所示。
Figure 48. 在一個被變基然後強制推送的分支上再次執行變基
要想上述方案有效,還需要對方在變基時確保 C4' 和 C4 是幾乎一樣的。 否則變基操作將無法識別,並新建另一個類似 C4 的補丁(而這個補丁很可能無法整潔的整合入歷史,因為補丁中的修改已經存在於某個地方了)。
在本例中另一種簡單的方法是使用 git pull --rebase
命令而不是直接 git pull
。 又或者你可以自己手動完成這個過程,先 git fetch
,再 git rebase teamone/master
。
如果你習慣使用 git pull
,同時又希望預設使用選項 --rebase
,你可以執行這條語句 git config --global pull.rebase true
來更改 pull.rebase
的預設配置。
只要你把變基命令當作是在推送前清理提交使之整潔的工具,並且只在從未推送至共用倉庫的提交上執行變基命令,就不會有事。 假如在那些已經被推送至共用倉庫的提交上執行變基命令,並因此丟棄了一些別人的開發所基於的提交,那你就有大麻煩了,你的同事也會因此鄙視你。
如果你或你的同事在某些情形下決意要這麼做,請一定要通知每個人執行 git pull --rebase
命令,這樣儘管不能避免傷痛,但能有所緩解。
變基 vs. 合併
至此,你已在實戰中學習了變基和合並的用法,你一定會想問,到底哪種方式更好。 在回答這個問題之前,讓我們退後一步,想討論一下提交歷史到底意味著什麼。
有一種觀點認為,倉庫的提交歷史即是 記錄實際發生過什麼。 它是針對歷史的文件,本身就有價值,不能亂改。 從這個角度看來,改變提交歷史是一種褻瀆,你使用_謊言_掩蓋了實際發生過的事情。 如果由合併產生的提交歷史是一團糟怎麼辦? 既然事實就是如此,那麼這些痕跡就應該被保留下來,讓後人能夠查閱。
另一種觀點則正好相反,他們認為提交歷史是 專案過程中發生的事。 沒人會出版一本書的第一版草稿,軟體維護手冊也是需要反覆修訂才能方便使用。 持這一觀點的人會使用 rebase 及 filter-branch 等工具來編寫故事,怎麼方便後來的讀者就怎麼寫。
現在,讓我們回到之前的問題上來,到底合併還是變基好?希望你能明白,這並沒有一個簡單的答案。 Git 是一個非常強大的工具,它允許你對提交歷史做許多事情,但每個團隊、每個專案對此的需求並不相同。 既然你已經分別學習了兩者的用法,相信你能夠根據實際情況作出明智的選擇。
總的原則是,只對尚未推送或分享給別人的本地修改執行變基操作清理歷史,從不對已推送至別處的提交執行變基操作,這樣,你才能享受到兩種方式帶來的便利。
from: https://git-scm.com/book/zh/v2/Git-%E5%88%86%E6%94%AF-%E5%8F%98%E5%9F%BA