git rebase 的使用
rebase
在 Git 中整合來自不同分支的修改主要有兩種方法:merge
以及 rebase
。 在本節中我們將學習什麽是“rebase”,怎樣使用“rebase”,並將展示該操作的驚艷之處,以及指出在何種情況下你應避免使用它。
rebase的基本操作
整合分支最容易的方法是 merge
命令。 它會把兩個分支的最新快照(C3
和 C4
)以及二者最近的共同祖先(C2
)進行三方merge,merge的結果是生成一個新的快照(並提交)。
還有一種方法:你可以提取在 C4
中引入的補丁和修改,然後在 C3
的基礎上應用一次。 在 Git 中,這種操作就叫做 rebase。 你可以使用 rebase
在上面這個例子中,運行:
$ git checkout experiment $ git rebase master First, rewinding head to replay your work on top of it... Applying: added staged command
它的原理是首先找到這兩個分支(即當前分支 experiment
、rebase操作的目標基底分支 master
)的最近共同祖先 C2
,然後對比當前分支相對於該祖先的歷次提交,提取相應的修改並存為臨時文件,然後將當前分支指向目標基底 C3
現在回到 master
分支,進行一次快進merge。
$ git checkout master
$ git merge experiment
此時,C4‘
指向的快照就和上面使用 merge
命令的例子中 C5
指向的快照一模一樣了。 這兩種整合方法的最終結果沒有任何區別,但是rebase使得提交歷史更加整潔。 你在查看一個經過rebase的分支的歷史記錄時會發現,盡管實際的開發工作是並行的,但它們看上去就像是串行的一樣,提交歷史是一條直線沒有分叉。
一般我們這樣做的目的是為了確保在向遠程分支推送時能保持提交歷史的整潔——例如向某個其他人維護的項目貢獻代碼時。 在這種情況下,你首先在自己的分支裏進行開發,當開發完成時你需要先將你的代碼rebase到 origin/master
請註意,無論是通過rebase,還是通過三方merge,整合的最終結果所指向的快照始終是一樣的,只不過提交歷史不同罷了。 rebase是將一系列提交按照原有次序依次應用到另一分支上,而merge是把最終結果合在一起。
更有趣的rebase例子
在對兩個分支進行rebase時,所生成的“重放”並不一定要在目標分支上應用,你也可以指定另外的一個分支進行應用。 你創建了一個特性分支 server
,為服務端添加了一些功能,提交了 C3
和 C4
。 然後從 C3
上創建了特性分支 client
,為客戶端添加了一些功能,提交了 C8
和 C9
。 最後,你回到 server
分支,又提交了 C10
。
假設你希望將 client
中的修改合並到主分支並發布,但暫時並不想merge server
中的修改,因為它們還需要經過更全面的測試。 這時,你就可以使用 git rebase
命令的 --onto
選項,選中在 client
分支裏但不在 server
分支裏的修改(即 C8
和 C9
),將它們在 master
分支上重放:
$ git rebase --onto master server client
以上命令的意思是:“取出 client
分支,找出處於 client
分支和 server
分支的共同祖先之後的修改,然後把它們在 master
分支上重放一遍”。 這理解起來有一點復雜,不過效果非常酷。
現在可以快進merge master
分支了。
$ git checkout master
$ git merge client
接下來你決定將 server
分支中的修改也整合進來。 使用 git rebase [basebranch] [topicbranch]
命令可以直接將特性分支(即本例中的 server
)rebase到目標分支(即 master
)上。這樣做能省去你先切換到 server
分支,再對其執行rebase命令的多個步驟。
$ git rebase master server
然後就可以快進merge主分支 master 了:
$ git checkout master
$ git merge server
至此,client
和 server
分支中的修改都已經整合到主分支裏了,你可以刪除這兩個分支,最終提交歷史會變成圖 最終的提交歷史 中的樣子:
$ git branch -d client
$ git branch -d server
rebase的風險
呃,奇妙的rebase也並非完美無缺,要用它得遵守一條準則:
Do not rebase commits that exist outside your repository.
如果你遵循這條金科玉律,就不會出差錯。
rebase操作的實質是丟棄一些現有的提交,然後相應地新建一些內容一樣但實際上不同的提交。 如果你已經將提交推送至某個倉庫,而其他人也已經從該倉庫拉取提交並進行了後續工作,此時,如果你用 git rebase
命令重新整理了提交並再次推送,你的同伴因此將不得不再次將他們手頭的工作與你的提交進行整合,如果接下來你還要拉取並整合他們修改過的提交,事情就會變得一團糟。
讓我們來看一個在公開的倉庫上執行rebase操作所帶來的問題。 假設你從一個中央服務器克隆然後在它的基礎上進行了一些開發。 你的提交歷史如圖所示:
然後,某人又向中央服務器提交了一些修改,其中還包括一次merge。 你抓取了這些在遠程分支上的修改,並將其merge到你本地的開發分支,然後你的提交歷史就會變成這樣:
接下來,這個人又決定把merge操作回滾,改用rebase;繼而又用 git push --force
命令覆蓋了服務器上的提交歷史。 之後你從服務器抓取更新,會發現多出來一些新的提交。
結果就是你們兩人的處境都十分尷尬。 如果你執行 git pull
命令,你將merge來自兩條提交歷史的內容,生成一個新的merge提交,最終倉庫會如圖所示:
此時如果你執行 git log
命令,你會發現有兩個提交的作者、日期、日誌居然是一樣的,這會令人感到混亂。 此外,如果你將這一堆又推送到服務器上,你實際上是將那些已經被rebase拋棄的提交又找了回來,這會令人感到更加混亂。 很明顯對方並不想在提交歷史中看到 C4
和 C6
,因為之前就是他把這兩個提交通過rebase丟棄的。
如果你 真的 遭遇了類似的處境,Git 還有一些高級魔法可以幫到你。 參考 https://git-scm.com/book/zh/v2/Git-%E5%88%86%E6%94%AF-%E5%8F%98%E5%9F%BA
rebase vs. merge
至此,你已在實戰中學習了rebase和merge的用法,你一定會想問,到底哪種方式更好。 在回答這個問題之前,讓我們退後一步,想討論一下提交歷史到底意味著什麽。
有一種觀點認為,倉庫的提交歷史即是 記錄實際發生過什麽。 它是針對歷史的文檔,本身就有價值,不能亂改。 從這個角度看來,改變提交歷史是一種褻瀆,你使用_謊言_掩蓋了實際發生過的事情。 如果由merge產生的提交歷史是一團糟怎麽辦? 既然事實就是如此,那麽這些痕跡就應該被保留下來,讓後人能夠查閱。
另一種觀點則正好相反,他們認為提交歷史是 項目過程中發生的事。 沒人會出版一本書的第一版草稿,軟件維護手冊也是需要反復修訂才能方便使用。 持這一觀點的人會使用 rebase 及 filter-branch 等工具來編寫故事,怎麽方便後來的讀者就怎麽寫。
現在,讓我們回到之前的問題上來,到底merge還是rebase好?希望你能明白,這並沒有一個簡單的答案。 Git 是一個非常強大的工具,它允許你對提交歷史做許多事情,但每個團隊、每個項目對此的需求並不相同。 既然你已經分別學習了兩者的用法,相信你能夠根據實際情況作出明智的選擇。
總的原則是,只對尚未推送或分享給別人的本地修改執行rebase操作清理歷史,從不對已推送至別處的提交執行rebase操作,這樣,你才能享受到兩種方式帶來的便利。
git rebase 的使用