關於版本控制軟體以及Git的簡單介紹
以下內容從Pro Git這本書獲取,該書的PDF下載連結 https://git-scm.com/book/zh/v2
本章介紹開始使用 Git 前的相關知識。我們會先了解一些版本控制工具的歷史背景,然後試著讓 Git 在你的系統上跑起來,直到最後配置好,可以正常開始開發工作。讀完本章,你就會明白為什麼 Git 會如此流行,為什麼你應該立即開始使用它。(檢視Git詳解系列的全部文章)
1.1 關於版本控制
什麼是版本控制?我真的需要嗎?版本控制是一種記錄若干檔案內容變化,以便將來查閱特定版本修訂情況的系統。在本書所展示的例子中,我們僅對儲存著軟體原始碼的文字檔案作版本控制管理,但實際上,你可以對任何型別的檔案進行版本控制。
如果你是點陣圖形或網頁設計師,可能會需要儲存某一幅圖片或頁面佈局檔案的所有修訂版本(這或許是你非常渴望擁有的功能)。採用版本控制系統 (VCS)是個明智的選擇。有了它你就可以將某個檔案回溯到之前的狀態,甚至將整個專案都回退到過去某個時間點的狀態。你可以比較檔案的變化細節,查出最 後是誰修改了哪個地方,從而導致出現怪異問題,又是誰在何時報告了某個功能缺陷等等。使用版本控制系統通常還意味著,就算你亂來一氣把整個專案中的檔案改 的改刪的刪,你也照樣可以輕鬆恢復到原先的樣子。但額外增加的工作量卻微乎其微。
本地版本控制系統
許多人習慣用複製整個專案目錄的方式來儲存不同的版本,或許還會改名加上備份時間以示區別。這麼做唯一的好處就是簡單。不過壞處也不少:有時候會混淆所在的工作目錄,一旦弄錯檔案丟了資料就沒法撤銷恢復。
為了解決這個問題,人們很久以前就開發了許多種本地版本控制系統,大多都是採用某種簡單的資料庫來記錄檔案的歷次更新差異(見圖 1-1)。
圖 1-1. 本地版本控制系統
其中最流行的一種叫做 rcs,現今許多計算機系統上都還看得到它的蹤影。甚至在流行的 Mac OS X 系統上安裝了開發者工具包之後,也可以使用 rcs 命令。它的工作原理基本上就是儲存並管理檔案補丁(patch)。檔案補丁是一種特定格式的文字檔案,記錄著對應檔案修訂前後的內容變化。所以,根據每次 修訂後的補丁,rcs 可以通過不斷打補丁,計算出各個版本的檔案內容。
集中化的版本控制系統
接下來人們又遇到一個問題,如何讓在不同系統上的開發者協同工作?於是,集中化的版本控制系統( Centralized Version Control Systems,簡稱 CVCS )應運而生。這類系統,諸如 CVS,Subversion 以及 Perforce 等,都有一個單一的集中管理的伺服器,儲存所有檔案的修訂版本,而協同工作的人們都通過客戶端連到這臺伺服器,取出最新的檔案或者提交更新。多年以來,這 已成為版本控制系統的標準做法(見圖 1-2)。
圖 1-2. 集中化的版本控制系統
這種做法帶來了許多好處,特別是相較於老式的本地 VCS 來說。現在,每個人都可以在一定程度上看到專案中的其他人正在做些什麼。而管理員也可以輕鬆掌控每個開發者的許可權,並且管理一個 CVCS 要遠比在各個客戶端上維護本地資料庫來得輕鬆容易。
事分兩面,有好有壞。這麼做最顯而易見的缺點是中央伺服器的單點故障。如果宕機一小時,那麼在這一小時內,誰都無法提交更新,也就無法協同工作。要 是中央伺服器的磁碟發生故障,碰巧沒做備份,或者備份不夠及時,就還是會有丟失資料的風險。最壞的情況是徹底丟失整個專案的所有歷史更改記錄,而被客戶端 提取出來的某些快照資料除外,但這樣的話依然是個問題,你不能保證所有的資料都已經有人事先完整提取出來過。本地版本控制系統也存在類似問題,只要整個項 目的歷史記錄被儲存在單一位置,就有丟失所有歷史更新記錄的風險。
分散式版本控制系統
於是分散式版本控制系統( Distributed Version Control System,簡稱 DVCS )面世了。在這類系統中,像 Git,Mercurial,Bazaar 以及 Darcs 等,客戶端並不只提取最新版本的檔案快照,而是把原始的程式碼倉庫完整地映象下來。這麼一來,任何一處協同工作用的伺服器發生故障,事後都可以用任何一個鏡 像出來的本地倉庫恢復。因為每一次的提取操作,實際上都是一次對程式碼倉庫的完整備份(見圖 1-3)。
圖 1-3. 分散式版本控制系統
更進一步,許多這類系統都可以指定和若干不同的遠端程式碼倉庫進行互動。籍此,你就可以在同一個專案中,分別和不同工作小組的人相互協作。你可以根據需要設定不同的協作流程,比如層次模型式的工作流,而這在以前的集中式系統中是無法實現的。
1.2 Git 簡史
同生活中的許多偉大事件一樣,Git 誕生於一個極富紛爭大舉創新的年代。Linux 核心開源專案有著為數眾廣的參與者。絕大多數的 Linux 核心維護工作都花在了提交補丁和儲存歸檔的繁瑣事務上(1991-2002年間)。到 2002 年,整個專案組開始啟用分散式版本控制系統 BitKeeper 來管理和維護程式碼。
到了 2005 年,開發 BitKeeper 的商業公司同 Linux 核心開源社群的合作關係結束,他們收回了免費使用 BitKeeper 的權力。這就迫使 Linux 開源社群(特別是 Linux 的締造者 Linus Torvalds )不得不吸取教訓,只有開發一套屬於自己的版本控制系統才不至於重蹈覆轍。他們對新的系統制訂了若干目標:
* 速度 * 簡單的設計 * 對非線性開發模式的強力支援(允許上千個並行開發的分支) * 完全分散式 * 有能力高效管理類似 Linux 核心一樣的超大規模專案(速度和資料量)
自誕生於 2005 年以來,Git 日臻成熟完善,在高度易用的同時,仍然保留著初期設定的目標。它的速度飛快,極其適合管理大專案,它還有著令人難以置信的非線性分支管理系統(見第三章),可以應付各種複雜的專案開發需求。
1.3 Git 基礎
那麼,簡單地說,Git 究竟是怎樣的一個系統呢?請注意,接下來的內容非常重要,若是理解了 Git 的思想和基本工作原理,用起來就會知其所以然,遊刃有餘。在開始學習 Git 的時候,請不要嘗試把各種概念和其他版本控制系統(諸如 Subversion 和 Perforce 等)相比擬,否則容易混淆每個操作的實際意義。Git 在儲存和處理各種資訊的時候,雖然操作起來的命令形式非常相近,但它與其他版本控制系統的做法頗為不同。理解這些差異將有助於你準確地使用 Git 提供的各種工具。
直接記錄快照,而非差異比較
Git 和其他版本控制系統的主要差別在於,Git 只關心檔案資料的整體是否發生變化,而大多數其他系統則只關心檔案內容的具體差異。這類系統 (CVS,Subversion,Perforce,Bazaar 等等)每次記錄有哪些檔案作了更新,以及都更新了哪些行的什麼內容,請看圖 1-4。
圖 1-4. 其他系統在每個版本中記錄著各個檔案的具體差異
Git 並不儲存這些前後變化的差異資料。實際上,Git 更像是把變化的檔案作快照後,記錄在一個微型的檔案系統中。每次提交更新時,它會縱覽一遍所有檔案的指紋資訊並對檔案作一快照,然後儲存一個指向這次快照 的索引。為提高效能,若檔案沒有變化,Git 不會再次儲存,而只對上次儲存的快照作一連結。Git 的工作方式就像圖 1-5 所示。
圖 1-5. Git 儲存每次更新時的檔案快照
這是 Git 同其他系統的重要區別。它完全顛覆了傳統版本控制的套路,並對各個環節的實現方式作了新的設計。Git 更像是個小型的檔案系統,但它同時還提供了許多以此為基礎的超強工具,而不只是一個簡單的 VCS。稍後在第三章討論 Git 分支管理的時候,我們會再看看這樣的設計究竟會帶來哪些好處。
近乎所有操作都是本地執行
在 Git 中的絕大多數操作都只需要訪問本地檔案和資源,不用連網。但如果用 CVCS 的話,差不多所有操作都需要連線網路。因為 Git 在本地磁碟上就儲存著所有當前專案的歷史更新,所以處理起來速度飛快。
舉個例子,如果要瀏覽專案的歷史更新摘要,Git 不用跑到外面的伺服器上去取資料回來,而直接從本地資料庫讀取後展示給你看。所以任何時候你都可以馬上翻閱,無需等待。如果想要看當前版本的檔案和一個月 前的版本之間有何差異,Git 會取出一個月前的快照和當前檔案作一次差異運算,而不用請求遠端伺服器來做這件事,或是把老版本的檔案拉到本地來作比較。
用 CVCS 的話,沒有網路或者斷開 VPN 你就無法做任何事情。但用 Git 的話,就算你在飛機或者火車上,都可以非常愉快地頻繁提交更新,等到了有網路的時候再上傳到遠端倉庫。同樣,在回家的路上,不用連線 VPN 你也可以繼續工作。換作其他版本控制系統,這麼做幾乎不可能,抑或非常麻煩。比如 Perforce,如果不連到伺服器,幾乎什麼都做不了(譯註:預設無法發出命令p4
edit file
開始編輯檔案,因為 Perforce 需要聯網通知系統宣告該檔案正在被誰修訂。但實際上手工修改檔案許可權可以繞過這個限制,只是完成後還是無法提交更新。);如果是 Subversion 或 CVS,雖然可以編輯檔案,但無法提交更新,因為資料庫在網路上。看上去好像這些都不是什麼大問題,但實際體驗過之後,你就會驚喜地發現,這其實是會帶來很大不同的。
時刻保持資料完整性
在儲存到 Git 之前,所有資料都要進行內容的校驗和(checksum)計算,並將此結果作為資料的唯一標識和索引。換句話說,不可能在你修改了檔案或目錄之後,Git 一無所知。這項特性作為 Git 的設計哲學,建在整體架構的最底層。所以如果檔案在傳輸時變得不完整,或者磁碟損壞導致檔案資料缺失,Git 都能立即察覺。
Git 使用 SHA-1 演算法計算資料的校驗和,通過對檔案的內容或目錄的結構計算出一個 SHA-1 雜湊值,作為指紋字串。該字串由 40 個十六進位制字元(0-9 及 a-f)組成,看起來就像是:
Shell1 | 24b9da6552252987aa493b52f8696cd6d3b00373 |
Git 的工作完全依賴於這類指紋字串,所以你會經常看到這樣的雜湊值。實際上,所有儲存在 Git 資料庫中的東西都是用此雜湊值來作索引的,而不是靠檔名。
多數操作僅新增資料
常用的 Git 操作大多僅僅是把資料新增到資料庫。因為任何一種不可逆的操作,比如刪除資料,都會使回退或重現歷史版本變得困難重重。在別的 VCS 中,若還未提交更新,就有可能丟失或者混淆一些修改的內容,但在 Git 裡,一旦提交快照之後就完全不用擔心丟失資料,特別是養成定期推送到其他倉庫的習慣的話。
這種高可靠性令我們的開發工作安心不少,儘管去做各種試驗性的嘗試好了,再怎樣也不會弄丟資料。至於 Git 內部究竟是如何儲存和恢復資料的,我們會在第九章討論 Git 內部原理時再作詳述。
檔案的三種狀態
好,現在請注意,接下來要講的概念非常重要。對於任何一個檔案,在 Git 內都只有三種狀態:已提交(committed),已修改(modified)和已暫存(staged)。已提交表示該檔案已經被安全地儲存在本地資料庫 中了;已修改表示修改了某個檔案,但還沒有提交儲存;已暫存表示把已修改的檔案放在下次提交時要儲存的清單中。
由此我們看到 Git 管理專案時,檔案流轉的三個工作區域:Git 的工作目錄,暫存區域,以及本地倉庫。
圖 1-6. 工作目錄,暫存區域,以及本地倉庫
每個專案都有一個 Git 目錄(譯註:如果 git clone
出來的話,就是其中 .git
的目錄;如果git clone --bare
的話,新建的目錄本身就是 Git 目錄。),它是 Git 用來儲存元資料和物件資料庫的地方。該目錄非常重要,每次克隆映象倉庫的時候,實際拷貝的就是這個目錄裡面的資料。
從專案中取出某個版本的所有檔案和目錄,用以開始後續工作的叫做工作目錄。這些檔案實際上都是從 Git 目錄中的壓縮物件資料庫中提取出來的,接下來就可以在工作目錄中對這些檔案進行編輯。
所謂的暫存區域只不過是個簡單的檔案,一般都放在 Git 目錄中。有時候人們會把這個檔案叫做索引檔案,不過標準說法還是叫暫存區域。
基本的 Git 工作流程如下:
1. 在工作目錄中修改某些檔案。 2. 對修改後的檔案進行快照,然後儲存到暫存區域。 3. 提交更新,將儲存在暫存區域的檔案快照永久轉儲到 Git 目錄中。
所以,我們可以從檔案所處的位置來判斷狀態:如果是 Git 目錄中儲存著的特定版本檔案,就屬於已提交狀態;如果作了修改並已放入暫存區域,就屬於已暫存狀態;如果自上次取出後,作了修改但還沒有放到暫存區域,就 是已修改狀態。到第二章的時候,我們會進一步瞭解其中細節,並學會如何根據檔案狀態實施後續操作,以及怎樣跳過暫存直接提交。
1.4 安裝 Git
是時候動手嘗試下 Git 了,不過得先安裝好它。有許多種安裝方式,主要分為兩種,一種是通過編譯原始碼來安裝;另一種是使用為特定平臺預編譯好的安裝包。
從原始碼安裝
若是條件允許,從原始碼安裝有很多好處,至少可以安裝最新的版本。Git 的每個版本都在不斷嘗試改進使用者體驗,所以能通過原始碼自己編譯安裝最新版本就再好不過了。有些 Linux 版本自帶的安裝包更新起來並不及時,所以除非你在用最新的 distro 或者 backports,那麼從原始碼安裝其實該算是最佳選擇。
Git 的工作需要呼叫 curl,zlib,openssl,expat,libiconv 等庫的程式碼,所以需要先安裝這些依賴工具。在有 yum 的系統上(比如 Fedora)或者有 apt-get 的系統上(比如 Debian 體系),可以用下面的命令安裝:
Shell1 2 3 4 5 | $yum install curl-devel expat-devel gettext-devel\ openssl-devel zlib-devel $apt-getinstall libcurl4-gnutls-dev libexpat1-dev gettext\ libz-dev libssl-dev |
之後,從下面的 Git 官方站點下載最新版本原始碼:
Shell1 | http://git-scm.com/download |
然後編譯並安裝:
相關推薦
關於版本控制軟體以及Git的簡單介紹
以下內容從Pro Git這本書獲取,該書的PDF下載連結 https://git-scm.com/book/zh/v2 本章介紹開始使用 Git 前的相關知識。我們會先了解一些版本控制工具的歷史背景,然後試著讓 Git 在你的系統上跑起來,直到最後配置好,可以正
工作中多人使用git版本控制軟體協作開發,常見的應用場景
工作中多人使用版本控制軟體協作開發,常見的應用場景歸納如下: 假設小組中有兩個人,組長小張,組員小袁 場景一:小張建立專案並提交到遠端Git倉庫 場景二:小袁從遠端Git倉庫上獲取專案原始碼 場景三:小袁修改了部分原始碼,提交到遠端倉庫 場景四:小張從遠端倉庫獲取小袁的提交
由git版本控制maven管理的簡單web…
一.Git學習 我想從0開始建立一個相對來說完善並且專業的程式碼庫,我選擇gitHub託管程式碼,並且通過Git來進行版本控制.那麼就從學習git開始,下面的連結是我學習的教程[廖雪峰的官網,Git教程],感覺簡單易懂,馬上就入門了. 附上專案地址,不斷更新https://github.com/zhih
版本控制工具之Git
但是 不想 之前 設置 xxx 遠程 -o span 兩種 git三層結構 工作區working directory 暫存區staging index 版本庫git directory(Repository) Git文件的四種狀態 untracked未被追蹤 Modifie
分散式版本控制系統:Git學習筆記
文章目錄 概述 Git是什麼 Git的安裝 建立版本庫 編寫檔案上傳 使用GitHub 概述 身為DBA的我前夕確實對於程式碼比較陌生啊,Git也是很少聽過。
用於硬體設計的開源版本控制系統(Git)
本文轉自:http://www.eetop.cn/blog/html/28/1561828-437263.html 版本控制系統是每一個開發流程中不可或缺的一部分。傳統上,硬體設計公司為單獨一個工程使用一箇中央版本控制系統,但這樣會強加給硬體團隊很大的侷限性。一個流行的可緩解此問題的解決方案就是
【分散式版本控制系統】GIT問題彙總
一.Git 安裝(on Windows) 版本:git-2.12.1-64-bit.exe 官網即可下載(慢) ✓ Use Git from the Windows ✓ Use the OpenSSL library ✓ Checkout Windo
SVN(subversion)版本控制軟體的安裝與配置
本文主要介紹windows與阿里雲liunx(centos)的安裝與配置SVN工作原理:客戶端-服務端 程式碼的提交、更新 每一個版本都會在svn的安裝配置目錄下 SVN下載地址:http://subversion.apache.org/packages.ht
TCP傳輸控制協議(初步簡單介紹一下,後結針對各部分詳細陳述)
1、ARQ(automatic repeatable request)和重傳 涉及定時器(RTO)、序列號、ACK報文 2、分組視窗和滑動視窗 傳送視窗結構如下圖: 接收視窗結構如下圖: 3、變數視窗大小由流量控制和擁塞控制決定 流量控制:是針對收發方的視
elasticsearch版本控制及mapping對映屬性介紹
學習elasticsearch不僅只會操作,基本的執行原理我們還是需要進行了解,以下內容我講對elasticsearch中的基本知識原理進行梳理,希望對大家有所幫助! 一、ES版本控制 1.Elasticsearch採用了樂觀鎖來保證資料的一致性,也就
版本控制軟件git相關操作
一個 查看版本 git reset 版本 命令 指定 reset 文件夾 創建 git是一個用於幫助用戶實現版本控制相關操作的軟件 常用的命令操作: git init 初始化管理目錄 git status 查詢當前文件夾狀態 (是否有更新文件) git add 文件名 對當
版本控制系統之git
未完待續 1 是什麼 當多人協作開發一套產品時,需要能夠保證程式碼都能夠共用,那麼版本控制系統就應運而生。 當前用的比較多的是svn和git,本文以git為例進行講解。 git誕生於2005年,該系統開發者對該系統制定了若干目標: 速度 簡單的設計 對非線性開發模式的強力支援 完全分散式 有
【SVN】版本控制軟體
SVN版本控制軟體 SVN是什麼 SVN的全程是subversion,SVN版本控制軟體可以解決協助開發、遠端開發和版本回退三個問題。 特點:操作簡單、入門簡單、跨平臺操作 。 SVN是輸入C/S服務類軟體,有客戶端和服務端。 SVN版本控制軟體 SVN是什麼 SVN的全程是subver
ABAP OO 控制元件建立步驟簡單介紹
作為 一個ABAPER,必須得熟悉OO 控制元件的使用,如OO ALV、TEXTEDIT、TREE、PICTURE等等。 可使用事務程式碼BIBS-使用者介面設計的範例進行學習,裡面有很全的OO控制元件例子。 下面簡單介紹OO 建立步驟: 1、在自定義螢幕上建立一個自定義控
Android圖表控制元件MPAndroidChart的簡單介紹(MPAndroidChart3.0)
每個類對應的圖是什麼github上有詳細的介紹圖表類具有相同的地方X軸:XAxisY軸:YAxis圖例:Legend描述:Description限制線:LimitLine選中圖表中的值,可顯示的檢視:MarkerView 具體在圖表中的表現如下圖以曲線圖為例依賴:projec
Git 和svn的最大區別以及Git原理介紹
三、Git常用操作指南使用Git前,需要先建立一個倉庫(repository)。您可以使用一個已經存在的目錄作為Git倉庫或建立一個空目錄。使用您當前目錄作為Git倉庫,我們只需使它初始化。git init使用我們指定目錄作為Git倉庫。git init newrepo從現在開始,我們將假設您在Git倉庫根目
版本控制軟體的使用
導讀 版本控制軟體提供完備的版本管理功能,用於儲存、追蹤目錄(資料夾)和檔案的修改歷史,是軟體開發者的必備工具,是軟體公司的基礎設施。版本控制軟體的最高目標,是支援軟體公司的配置管理活動,追蹤多個版本的開發和維護活動,及時釋出軟體。 這裡記錄 個人使用版本控制軟體的相關筆記,主要涉
Git簡單介紹
Git是什麼?Git(分散式版本控制系統)是一款免費、開源的分散式版本控制系統,用於敏捷高效地處理任何或小或大的專案。Git是一個開源的分散式版本控制系統,可以有效、高速的處理從很小到非常大的專案版本管
Git簡單介紹(一)
Git是什麼? Git是目前世界上最先進的開源的分散式版本控制系統(沒有之一),用於敏捷高效地處理任何或小或大的專案。 Git 是 Linus Torvalds 為了幫助管理 Linux 核心開發而開發的一個開放原始碼的版本控制軟體。 Git 與常用的版本
版本控制SVN與Git
SVN 作為一個開源的版本控制系統,管理著隨時間改變的資料,這些資料放置在一箇中央資料檔案庫(repository)中。這個庫就像一個普通的檔案伺服器,它會記住每次檔案的變動。我們可以瀏覽檔案