混合雲存儲跨雲災備方案之跨雲復制
前面兩篇文章介紹了基於阿裏雲備份的跨雲備份和雲存儲網關的跨雲復制,兩者主要是解決文件粒度的備份與恢復問題。如果用戶需要保護一個雲上的數據庫應用,而不僅僅是數據庫的數據文件;如果用戶需要保護整個雲主機,而不止一些文件和目錄;且用戶對於保護同樣是有實時性要求的。那麽,混合雲容災就是為這些用戶需求量身打造的拳頭產品。
基於混合雲容災的跨雲容災架構
下圖描述了從雲廠商T的一臺Oracle服務器,通過混合雲容災恢復網關,備份到阿裏雲上的雲災備庫中,再恢復(fail-over)到阿裏雲ECS的過程。混合雲容災恢復網關同時還支持將在雲災備庫的最新數據恢復回(fail-back)到雲廠商T的Oracle主機中。通過這張架構圖,用戶可以了解到,容災的部署在源端和目的端是對稱的。需要用戶註意的一點是,圖中雲災備庫是虛線畫的。不同於雲備份庫和OSS,雲災備庫對用戶是不可見的。
接下來,就讓我們看下,如何一步一步的操作實現Oracle服務器的容災備份和恢復。
混合雲容災跨雲容災架構圖
基於混合雲容災的跨雲容災實施
首先,用戶登陸阿裏雲控制臺進入‘混合雲容災’即可輕松開通。
混合雲容災主頁
之後,用戶可以進入‘容災中心’-‘容災中心’去創建一個‘雲端災備恢復網關’。除去給網關取名和選取一個規格外,對於‘專有網絡’和‘交換機’如何配置,涉及到容災方案的設計與規劃。最簡單的做法就是將阿裏雲上的專有網絡配置的跟受保護的源端一樣就可以了。如果用戶有疑問,可以隨時咨詢混合雲存儲團隊專業的容災架構師。點擊‘確認’即完成容災網關的創建。
部署容災網關
網關的部署一般耗時30分鐘左右。部署成功的容災恢復網關如下圖所示。‘狀態未知’意味著該網關還沒有完成配置。
部署完成
這裏需要提及的一點:雖然創建和配置混合雲備份網關是一步完成,但是實際上,在用戶的該區域ECS主機列表裏,會增加兩臺ECS主機:1臺控制器(即MC)和1臺網關(即Store)。
混合雲容災ECS主機
點擊網關名稱會跳轉到容災恢復網關的管理界面。輸入賬號的AK信息(處於安全考慮,建議用戶使用子賬號配置災備網關),並提交。
災備恢復網關主頁
之後,用戶會看到備份加密配置,以決定備份的數據是否是加密的。混合雲容災通過AES256加密算法保障用戶寫入到災備網關的落盤數據的絕對安全。用戶可以根據自身業務特點來決定是否開啟加密。保持默認關閉的狀態,提交。
備份加密配置
提交完成後,用戶就進入了混合雲容災網關的管理主頁。在主頁上,用戶不僅能夠輕松地配置備份和恢復任務,而且還能直觀地了解和監控各個任務的實時狀態。此時,容災網關的狀態會變成‘正常運行’。
容災恢復網關主頁
然後,回到雲廠商T的控制臺,可以根據混合雲容災提供的混合雲容災控制器和網關的鏡像文件來創建兩臺虛擬機:控制器主機是Windows 2012 R2 64位的系統,雙核CPU,4G內存,128GB的SSD雲盤做系統盤;網關主機是Ubuntu 14.04 64位的系統,4核CPU,8G內存,128GB的SSD雲盤做系統盤,500GB的SSD雲盤做數據盤。導入鏡像和通過鏡像創建雲主機的過程請參見“基於雲存儲網關的跨雲復制”這篇文章的相關步驟即可。生成的雲主機如下圖所示:
雲廠商T內部署的容災網關
部署完成之後,用戶就可以在瀏覽器直接輸入控制器主機(Windows主機)的IP,即可看到前面配置線上的容災網關一樣的界面。因為步驟類似,需要用戶提供阿裏雲賬號的AK,網關的賬號和密碼等信息,此處省略。
配置完成,再次進入,就能夠看到雲廠商T內的容災網關(線下)的登陸界面。在阿裏雲上創建的線上網關和線下網關,在登陸的時候步驟不同。阿裏雲控制臺已經集成了自動登錄功能,所以用戶無需通過輸入用戶名密碼的方式登錄容災網關。輸入之前配置的用戶名密碼即可登陸。
容災網關登陸界面
登陸之後,用戶看到的容災網關的主頁和線上版本沒有任何區別。
雲廠商T內的容災網關主頁
接下來一步就是打通容災網關與用戶的Oracle服務器,將數據庫主機通過容災網關備份到雲災備庫中。我們先來查看一下Oracle數據庫中的表的信息及內容。通過下面的一些查詢可以看到Oracle數據庫中有971張用戶表,以及數據文件的大小。用戶需要註意一點是Oracle服務器的主機名。我們發現一些雲廠商的主機名有以數字開頭的情況,這會導致在恢復到阿裏雲ECS的時候導致創建ECS實例失敗的情況。阿裏雲的雲主機名有約束條件:長度為[2, 128]個英文或中文字符。必須以大小字母或中文開頭,不能以http://和https://開頭。可以包含數字、半角冒號(:)、下劃線(_)或者連字符(-)。
Oracle數據表總數
Oracle數據文件大小
在備份Oracle主機之前,需要執行一次precheck腳本,用以檢查Oracle主機的配置是否滿足備份的前提條件。用戶可以根據腳本的檢查結果,來對環境做相應的修改和配置,以滿足混合雲容災備份的前提條件。
precheck腳本執行
precheck執行結果
讓我們來備份這臺Oracle主機。回到雲廠商T的容災網關管理主頁。選擇‘備份’。
容災網關備份
在彈出的‘保護服務器’頁面中,選擇主機類型,輸入服務器IP及服務器的用戶名與密碼。在這個例子中,我們選擇‘Windows服務器’。需要註意一點的是,服務器IP應該要填Oracle主機的內網IP地址。這樣備份和恢復的流量都是走高帶寬的內網。
配置保護服務器
提交之後,可以去‘監控’-‘任務’裏查看進度。因為任務從添加到完成,需要幾分鐘的時間,用戶也可以點擊‘操作’欄的‘任務詳情’,也就是i圖標來查看任務詳情。
添加保護服務器任務
下圖就是添加成功的詳細信息。各個步驟的狀態都是OK的。如果遇到任務失敗,這個頁面也會提示用戶出錯信息。可以酌情處理,也可以咨詢混合雲容災的工程師以尋求幫助。
任務詳情
關閉任務詳情,可以去‘備份’頁查看剛剛添加的被保護的Oracle服務器。可以看到該主機的信息已經都被容災網關獲取,諸如磁盤數據和Oracle數據庫數據等。針對這些信息,可以做不同的備份。
Oracle主機磁盤信息
Oracle主機數據庫數據
在開始備份之前,需要先去‘備份策略’中創建一個備份策略。這個備份策略最主要的作用是定義排程。另外,‘開啟上雲復制’需要勾選,否則備份數據,只會留在備份網關本地,而不會上傳到雲災備庫。‘本地拷貝’和‘雲上復制’的天數定義了備份數據在本地和雲上保持的天數。保存即可。
創建備份策略
保存策略之後,到‘備份’頁面,點擊‘計劃’(軟盤圖標),即創建一個備份計劃。在該備份計劃中,需要綁定一個備份策略,就是我們剛才創建的策略。之後,就可以提交了。這裏需要提及不同備份策略的組合:將全量備份和增量/差異備份組合,組成一個合理且RTO小的備份計劃。我們建議用戶每周做一次全量備份,再根據不同應用,每天適時地做增量或差異備份。‘再次備份時延’定義了兩次備份的時間間隔。如果本次備份開始時,前一次備份還在進行,則本次備份會跳過執行(skipped)。
備份策略組合
創建計劃
提交之後,就可以‘立即運行’首次備份。
立即運行
首次備份,備份類型為‘Full’,意為全量備份。提交後,全量備份任務就會執行。
提交立即運行
回到‘監控’-‘任務’中,可以查看備份任務的執行細節與詳情。
備份詳情
在‘儀表盤’中,也可以看到該備份任務正在執行中。
儀表盤信息
當備份開始一段時間後,數據拷貝就會開始。這個時候,去Oracle主機的網絡中查看備份上傳到網關的速度。如下圖所示,上傳到容災網關的速度為800Mbps,即100MB/s。與Disk 1(D盤)讀性能(105MB/s)匹配。
Oracle主機上傳性能
等待一段時間後,從下面的備份任務詳情可以看出來,148.4GB的數據花費了36分29秒,平均性能在69.42MB/s。
備份任務詳情
回到儀表盤裏,存儲信息裏可以看到148.4GB的原始備份在本地存儲占用了130.36GB的空間。因為在上傳過程中,混合雲容災網關對備份數據做了重刪。如同混合雲網關那樣,重刪不僅節省網關存儲空間和提升備份效率,而且還提高了之後公網上傳備份到阿裏雲的效率。
備份空間占用
此時,你一定註意到了‘雲存儲’還沒有任何數據。實際上,當上傳到容災網關完成後,對應的‘上傳’任務已經被自動創建執行了。
上傳備份至雲災備庫
點擊該上傳任務,就會跳轉到上傳任務列表。用戶同樣可以查看上傳的進度與詳情。
上傳任務
從雲主機的監控可以查看當前從備份網關到阿裏雲上的雲災備庫的上傳性能。當前,上傳瞬時速度為100Mbps,即12.5MB/s。
上傳性能
當上傳完成之後,同樣可以在任務詳情中查看上傳的數據與總時長。本次上傳耗時3小時11分20秒,計算得出平均上傳速度為13.24MB/s。
上傳任務詳情
此時,儀表盤上就會顯示成功上傳1次和雲存儲所占空間的相關信息。
成功上傳和雲存儲空間
用戶可以登陸阿裏雲控制臺的混合雲容災頁面,在‘概覽’頁面下,已經有1臺受保護服務器和1臺受保護數據庫。這就是剛剛上傳到雲災備庫中的備份數據被阿裏雲上的災備網關自動識別出來的。
混合雲容災綜述頁面
切換到‘容災中心’-‘受保護服務器’頁面,看到受保護主機的詳細信息。
受保護服務器
打開阿裏雲上的容災網關,可以看到雲存儲已經顯示了與雲廠商T內的那臺網關相同的存儲大小。至此,從雲廠商T的Oracle服務器,到雲廠商T內的容災網關,再到阿裏雲的災備庫,最後到阿裏雲上的容災網關的這條鏈路已經打通。如果用戶想要將災備庫內被保護的服務器恢復到阿裏雲上的ECS主機,通過阿裏雲上的容災網關即可;如果用戶想要將被保護的服務器恢復回雲廠商T內的原Oracle服務器,走雲廠商T內部署的那個容災網關就可以了。這裏需要註意兩個地方:首先,本地存儲是2.69TB。記得之前我們創建了阿裏雲上的災備網關,會自動創建一臺MC主機和一臺Store主機。Store主機會自帶3塊1TB的雲盤,這裏的2.69TB空間就是來自於這3塊雲盤。其次,本地存儲空間並沒有被使用。這是因為阿裏雲上的容災網關並沒有從雲災備庫中實際拉去被保護的數據到本地。
阿裏雲上的容災網關存儲空間
接下來,我們選擇將雲災備庫的被保護數據恢復到阿裏雲上的ECS上。還是在阿裏雲上的容災網關頁面,進入‘恢復’頁面。可以看到雲災備庫內被保護的Windows服務器,也就是在雲廠商T內的那臺Oracle服務器。這裏有一個細節:列表中的備份的字體顏色也可以區分備份的不同狀態。例如,現在字體顏色是藍色,代表上雲。意味著備份僅僅在雲災備庫中。如果是綠色字體,則意味著數據在本地和雲災備庫中;而黑色表示備份數據只在本地。
恢復頁面
點擊上圖‘恢復’頁面裏‘操作’欄的恢復按鈕。在‘恢復配置’頁面填一些項目,比如實例類型,磁盤類型及VPC網絡信息。因為之前我們創建的Oracle服務器是4核8G內存,這裏我們選擇ecs.hfc5.xlarge剛好匹配。確認無誤後,提交。另外,需要提醒的是,如果雲廠商T那邊的私有網絡IP跟阿裏雲這端的VPC網絡不同的話,需要勾選‘輸入私有IP’,並定義好‘私有IP’。
恢復配置頁面
恢復任務被提交後,在‘監控’-‘任務’裏可以看到該恢復任務。同樣,可以查看恢復任務的詳情與細節。
恢復配置頁面
恢復任務被提交後,在‘監控’-‘任務’裏可以看到該恢復任務。同樣,可以查看恢復任務的詳情與細節。
恢復任務詳情
通過上面的任務詳情,可以看出恢復已經完成。這時候,混合雲容災網關會在所在域,也就是‘上海’區,自動創建一臺ECS,並且內容和源端被保護的Oracle主機一模一樣。
恢復完成的ECS主機
登陸到這臺ECS中,也就是Windows系統裏,查看Oracle的數據文件,與源端的文件一樣,包括元數據,比如文件修改時間等信息。如果不放心,還可以檢查下文件的MD5值。
恢復後的Oracle數據文件
這個時候進入Oracle裏查一下表的數目是否跟源端一樣,也是156張表。當然,用戶可以在災備ECS中繼續業務,當雲廠商T的災難恢復時,可以再將災備ECS主機恢復回雲廠商T的Oracle服務器中。也就是架構圖中描述的第6條路徑。因為操作類似,這裏就不再演示了。
恢復後的Oracle表數目
小結
從上面的備份場景——從雲廠商T的Oracle服務器備份整機到雲廠商T的容災網關,再到阿裏雲的災備庫中,和恢復場景——從雲災備庫到阿裏雲上的容災網關,再到自動創建的ECS主機並原樣復制雲廠商T的Oracle主機,可以驗證混合雲容災實現了跨雲/多雲場景中的應用和整機的備份和恢復。整個流程十分簡單。混合雲容災支持整機和主流的企業應用,如各版本的Oracle(Oracle RAC近期即將支持)和SQL Server等。同時,先進的壓縮重刪服務節約了備份時的網絡帶寬和空間占用,雲災備庫的按需分配和彈性無限擴展,災備ECS可關機不付費,從多個維度將用戶成本降到最低。讓傳統高昂的容災方案變成了0門檻開箱即用的簡單服務,實現了雲計算普惠中小企業的目標。
最後,歡迎用戶前往阿裏雲控制臺激活混合雲容災產品,讓阿裏雲的先進技術為您的業務保駕護航!
混合雲存儲的跨雲容災備份大圖及總結
結合之前的兩篇文章和本篇文章,我們可以將混合雲備份,雲存儲網關和混合雲容災這三個產品匯聚成一張跨雲災備(多雲容災/多雲災備)大圖,從而為第三方雲廠商的客戶構建了一份完整而高效的跨雲容災備份方案。RTO從高到低,用戶可以依次選擇混合雲備份,混合雲存儲網關和混合雲容災。其中,混合雲備份和混合雲網關支持文件的備份和恢復;混合雲容災不僅支持文件,還支持應用與整機的備份和恢復。
當然,我們需要在第三方雲內部署一些主機和應用。RTO越低的產品方案,成本相對也高一些。但是,從之前的步驟看,操作依舊非常簡單,而且成本比傳統方案也要便宜不少。為了最大化的提升備份性能和降低用戶成本,我們建議用戶為跨雲容災備份在第三方雲內部署的主機的網絡配置成最高的帶寬和按流量付費的模式。這樣源端的數據可以非常快速地到達備份目的端,且不會為跨雲備份容災支付過多的成本。
混合雲存儲跨雲容災備份大圖
原文鏈接
本文為雲棲社區原創內容,未經允許不得轉載。
混合雲存儲跨雲災備方案之跨雲復制