1. 程式人生 > >混合雲端儲存跨雲災備方案之跨雲複製

混合雲端儲存跨雲災備方案之跨雲複製

摘要: 混合雲容災實現了跨雲/多雲場景中的應用和整機的災備和恢復。支援整機和主流的企業應用,如各版本的Oracle(Oracle RAC近期即將支援)和SQL Server等。先進的壓縮重刪服務節約了備份時的網路頻寬和空間佔用,雲災備庫的按需分配和彈性無限擴充套件,災備ECS可關機不付費等多個特性,從多個維度將使用者成本降到最低。

前面兩篇文章介紹了基於阿里雲備份的跨雲備份和雲端儲存閘道器的跨雲複製,兩者主要是解決檔案粒度的備份與恢復問題。如果使用者需要保護一個雲上的資料庫應用,而不僅僅是資料庫的資料檔案;如果使用者需要保護整個雲主機,而不止一些檔案和目錄;且使用者對於保護同樣是有實時性要求的。那麼,混合雲容災就是為這些使用者需求量身打造的拳頭產品。

基於混合雲容災的跨雲容災架構

下圖描述了從雲廠商T的一臺Oracle伺服器,通過混合雲容災恢復閘道器,備份到阿里雲上的雲災備庫中,再恢復(fail-over)到阿里雲ECS的過程。混合雲容災恢復網關同時還支援將在雲災備庫的最新資料恢復回(fail-back)到雲廠商T的Oracle主機中。通過這張架構圖,使用者可以瞭解到,容災的部署在源端和目的端是對稱的。需要使用者注意的一點是,圖中雲災備庫是虛線畫的。不同於雲備份庫和OSS,雲災備庫對使用者是不可見的。

接下來,就讓我們看下,如何一步一步的操作實現Oracle伺服器的容災備份和恢復。

d895035b2f9b0de190dea281be94a0984d604a28

混合雲容災跨雲容災架構圖

基於混合雲容災的跨雲容災實施

首先,使用者登陸阿里雲控制檯進入‘混合雲容災’即可輕鬆開通。

749d0fb63cc2e93174f824ae293e4d83eba31394

混合雲容災主頁

之後,使用者可以進入‘容災中心’-‘容災中心’去建立一個‘雲端災備恢復閘道器’。除去給閘道器取名和選取一個規格外,對於‘專有網路’和‘交換機’如何配置,涉及到容災方案的設計與規劃。最簡單的做法就是將阿里雲上的專有網路配置的跟受保護的源端一樣就可以了。如果使用者有疑問,可以隨時諮詢混合雲端儲存團隊專業的容災架構師。點選‘確認’即完成容災閘道器的建立。

82b74b23e9522f614aeaef7cdf10c53f7685969f

部署容災閘道器

閘道器的部署一般耗時30分鐘左右。部署成功的容災恢復閘道器如下圖所示。‘狀態未知’意味著該閘道器還沒有完成配置。

787998e2cf1d0a3e1b0e981d2caef75b1411c904

部署完成

這裡需要提及的一點:雖然建立和配置混合雲備份閘道器是一步完成,但是實際上,在使用者的該區域ECS主機列表裡,會增加兩臺ECS主機:1臺控制器(即MC)和1臺網關(即Store)。

03203f68b63408d86670c8da26ac915a1d9cb4c3

混合雲容災ECS主機

點選閘道器名稱會跳轉到容災恢復閘道器的管理介面。輸入賬號的AK資訊(處於安全考慮,建議使用者使用子賬號配置災備閘道器),並提交。

35e4c3054dc3e78bbec5e4e1ddd1991065748559

災備恢復閘道器主頁

之後,使用者會看到備份加密配置,以決定備份的資料是否是加密的。混合雲容災通過AES256加密演算法保障使用者寫入到災備閘道器的落盤資料的絕對安全。使用者可以根據自身業務特點來決定是否開啟加密。保持預設關閉的狀態,提交。

ee04859f10c3cec9bf9efa326f80718ca5075c33

備份加密配置

提交完成後,使用者就進入了混合雲容災閘道器的管理主頁。在主頁上,使用者不僅能夠輕鬆地配置備份和恢復任務,而且還能直觀地瞭解和監控各個任務的實時狀態。此時,容災閘道器的狀態會變成‘正常執行’。

2aa7675a2ebf5b9e7b1772f8108a92b93978b0c2

容災恢復閘道器主頁

然後,回到雲廠商T的控制檯,可以根據混合雲容災提供的混合雲容災控制器和閘道器的映象檔案來建立兩臺虛擬機器:控制器主機是Windows 2012 R2 64位的系統,雙核CPU,4G記憶體,128GB的SSD雲盤做系統盤;閘道器主機是Ubuntu 14.04 64位的系統,4核CPU,8G記憶體,128GB的SSD雲盤做系統盤,500GB的SSD雲盤做資料盤。匯入映象和通過映象建立雲主機的過程請參見“基於雲端儲存閘道器的跨雲複製”這篇文章的相關步驟即可。生成的雲主機如下圖所示:

4be31af25be466928a227a267c4defff215f4579

雲廠商T內部署的容災閘道器

部署完成之後,使用者就可以在瀏覽器直接輸入控制器主機(Windows主機)的IP,即可看到前面配置線上的容災閘道器一樣的介面。因為步驟類似,需要使用者提供阿里雲賬號的AK,閘道器的賬號和密碼等資訊,此處省略。

配置完成,再次進入,就能夠看到雲廠商T內的容災閘道器(線下)的登陸介面。在阿里雲上建立的線上閘道器和線下閘道器,在登陸的時候步驟不同。阿里雲控制檯已經集成了自動登入功能,所以使用者無需通過輸入使用者名稱密碼的方式登入容災閘道器。輸入之前配置的使用者名稱密碼即可登陸。

ddc7165ba3a6c2d76fae07e14eb0b0ef0c4a75f8

容災閘道器登陸介面

登陸之後,使用者看到的容災閘道器的主頁和線上版本沒有任何區別。

ca90ea71d7e76341e882d257636009aca6ebdea4

雲廠商T內的容災閘道器主頁

接下來一步就是打通容災閘道器與使用者的Oracle伺服器,將資料庫主機通過容災閘道器備份到雲災備庫中。我們先來檢視一下Oracle資料庫中的表的資訊及內容。通過下面的一些查詢可以看到Oracle資料庫中有971張使用者表,以及資料檔案的大小。使用者需要注意一點是Oracle伺服器的主機名。我們發現一些雲廠商的主機名有以數字開頭的情況,這會導致在恢復到阿里雲ECS的時候導致建立ECS例項失敗的情況。阿里雲的雲主機名有約束條件:長度為[2, 128]個英文或中文字元。必須以大小字母或中文開頭,不能以http://和https://開頭。可以包含數字、半形冒號(:)、下劃線(_)或者連字元(-)。

4191dd66eb6dfbd42b67d79ee4b05c0d29aef238

Oracle資料表總數

ee59d2a8c6a4e5aec4e7e86bb7f1bfc6bbce7764

Oracle資料檔案大小

在備份Oracle主機之前,需要執行一次precheck指令碼,用以檢查Oracle主機的配置是否滿足備份的前提條件。使用者可以根據指令碼的檢查結果,來對環境做相應的修改和配置,以滿足混合雲容災備份的前提條件。

75af791d4365a3f17c805953927b6c7c22c08cc4

precheck指令碼執行

bfebc975f28b6e3133312f16dbc48617fa68333c

precheck執行結果

讓我們來備份這臺Oracle主機。回到雲廠商T的容災閘道器管理主頁。選擇‘備份’。

5e518b2ee6b993f6d6f06ab62353180f64b680ac

容災閘道器備份

在彈出的‘保護伺服器’頁面中,選擇主機型別,輸入伺服器IP及伺服器的使用者名稱與密碼。在這個例子中,我們選擇‘Windows伺服器’。需要注意一點的是,伺服器IP應該要填Oracle主機的內網IP地址。這樣備份和恢復的流量都是走高頻寬的內網。

accaf1b75933660bce983e7b1f701b9ba4fa7e54

配置保護伺服器

提交之後,可以去‘監控’-‘任務’裡檢視進度。因為任務從新增到完成,需要幾分鐘的時間,使用者也可以點選‘操作’欄的‘任務詳情’,也就是i圖示來檢視任務詳情。

9686d023f1acc9a084e162580649b476e006c696

新增保護伺服器任務

下圖就是新增成功的詳細資訊。各個步驟的狀態都是OK的。如果遇到任務失敗,這個頁面也會提示使用者出錯資訊。可以酌情處理,也可以諮詢混合雲容災的工程師以尋求幫助。

64cf4fd0e7c801ea14ccfe701accee8677398dc2

任務詳情

關閉任務詳情,可以去‘備份’頁檢視剛剛新增的被保護的Oracle伺服器。可以看到該主機的資訊已經都被容災閘道器獲取,諸如磁碟資料和Oracle資料庫資料等。針對這些資訊,可以做不同的備份。

f03ed8175df9c9aec5e2389d33e35981a65dd733

Oracle主機磁碟資訊

431e46f22c193f33664b1cdc301a61533b0ef8d4

Oracle主機資料庫資料

在開始備份之前,需要先去‘備份策略’中建立一個備份策略。這個備份策略最主要的作用是定義排程。另外,‘開啟上雲複製’需要勾選,否則備份資料,只會留在備份閘道器本地,而不會上傳到雲災備庫。‘本地拷貝’和‘雲上覆制’的天數定義了備份資料在本地和雲上保持的天數。儲存即可。

5f4bf7f60069520195a0dc65941e5cacb0be4477

建立備份策略

儲存策略之後,到‘備份’頁面,點選‘計劃’(軟盤圖示),即建立一個備份計劃。在該備份計劃中,需要繫結一個備份策略,就是我們剛才建立的策略。之後,就可以提交了。這裡需要提及不同備份策略的組合:將全量備份和增量/差異備份組合,組成一個合理且RTO小的備份計劃。我們建議使用者每週做一次全量備份,再根據不同應用,每天適時地做增量或差異備份。‘再次備份時延’定義了兩次備份的時間間隔。如果本次備份開始時,前一次備份還在進行,則本次備份會跳過執行(skipped)。

6ea17116c9607a8fe2251cd6ad1ffaf3e151e3ba

備份策略組合

917f621681f7a660221def4b5d49c276eee30385

建立計劃

提交之後,就可以‘立即執行’首次備份。

af54c95fa933c024e095b1b130f2ca7376255d8e

立即執行

首次備份,備份型別為‘Full’,意為全量備份。提交後,全量備份任務就會執行。

e5aba4a7286ef9bde5badf41f9f2496b75ccc334

提交立即執行

回到‘監控’-‘任務’中,可以檢視備份任務的執行細節與詳情。

e673d5838792163ec3466c9255aa661ddd113a38

備份詳情

在‘儀表盤’中,也可以看到該備份任務正在執行中。

41f9848897dbceec5ff3e6b7188bcd52f55ef0f8

儀表盤資訊

當備份開始一段時間後,資料拷貝就會開始。這個時候,去Oracle主機的網路中檢視備份上傳到閘道器的速度。如下圖所示,上傳到容災閘道器的速度為800Mbps,即100MB/s。與Disk 1(D盤)讀效能(105MB/s)匹配。

a2998eef06b135cfe9e7b45269a7bfe0de41ed8b

Oracle主機上傳效能

等待一段時間後,從下面的備份任務詳情可以看出來,148.4GB的資料花費了36分29秒,平均效能在69.42MB/s。

da4c3cd9d1e20d88f0ae50d01806598e2929bfab

備份任務詳情

回到儀表盤裡,儲存資訊裡可以看到148.4GB的原始備份在本地儲存佔用了130.36GB的空間。因為在上傳過程中,混合雲容災閘道器對備份資料做了重刪。如同混合雲網關那樣,重刪不僅節省閘道器儲存空間和提升備份效率,而且還提高了之後公網上傳備份到阿里雲的效率。

0db162d6864c8cb4c94b744254b78ebc8f3d45d2

備份空間佔用

此時,你一定注意到了‘雲端儲存’還沒有任何資料。實際上,當上傳到容災閘道器完成後,對應的‘上傳’任務已經被自動建立執行了。

fbb02f6474d45350d4ae93dc0a68c6ce87352a8b

上傳備份至雲災備庫

點選該上傳任務,就會跳轉到上傳任務列表。使用者同樣可以檢視上傳的進度與詳情。

202a16e5cbfffb50fd2694ce726c472a311c1407

上傳任務

從雲主機的監控可以檢視當前從備份閘道器到阿里雲上的雲災備庫的上傳效能。當前,上傳瞬時速度為100Mbps,即12.5MB/s。

0c47cc91c0855618311eb552e57f88036d122ea8

上傳效能

當上傳完成之後,同樣可以在任務詳情中檢視上傳的資料與總時長。本次上傳耗時3小時11分20秒,計算得出平均上傳速度為13.24MB/s。

f24a7a7cea19dbfc78d9a9dfd11ddc47d381eed9

上傳任務詳情

此時,儀表盤上就會顯示成功上傳1次和雲端儲存所佔空間的相關資訊。

3fd2f846ffa417544b87551e092eebcb3f616cfd

成功上傳和雲端儲存空間

使用者可以登陸阿里雲控制檯的混合雲容災頁面,在‘概覽’頁面下,已經有1臺受保護伺服器和1臺受保護資料庫。這就是剛剛上傳到雲災備庫中的備份資料被阿里雲上的災備閘道器自動識別出來的。

f3cba2639774ea61a3f21ad963b0fca41cceb99a

混合雲容災綜述頁面

切換到‘容災中心’-‘受保護伺服器’頁面,看到受保護主機的詳細資訊。

9f6ca23c77cf862ce016d47a7457a4dbf3442d42

受保護伺服器

開啟阿里雲上的容災閘道器,可以看到雲端儲存已經顯示了與雲廠商T內的那臺閘道器相同的儲存大小。至此,從雲廠商T的Oracle伺服器,到雲廠商T內的容災閘道器,再到阿里雲的災備庫,最後到阿里雲上的容災閘道器的這條鏈路已經打通。如果使用者想要將災備庫內被保護的伺服器恢復到阿里雲上的ECS主機,通過阿里雲上的容災閘道器即可;如果使用者想要將被保護的伺服器恢復回雲廠商T內的原Oracle伺服器,走雲廠商T內部署的那個容災閘道器就可以了。這裡需要注意兩個地方:首先,本地儲存是2.69TB。記得之前我們建立了阿里雲上的災備閘道器,會自動建立一臺MC主機和一臺Store主機。Store主機會自帶3塊1TB的雲盤,這裡的2.69TB空間就是來自於這3塊雲盤。其次,本地儲存空間並沒有被使用。這是因為阿里雲上的容災閘道器並沒有從雲災備庫中實際拉去被保護的資料到本地。

56656fdd3265312d60ddc7950b2325d0f78d74d9

阿里雲上的容災閘道器儲存空間

接下來,我們選擇將雲災備庫的被保護資料恢復到阿里雲上的ECS上。還是在阿里雲上的容災閘道器頁面,進入‘恢復’頁面。可以看到雲災備庫內被保護的Windows伺服器,也就是在雲廠商T內的那臺Oracle伺服器。這裡有一個細節:列表中的備份的字型顏色也可以區分備份的不同狀態。例如,現在字型顏色是藍色,代表上雲。意味著備份僅僅在雲災備庫中。如果是綠色字型,則意味著資料在本地和雲災備庫中;而黑色表示備份資料只在本地。

28b07c5b19210dd9300fb8af055d218a54303266

恢復頁面

點選上圖‘恢復’頁面裡‘操作’欄的恢復按鈕。在‘恢復配置’頁面填一些專案,比如例項型別,磁碟型別及VPC網路資訊。因為之前我們建立的Oracle伺服器是4核8G記憶體,這裡我們選擇ecs.hfc5.xlarge剛好匹配。確認無誤後,提交。另外,需要提醒的是,如果雲廠商T那邊的私有網路IP跟阿里雲這端的VPC網路不同的話,需要勾選‘輸入私有IP’,並定義好‘私有IP’。

2cf81176cdd78651292df5fbe5be23efd7ea3b3f

恢復配置頁面

恢復任務被提交後,在‘監控’-‘任務’裡可以看到該恢復任務。同樣,可以檢視恢復任務的詳情與細節。

dc822cba68ca31761c95bec09f10e99c3716e9a1

恢復配置頁面

恢復任務被提交後,在‘監控’-‘任務’裡可以看到該恢復任務。同樣,可以檢視恢復任務的詳情與細節。

bf0e1137d8a5d325965443a54f445d4ed76ad916

恢復任務詳情

通過上面的任務詳情,可以看出恢復已經完成。這時候,混合雲容災閘道器會在所在域,也就是‘上海’區,自動建立一臺ECS,並且內容和源端被保護的Oracle主機一模一樣。

5eb507e81cbbed6b68da4405efe701dc7cbbc3d6

恢復完成的ECS主機

登陸到這臺ECS中,也就是Windows系統裡,檢視Oracle的資料檔案,與源端的檔案一樣,包括元資料,比如檔案修改時間等資訊。如果不放心,還可以檢查下檔案的MD5值。 

295de9ecd5562952defccc5d87b131edc72053b6

恢復後的Oracle資料檔案

這個時候進入Oracle裡查一下表的數目是否跟源端一樣,也是156張表。當然,使用者可以在災備ECS中繼續業務,當雲廠商T的災難恢復時,可以再將災備ECS主機恢復回雲廠商T的Oracle伺服器中。也就是架構圖中描述的第6條路徑。因為操作類似,這裡就不再演示了。

6342a8cf4ef9192a6ca67c0508d112ff9ab8ac6e

恢復後的Oracle表數目

小結

從上面的備份場景——從雲廠商T的Oracle伺服器備份整機到雲廠商T的容災閘道器,再到阿里雲的災備庫中,和恢復場景——從雲災備庫到阿里雲上的容災閘道器,再到自動建立的ECS主機並原樣複製雲廠商T的Oracle主機,可以驗證混合雲容災實現了跨雲/多雲場景中的應用和整機的備份和恢復。整個流程十分簡單。混合雲容災支援整機和主流的企業應用,如各版本的Oracle(Oracle RAC近期即將支援)和SQL Server等。同時,先進的壓縮重刪服務節約了備份時的網路頻寬和空間佔用,雲災備庫的按需分配和彈性無限擴充套件,災備ECS可關機不付費,從多個維度將使用者成本降到最低。讓傳統高昂的容災方案變成了0門檻開箱即用的簡單服務,實現了雲端計算普惠中小企業的目標。

最後,歡迎使用者前往阿里雲控制檯啟用混合雲容災產品,讓阿里雲的先進技術為您的業務保駕護航!

混合雲端儲存的跨雲容災備份大圖及總結

結合之前的兩篇文章和本篇文章,我們可以將混合雲備份,雲端儲存閘道器和混合雲容災這三個產品彙聚成一張跨雲災備(多雲容災/多雲災備)大圖,從而為第三方雲廠商的客戶構建了一份完整而高效的跨雲容災備份方案。RTO從高到低,使用者可以依次選擇混合雲備份,混合雲端儲存閘道器和混合雲容災。其中,混合雲備份和混合雲網關支援檔案的備份和恢復;混合雲容災不僅支援檔案,還支援應用與整機的備份和恢復。

當然,我們需要在第三方雲內部署一些主機和應用。RTO越低的產品方案,成本相對也高一些。但是,從之前的步驟看,操作依舊非常簡單,而且成本比傳統方案也要便宜不少。為了最大化的提升備份效能和降低使用者成本,我們建議使用者為跨雲容災備份在第三方雲內部署的主機的網路配置成最高的頻寬和按流量付費的模式。這樣源端的資料可以非常快速地到達備份目的端,且不會為跨雲備份容災支付過多的成本。

d76b6a8e84d0e8ded6106a144c6499370fb087d4

混合雲端儲存跨雲容災備份大圖

原文連結