1. 程式人生 > >業務連續性對中小企業一樣必要

業務連續性對中小企業一樣必要

clone 讀取 容易 災難恢復 行業 open enter 系統 實施

對於大多數企業來說,業務連續性似乎成為了一個奢侈的目標。那麽如果我們無法建立容災中心,傳統的備份就不能實現業務連續性目標了嗎?

  業務連續性是我們今天所廣泛探討的話題,一般而言,業務連續性的實現對大型企業來說相對較為容易。因為這些企業有自己的IT員工和豐厚的資金保證,可以花費數以百萬計的美金來建立備用的數據中心,把所有信息在遠程的災備中心進行異地保存,同時還應用了許多其他災難恢復技術。

  以911事件為例,有多家金融服務機構就位於世貿大廈中或者周邊地區,著名的雙子大廈倒塌後,這些金融服務機構卻沒有丟失任何一筆交易數據,並在災難之後數小時內就完全恢復運營。這是為什麽呢?因為這些機構在遠程的數據中心有運行著OpenVMS操作系統的昂貴服務器,隨時可以進行業務切換。只要系統癱瘓了,強大的網絡就可以轉換到備份的站點上。

  然而並不是所有的企業都有如此龐大的財力和人力來構建標準的容災中心,同樣是處於911事件中的另外一家律師事務所,采用常規的磁帶備份方式來備份業務數據和客戶資料。911事件發生後,他們的資料隨著大廈一同化為灰燼,以至於該事務所的業務在相當長一段時間內不能恢復正常。

  由於容災中心的運轉過程太過復雜,維護它有效運營的成本也太過沈重,對於大多數企業來說,業務連續性似乎成為了一個奢侈的目標。那麽如果我們無法建立容災中心,傳統的備份就不能實現業務連續性目標了嗎?

  徒勞無功的備份與恢復

  如果數據無法恢復,那麽備份就是浪費時間和金錢。然而根據業務分析公司 Enterprise Strategy Group調研數據分析,全球大約有40%的數據恢復失敗了,失敗的原因並不在於備份軟件或者磁帶上,而是由於備份任務本身的復雜性決定的。

  如果我們研究備份的過程和原理,我們會發現,整個備份操作將貫穿應用程序、服務器、存儲設備和網絡層,且備份本身是一個很容易受到影響的過程,除非在整個備份的過程中,一切都正常運轉,否則很有可能這次備份將成為一次失敗的操作。一旦備份失敗,我們也很難找到失敗的根源,因為有些備份解決方案供應商估計他們花了90%以上的時間在與軟件無關的問題之上。

  備份的目的就在於:要完全精確地保證正確的數據在正確的時點得到恢復。為了達到備份的目的,備份的時候:

  1. 所有訪問業務數據庫的應用程序和服務都必須停止。

  2. 要找到最後一次完全備份的數據,裝載恢復。

  3. 然後所有的相關的增量備份拷貝也要找到,按照正確的順序裝載恢復。

  4. 最後,必須正確使用數據庫日誌(假設日誌可用)。

  要實現上述的這些步驟,Windows文件系統和文件必須在一個合適的時間得到保存,這一般是部署一個開放式文件管理器的必要條件。備份軟件要做的就是讀取很多的文件系統元數據,來判斷哪些文件有所變化,然後就把整個文件系統以及/或者數據庫進行拷貝,或者僅僅對有變化的一部分文件進行拷貝。

  這個過程取決於系統的大小,可能會花上數個小時,且整個備份過程占用了大量的運算資源和帶寬,對應用程序的運營影響極大,為盡量避免對業務程序的影響,大部分公司選擇做備份不超過一天一次,一般會選擇在業務運營量最小的午夜至第二天淩晨的時段內進行。

  RPO和RTO是我們在衡量備份和業務連續性的時候,經常會用到的兩個概念。恢復點目標(RPO)是在發生災禍的情況下公司可接受的數據丟失量的衡量標準。受到目前備份和恢復技術上的限制,很多企業設定的RPO是24小時——在預定的增量備份過程發生之間。換言之,即使企業通過備份系統完全恢復數據,也損失了24小時的業務數據量。

  恢復時間目標(RTO)是指災難發生後,業務恢復運營所用的時間,一般的企業從數小時到數天都是比較實際的RTO。然而這也是由於目前備份技術和操作上的限制造成的,而不是業務需求。

  真正的業務連續運營要求完全為零的RPO和RTO,雖然我們不可能完全達到,但至少可以無限接近。

  改善傳統備份的性能

  面對這種痛苦的,混亂的備份過程和緩慢的不可靠的恢復,有些客戶在尋找替代的技術,比如快照(snapshot)或者克隆(clone)。這些技術,雖然一定程度上減少了混亂,也提高了恢復效率,但只能解決部分問題,而且增加了操作成本和復雜度。

  克隆(clone)可以在某一時間點提供一份額外的數據視圖,依賴於執行的同步性,這將是一個最近的或最接近的視圖。舉例來說,一個應用程序錯誤導致了主數據集的損失,也會導致從數據集的損失,結果就是損失了兩次。

  快照(snapshot)可以幫助保護用戶丟失的數據,但不能從硬件或站點錯誤中恢復數據。快照可以返回一個數天前特定時間的文件系統。然而,快照不提供政策管理和備份軟件解決方案的可用性,因此它們在管理大規模的數據和較早的數據上效率極低。很多快照技術和私有硬件系統密不可分,因此限制了它們的應用。

  備份保護間隔一般是24小時;快照保護間隔一般是1至3小時;克隆無法保護由病毒或黑客造成的損失,且克隆的數據也是有問題的,只有最後一個版本可用,不能恢復過去的數據。

  最重要的是,決定實施快照以及/或者克隆的公司仍然需要他們的備份系統來保護他們的數據。這就留給這些公司,特別那些中層的公司,兩個同樣不痛不癢的選擇:忍受備份的痛苦和不可靠性,或者接受成本、復雜度和技能需求的增加,來支持備份和新技術的日常操作。

  連續性數據保護(CDP)是近來興起的可實施的,占用系統資源較小的,且價錢合理能夠負擔的一種解決方案,可在盡可能最短的時間內來恢復最大量的數據丟失和損壞。

業務連續性對中小企業一樣必要