1. 程式人生 > >中小企業災備建設《入門普及篇》

中小企業災備建設《入門普及篇》

前言

這是中小企業災備建設的入門級、普及型的文章。其實就是了解下為什麼做災備,有什麼可以參考的東西,該從哪裡入手。

建設目的

我們不希望災難發生,也不希望任何故障出現。然而災難的出現往往是突然的,預先不可知的。我們分析在系統執行期間可能出現的災難大致分為以下幾類,生產系統災備專案的建設目標,也就是為了應對以下幾類災難。

自然災害:火災、水災、雷擊、地震等,例如我公司業務所在天津世紀互聯資料中心已經經歷了一次重大爆炸事故,所幸機房受影響並不嚴重。

計算機系統故障:

伺服器系統故障

硬體故障:如磁碟、網絡卡、電源、交換機。

系統故障:作業系統無法啟動

機房故障:

機房電源、網路、製冷、火災等故障,例如我公司機房已經出現多次由於製冷裝置故障,需要應急處理的情況。

運營商故障:

注意是機房所在大廈的電力、網路割接等造成的故障,我們也經過了兩次大廈電力調整和多次網路割接,所幸並沒有影響出現。

人為因素:

由於應用系統設計缺陷、人為誤操作和惡意的黑客攻擊,導致系統不可用或者資料丟失。

災備級別

要做災備首先要確定好目標,也就是要確定要災備級別,結合公司的具體情況,能夠承受多少資料丟失和多長時間的業務恢復時間來進行衡量。

目前可以參考的災備級別有兩個,一個是國際標準SHARE78它將異地災備的定義為七個級別。另外一個是我國的標準。早在2007年7月,國務院資訊化工作辦公室有下發了《資訊系統災難恢復規範》(以下簡稱《規範》),並於2007年11月1日開始正式實施。這是中國災難備份與恢復行業的第一個國家標準,是各行業進行災備建設的重要參考性檔案。將異地災備的定義分為以下六個等級。

中小企業災備建設

等級一:基本支援。要求資料備份系統能夠保證每週至少進行一次資料備份,備份介質能夠提供場外存放。對於備用資料處理系統和備用網路系統,沒有具體要求。

等級二:備用場地支援。在滿足等級一的條件基礎上,要求配備災難恢復所需的部分資料處理裝置,或災難發生後能在預定時間內調配所需的資料處理裝置到備用場地;要求配備部分通訊線路和相應的網路裝置,或災難發生後能在預定時間內調配所需的通訊線路和網路裝置到備用場地。

等級三:電子傳輸和裝置支援。要求每天至少進行一次完全資料備份,備份介質場外存放,同時每天多次利用通訊網路將關鍵資料定時批量傳送至備用場地。配備災難恢復所需的部分資料處理裝置、通訊線路和相應的網路裝置。

等級四:電子傳輸及完整裝置支援在等級三的基礎上,要求配置災難恢復所需的所有資料處理裝置、通行線路和相應的網路裝置,並且出於就緒或執行狀態。

等級五:實時資料傳輸及完整裝置支援。除要求每天至少進行一次完全資料備份,備份介質場外存放外,還要求採用遠端資料複製技術,利用通訊網路將關鍵資料實時複製到備用場地。

等級六:資料零丟失和遠端叢集支援。要求實現遠端實時備份,資料零丟失;備用資料處理系統具備與生產資料處理系統一致的處理能力,應用軟體是“叢集的”,可實時無縫切換。

由此可見,災難恢復能力等級越高,對於資訊系統的保護效果越好,但同時成本也會急劇上升。因此,需要根據成本風險平衡原則(即災難恢復資源的成本與風險可能造成的損失之間取得平衡),確定業務系統的合理的災難恢復能力等級。對於多個業務系統,不同業務可採用不同的災難恢復策略。

那麼根據具體情況,我公司之前選擇的是先著手實現等級五,然後再向等級六過渡。同時有一些服務是使用等級四的標準。

災難恢復能力

根據不同的災難恢復能力,有不同的恢復時間和恢復時間點,我們通常使用RTO和RPO來表述。

RTO恢復時間目標recovery time objective,災難發生後,資訊系統或業務功能從停頓到必須恢復的時間要求。

RPO恢復點目標recoverypoint objective,災難發生後,系統和資料必須恢復到的時間點要求。

中小企業災備建設

災備專案建設要素

在明確了災備建設中災難恢復能力等級目標之後,另一個重要問題是在具體建設中應該考慮哪些資源要素。下表是對《規範》中災備建設內容的總結,我們稱之為災備建設的七要素:

中小企業災備建設

只是一個入門的小知識,不過災備也是所有運維者都需要關注的一個技術點。

小技巧:如何檢視已釋出的小乾貨?

  1. 進入“運維社群”公眾號;
  2. 點選右上角“小人”圖示;
  3. 點選“檢視歷史訊息”。

分享嘉賓

趙舜東

江湖人稱趙班長,曾在武警某部負責指揮自動化的架構和運維工作,2008年退役後一直從事網際網路運維工作。曾帶團隊負責國內某電商的運維工作,SaltStack中國使用者組發起人、《saltstack入門與實踐》作者,《運維知識體系》作者。

趁現在,關注我們

牛人並不可怕,可怕的是牛人比我們還努力!關注“運維社群(微信ID:cloud-oaas)”公眾號,每天利用空閒時間閱讀一篇技術原創乾貨,滿滿的小幸福。

運維社群

長按圖片,選擇“識別圖中二維碼”,關注我們。

原創宣告:本文章由趙班長原創,請必須全文轉載,包括本行。