1. 程式人生 > >DT時代下 資料庫災備的探索與實踐

DT時代下 資料庫災備的探索與實踐

摘要: 隨著DT時代的到來,企業對資料的依賴程度與日俱增,資料保護早已成為企業的一門必修課。只有擁有先知先覺的防範意識和充分的技術準備,才能“覆巢之下,亦有完卵”

170餘場主題峰會和分論壇完美呈現,上千位分享嘉賓、數萬名創新創業導師齊聚一堂,剛剛結束的2018杭州雲棲大會讓雲棲小鎮又一次成為探索數字世界的中心。

隨著DT時代的到來,企業對資料的依賴程度與日俱增,資料保護早已成為企業的一門必修課。只有擁有先知先覺的防範意識和充分的技術準備,才能“覆巢之下,亦有完卵”。在“企業級資料庫最佳實踐”專場,災備相關議題備受關注。本文結合阿里巴巴資料庫團隊在會上的分享,將詳細介紹如何使用資料庫雲產品組合,搭建符合自身企業發展階段的災備方案。

_E1_1_6

資料是企業重要的生產資料,一旦發生資料丟失,企業就會陷入困境:客戶資料、技術檔案、財務賬目等客戶、交易、生產資料可能被破壞得面目全非。概括起來,資料丟失分三個層次:

  • 邏輯錯誤:包括軟體bug、病毒攻擊、資料塊被破壞等。
  • 物理損壞:包括伺服器、磁碟損壞等。
  • 自然災害:火災、地震等自然災害對資料中心的摧毀等。

為了應對資料丟失造成的損失,必須對資料進行災備保護,並且企業資訊化程度越高,相關的資料災備恢復措施就越重要。

企業級資料庫災備體系

1.1 災備定義 災備是指容災+備份:

  • 備份的定義:指使用者為應用系統產生的重要資料(或者原有的重要資料資訊)製作一份或者多份拷貝,以增強資料的安全。
  • 容災的定義:指在相隔較遠的兩地(同城或者異地)建立兩套或多套功能相同的IT系統,互相之間可以進行健康狀態監視和功能切換。當一處系統因意外(天災、人禍)停止工作時,整個應用系統可以切換到另一處,使得該系統功能可以繼續正常工作。

1.2 災備痛點  (1)備份痛點

  • 備份失效
  • 恢復速度慢
  • 恢復有損
  • 異地備份成本高
  • 價效比低

(2)容災痛點

  • 容災方案單一,無法滿足不同資料級別場景建設
  • 缺少容災大盤能力,無法對容災鏈路監控、故障快速識別
  • 災備不具備巡檢能力
  • 故障恢復成本高,資料校驗、比對、訂正難以決策
  • 多層容災工具切換難以協同
  • 預案管控缺失,無法自動化運維

1.3 落地方案 企業級資料庫災備體系要以業務需求為導向,基於多種因素考量選擇:RPO,RTO,成本,擴充套件性。還需要覆蓋資料庫災備的各種需求:災備環境搭建、災備資料同步、災備監控告警、災備演練、災備切換、資料校驗及修復等。

image

企業級資料庫災備核心產品

阿里雲產品經多輪迭代具備比較完善的災備能力,使用以下核心產品可幫助企業應對不同場景及需求的資料庫災備方案設計。

  • DBS:Database Backup Service,是為資料庫提供連續資料保護、低成本的備份服務。它可以為多種環境的資料提供強有力的保護,包括企業資料中心、其他雲廠商。DBS提供資料備份和操作恢復的整體方案,具備實時增量備份、精確到秒級的資料恢復能力。在資料庫災備解決方案中可使用阿里雲DBS實現各資料庫間的資料備份。
  • DTS:Data Transmission Service,是阿里雲提供的一種支援多種資料來源之間資料互動的資料流服務。它提供了資料遷移、實時資料訂閱及資料實時同步等多種資料傳輸能力。在資料庫災備解決方案中,使用阿里雲DTS可實現各資料庫間的資料遷移與實時同步,從而為資料庫災備打好最重要的基礎。
  • HDM:Hybrid Cloud Database Management,是混合雲資料庫管理平臺,幫助企業打通混合雲資料庫架構,提供多環境統一管理、快速彈性、災備切換的能力。對於混合雲災備場景下,使用阿里雲HDM可便捷、快速的將本地IDC的資料同步至雲上,並進行災備切換演練,故障發生時可通過HDM進行災備切換,保障資料庫的可用性。 在災備場景下,建議可搭配阿里雲其他產品,例如DRDS、OSS,這些產品經阿里內外部驗證,均具有較高可靠性並可在災備場景下靈活應用。

典型應用場景

3.1 實時備份 當用戶對資料備份要求較高時,比如需要連續實時備份,且備份過程中不影響業務執行,此時可購置阿里雲資料庫備份DBS服務,實現資料庫的熱備份,DBS可實現資料實時增量備份、精確到秒級的資料恢復能力。解決方案架構示例如下:

image

架構設計說明:

• 關鍵部件部署:

  • 在使用者本地部署有兩套資料庫:生產資料庫和恢復庫,分別用於生產資料的儲存、故障後資料恢復。
  • 在阿里雲的兩個區域(例如:華南1、華北1)分別購置儲存服務,例如OSS物件儲存或者NAS檔案儲存。
  • 購置阿里雲的DBS服務,用於使用者本地資料庫實時熱備份至雲上儲存。

• 雲下生產資料備份至雲上: (可通過以下兩種方案中的任意一種將雲下生產資料備份至雲上)

  • 使用者可在本地再部署一套儲存,將生產資料先備份至本地IDC的儲存,再通過本地IDC儲存災備拷貝至雲上儲存。
  • 使用者本地的生產資料庫與雲上儲存之間通過阿里雲DBS,將生產資料庫中的資料直接熱備份至雲上兩個區域的儲存中。

• 資料恢復:

  • 如果使用者本地IDC的生產資料庫發生故障,但本地IDC的儲存執行正常,可通過本地IDC的 儲存將資料恢復至本地IDC的恢復庫。
  • 如果使用者本地IDC的生產資料庫和儲存均發生故障,或沒有部署本地儲存,則可通過DBS將雲上儲存將資料恢復至本地恢復庫。

• 架構特點:

  • 優點:技術要求高、一致性好,恢復時間短。
  • 缺點:RTO隨著資料庫是來大小而變化。
  • 應用場景:比較成熟的備份手段,適用於大部分的關係型資料庫。

3.2 異地多活 無論彈性容災上雲、容災雙活/多活,還是兩地三中心,使用者都可以在企業級資料庫災備體系中找到解決方案,接下來以異地多活場景為例介紹解決方案。在使用者業務多點寫入場景下,如何具備資料級異地雙活,如何支援一鍵切換至另一個機房,實現靈活的彈上彈下和未來的線性擴充套件。

image

部署架構

  • 應用配合進行單元化改造
  • 通過 DTS 實現兩地/多地的資料庫的雙向同步,解決同城單點問題
  • 通過 HDM 實現雙活/多活架構的監控和管理,並提供計劃內/計劃外切換的能力
  • 雙資料中心支援讀寫分離,本地使用者就近讀取

新產品:資料庫備份DBS

資料庫備份DBS作為資料庫上雲備份通道,與物件儲存OSS構建雲資料庫備份解決方案,僅需5分鐘即可實現秒級RPO(Recovery Point Objective恢復點目標,通俗理解是當資料庫故障時,允許丟失多長時間資料,RPO越小越好)的實時備份。

image

資料庫備份DBS提供備份服務,在整個備份過程是無鎖的,不會阻塞資料庫上業務請求;使用者可以選擇整個例項備份,也可以選擇只備份一張表;一旦發生誤操作情況時,使用者都可以通過DBS進行任意時間點恢復,將整個例項或一張表的資料恢復到誤操作前1秒;DBS提供多種規格,可以滿足幾百MB到幾百GB的資料庫備份。

目前,資料庫備份DBS提供的備份系統時刻被海量使用者驗證,產品不僅擁有實時備份、秒級RPO的能力,同時還具備表級恢復能力,幫助使用者只恢復有價值的資料,RTO可降到分鐘級。

值得一提的是,實時備份經歷了歷年雙11的考驗,接下來,資料庫恢復DBS將會提供線上查詢能力,使用者無需等待資料恢復過程,備份任務完成後在查詢視窗上可以通過SQL立刻查詢備份資料,使用者還可以將查詢結果匯出Excel、Word等通用格式,用於資料分析,也可以生成Insert、Replace語句,用於資料訂正。

原文連結