1. 程式人生 > 其它 >第十章-資料庫恢復技術

第十章-資料庫恢復技術

10.1 事務的基本概念:

  • 什麼是事務?事務是使用者定義的一個數據庫操作序列,該操作要麼全做,要麼全不做,是一個不可分割的工作單位,是恢復(知識點)和併發控制(知識點)的基本單位
  • 事務和程式的區別
    • 在關係資料庫中,一個事務可以是一條SQL語句,或多條SQL語句,或整個程式
    • 一個程式可以有多個事務
  • 事務定義:- 正常結束和異常結束
    • 正常結束: -- 正常執行後,SQL的操作就寫回到磁碟中
      • BEGIN TRANSCTION; -- 事務開始
            SQL 語句; 
        COMMIT; -- 事務提交
    • 異常結束:--異常結束,SQL的所以操作都撤銷,回到事務開始前

      • BEGIN
        TRANSCTION; -- 事務開始 SQL 語句; ROLLBACK; -- 事務回滾
  • 事務的特性: -- 考試考

    • 特徵:原子性、一致性、隔離性、持續性
    • 原子性:
      • 事務是資料庫的邏輯工作單位,事務中包括的諸操作要麼不做,要麼全做
    • 一致性:
      • 先理解什麼是一致性?就是使用者A讀學生表資料為99,使用者B讀取就不能是100,必須是99一致的
      • 事務的執行結果必須是使資料庫從一個一致性狀態到另一個一致性狀態
      • 一致狀態:資料庫中只包含成功事務提交結果
      • 不一致狀態:資料庫系統執行在發生故障,有些事務被迫中斷過(如斷了),這些未完成的事務對資料庫做了一部分修改,寫入了物理資料庫,這時候資料庫就處於不正確的狀態 -- 解決辦法事務回滾,資料恢復
                   
    • 原子性和一致性的舉例:
      • 銀行轉賬,那些就必須定義為一個事務,兩個操作全做,如使用者A給使用者B轉1萬,使用者A減少一萬,突然斷電,那麼使用者減少1萬,使用者B要沒有加上1萬,這就是不一致狀態,如果成功就是一致狀態      
    • 隔離性:
      • 一個事務執行不能被其它事務干擾(如交叉執行事務),即一個事務的內部操作及使用的資料對其他併發事務是隔離的,併發執行的各個事務之間都不能相互干擾
    • 永續性:-- 也叫永久性
      • 一個事務一旦提交,對資料庫中資料的改本就是永久性的,接下來的操作或故障對其執行結果沒有影響
    • 事務是恢復和併發控制的基本單位,保證事務ACID特徵是事務管理的重要任務
    • 事務ACID日誌可能遭到破壞的因素有:
      • 多個事務併發執行,不同事務的操作交叉執行
        • 資料庫管理系統必須保證多個事務的交叉執行不影響這些事務的隔離性  
      • 事務在執行過程中被強行停止  
        • 資料庫管理系統必須保證被強行終止的事務對資料庫和其他事務沒有任何影響 

10.2 資料庫的恢復概述:

  • 故障是不可避免的,故障主要包括:計算機硬碟故障、軟體的錯誤、操作員的失誤、惡意的破壞等
  • 故障對資料的影響主要表現為:執行事務非正常中斷,影響資料庫中的資料正確性、資料庫全部或部分丟失資料等
  • 資料庫恢復作用:把資料庫從錯誤狀態恢復到某一已知的正確狀態的功能
  • 資料庫恢復子系統是資料庫管理系統的一個重要組成部分,而且還相當龐大,常常佔整個資料庫系統程式碼的10%以上。恢復技術是衡量系統的效能優劣的重要指標,以為對系統的可靠程度起到決定因素                            

10.3 故障的種類:

  • 故障的種類大致分為四類: 事務內部的故障、系統故障、介質故障(介質==硬體)、計算機病毒
  • 1.事務內部的故障:
    • 事務內部的故障有的是可以通過事務程式本身發現的(如轉賬的例子)有的是非預期的,不能由事務程式處理的 
    • 細節1:事務的內部更多的故障的是非預期的,是不能由應用程式處理的。如演算法溢位、死鎖
    • 細節2:事務的故障意味著事務沒有達到預期的終點,資料庫可能處於不正確狀態。撤銷該事務已經作出任何對資料庫的修改,使得該事務好像根本沒有啟動一樣,這類恢復操作稱為:事務撤銷 
  • 2.系統故障:
    • 系統故障又稱軟故障,是指系統正常執行突然被破壞,記憶體在的緩衝區資訊全部丟失去,所有正在執行的事務都非正確終止
      • 常見原因:CPU故障,作業系統故障、資料庫系統程式碼錯誤、系統斷電
    • 系統故障的恢復:
      • 常見問題1:系統發生故障,一些未完成的事務結果已經寫入到物理資料庫(磁碟),造成資料庫處於不正確狀態
        • 恢復辦法:系統重新啟動,恢復程式重新讓所有的非正常終止的事務回滾,強行撤銷所有未完成事務
      • 常見問題2:系統發生故障,某些已經完成的事務可能還留在緩衝區,沒有寫到物理資料庫中,因為沒有寫入,導致執行事務的操作(如:增刪改查),全部丟失,導致資料庫資料不一致
        • 恢復辦法:系統重新啟動,撤銷所有未完成的事務,還需要重做,所有提交的事務,將資料庫恢復到一致狀態 
  • 3.介質故障:
    • 介質故障又硬故障,是指外存故障,如磁碟損壞、磁頭碰撞,強磁干擾等
    • 故障表現:破壞資料庫或部分資料庫 
  • 4.計算機病毒:
    • 計算機病毒是一種可繁殖、傳播並對計算機造成破壞
    • 計算機病毒特點:隱蔽性、潛伏性、傳染性、破壞性、寄生性
    • 資料庫本病毒破壞時,仍要用恢復技術來恢復
  • 小結:
    • 1.故障對資料庫的影響主要是資料庫本身被破壞和,資料沒有被破壞,但資料不正確
    • 2.恢復操作的基本原理就是冗餘(就是備份),符合子系統的程式碼一般要佔到全部程式碼的10%以上 

10.4 恢復的實現實現技術:

  • 恢復資料的關鍵就是建立冗餘(備份)資料,然後利用執行冗餘資料進行資料庫恢復

  • 建立冗餘資料的常見方法:
      資料轉儲:就是把資料建立一個備份,然後儲存在另外一臺裝置上
      日誌檔案:就是事務對資料庫進行了什麼操作都記錄下來

  • 通過資料轉存和日誌檔案就可以把資料庫符合到某一個正確的結點
          如:7月15號到9月20號,9月20號發生錯誤,7月15號進行了資料轉儲,在通過日誌檔案把資料庫恢復到9月20號沒有發生故障的狀態                            

10.4.1 資料轉儲:

  • 什麼是資料轉儲?就是把資料建立一個備份,然後儲存在另外一臺裝置上,這些備份的資料文字稱為後備副本或後援副本
  • 注意:後備副本只是把資料庫恢復到轉儲的狀態,要想符合到故障發生的狀態,還需要進行轉儲後的所有更新事務
  • 轉儲狀態:靜態轉儲與動態轉儲
    • 靜態轉儲:需要中系統無任何事務進行時進行轉儲操作,轉儲期間不允許對資料庫進行增刪改查
      例子:如遊戲伺服器正在維護,玩家都不能進入,就沒有新的事務發生,那麼就可以進行靜態轉儲
      優點:實現方便
      缺點:降低了資料庫的可用性,以為需要等轉儲結束,新的事務才能開始
    • 動態轉儲:事務和轉儲併發進行,轉儲期間允許對資料庫進行增刪改查
      例子:轉儲期間,剛把事務A的100記錄到磁碟上,某一事務就將A改成了200,後備副本上的A資料就過時了
      優點:不用等正在執行的使用者事務結束,不會影響新事務的執行
      缺點:不能保證副本中的資料真時有效(看上面例子就知道為什麼了)
  • 細節1:利用動態轉儲得到副本,還需要把各事務(就是併發的事務)對資料庫的修改記錄下來,建立成日誌檔案。通跟後備副本和日誌檔案就能把資料庫恢復到某人正確的結點
  • 細節2:利用靜態轉儲得到副本,就不需要把事務記錄下來,以為靜態記錄的就是正確的,而且它轉儲也不可能有事務進行
  • 轉儲方式:

    • 海量轉儲:每次轉儲全部資料庫
      增量轉儲:轉儲上一次轉儲後更新過的資料
      海量和增量比較:
        從恢復角度看,使用海量轉儲得到的後備副本進行恢復更加方便,因為轉儲的是全部資料庫,
        如果資料庫較大,事務處理頻繁,增量就更實用更有效,因為事務多資料老是在變化,就不可能每次都海量轉儲

  • 轉儲分類:

    • 通過轉儲狀態和轉儲方式可以分為4類:動態海量轉儲、靜態海量轉儲、動態增量轉儲、靜態增量轉儲  

10.4.2 登記日誌檔案:

  • 日誌的主要目的:記錄事務等資料庫的更新操作的檔案(注意是更新操作,因為查詢沒有影響)
  • 記錄日誌的兩種格式,單位的日誌檔案和資料塊單位的日誌檔案:(這些操作都是由於資料庫自動來完成)
  • 單位的日誌檔案需要登記的內容:
    • 1.各事務開始的標籤
      2.個事務結束的標準(正確結束,的還是非正常結束的標籤)
      3.各事務的所有更新操作
      以上3條記錄的操作記錄為一個日誌記錄

  • 每條日誌記錄的內容:

    • 事務標識(標明是哪各事務)
      操作型別(插入、刪除或修改)
      操作物件(如操作是哪個表,哪條資料)
      更新前資料的舊值(如果是插入,該項就是空值)
      更新後資料的新值(如果是刪除,該項就是空值)

  • 資料塊為單位的日誌檔案需要登記的內容:

    • 1.事務標識
      2.被更新的資料塊 - 就是以一整個事務為一個單位

  • 日誌檔案的作用:

    • 1.事務故障恢復
      2.系統故障恢復
      3.配合後備副本進行介質故障恢復

  • 登入日誌檔案要遵循兩條原則:
    • 1.登入的次序嚴格按併發事務執行的時間次序
      2.必須先寫日誌檔案,後寫資料庫(如果先寫資料庫,如果突然斷電,資料庫寫了日誌沒寫,恢復時就會有影響)

10.5 恢復策略:

  • 同的故障需要不同的恢復策略

10.5.1 事務故障的恢復:

  • 事務的故障是指事務在正常執行至正常終點前被終止
  • 事務故障的恢復是由系統自動完成的,系統的恢復步驟是:
    • 1.反向掃描,查詢事務的更新操作
      2.對事務進行撤銷
      3.繼續反向掃描,查詢該事務其它的更新查詢,並做同樣的處理
      4.直到事務讀到事務開始標識,事務故障符合就完成
      10.5.2 系統的故障

10.5.2 系統的故障:

  • 系統的故障會造成資料庫不一致狀態,原因:
    • 1.未完成的事務的更新操作可能已經寫入資料庫 -- 解決辦法撤銷未完成的事務
      2.已提交的事務可能還停留在緩衝區,沒有寫到資料庫 -- 解決辦法重做已完成的事務

  • 系統故障的恢復由系統在重新啟動時自動完成

10.5.3 介質故障:

  • 介質故障指的是物理資料和日誌檔案被破壞
  • 恢復辦法是重灌資料庫,然重做已完成的事務
  • 介質的恢復需要資料庫管理員的介入,資料庫管理員只需要重灌最近轉儲的資料庫副本和有關的日誌檔案,然後執行系統提供的恢復命令即可

10.6 具有檢查點的恢復技術:

  • 為什麼需要檢查點技術:
    • 在利用日誌恢復資料庫恢復時,恢復子系統的時候必須搜尋日誌,確定哪些事務需要重新做,哪些事務要撤銷
      • 問題1:搜尋整個日誌需要大量時間
        問題2:重做處理、重新執行,浪費大量時間

  • 解決方案:

    • 1.在日誌檔案中增加檢查點記錄
      2.增加重新開始的檔案 - 和日誌檔案是並列的,不在日誌檔案裡面
      3.恢復子系統在登入日誌檔案期間動態地維護日誌

  • 檢查點記錄的內容:

    • 1.所有正在執行的事務清單
      2.這些事務最近一個日誌記錄地址

  • 重新開始檔案內容:

    • 1.檢查點記錄地址

  • 動態維護日誌檔案的方法:

    • 週期性地執行如下操作:建立檢查點、保持資料庫狀態

    • 具體步驟:

      • 1.將當前日誌緩衝區的所有日誌寫入磁碟的日誌檔案
        2.在日誌檔案中寫入一個檢查點記錄
        3.將當前的資料緩衝區的所有資料記錄寫入磁碟的資料庫中
        4.把檢查點記錄在日誌檔案中的地址寫入重新開始檔案

    • 說明:

      • 恢復子系統可以定期或不定期地建立檢查點,儲存資料庫狀態
        檢查點可以按照預定的一個時間來間隔來建立,如一個小時記錄一個檢查點
        也可以按照某種規則建立檢查點。如日誌檔案寫到一半建立

  • 利用檢查點恢復策略:

    • 所有檢查點方法可以改善恢復效率
      1.T1在檢查點之前提交,對資料庫的修改已經寫到資料庫
      2.T2在檢查點之後,故障之前,所有需要重做
      3.T3在故障之後需要撤銷
      4.T4在故障點之前提交,需要重做
      5.T5在檢查點之後,故障之前,需要撤銷

  • 系統使用檢查點的恢復步驟:

    • 1.從重新開始檔案找到最後一個檢測點,在日誌檔案中的地址,由該地址在日誌檔案中找到最後一個檢測點記錄

    • 2.檢查建立後得到所有正在執行的事務清單ACTIVE-LIST(活躍的),分成兩個事務對列:

      • 1.UNNDO-LIST:需要執行撤銷操作的的事務集合

      • 2.REDO-LIST:需要執行重做操作的事務集合
        ACTIVE-LIST暫時放入UNNDO-LIST,只是暫時(要看該事務是在說明時候提交的,如T4就先放程式佇列,但發現它是在故障發前提交就放到重做佇列)

      • 3.從檢查點掃描日誌檔案

        • 1.有新的事務就暫時放到UNNDO-LIST
          2.有提交就從UNNDO-LIST放到REDO-LIST - T4案例

      • 4.UNNDO-LIST的每個事務要執行UNNDO操作,REDO-LIST的每個事務要執行REDO操作

10.7 資料庫映象:

  • 目的:預防介質故障,提高資料庫可能性
  • 什麼是資料庫映象:
    • 資料庫管理系統自動把整個資料或其中關鍵資料複雜到另一個磁碟,主資料庫資料更新,資料庫管理系統把更新後的資料複製過去,保證映象資料庫與主資料的一致
  • 如果介質出現故障怎麼辦:

    • 所有應用去訪問映象資料庫,映象資料庫有去恢復主資料庫,如果沒有發生故障可以併發操作  

10.8 總結:

  • 1.保證資料庫的一致性是對資料庫的基本要求
    2.事務是資料庫的邏輯工作單位
    3.事務的ACID特徵:一致性、隔離性、原子性、永續性
    4.保證了事務ACID特徵就是保證了,資料庫的一致性
    5.故障的恢復是,保證事務的,一致性、隔離性、原子性
    6.恢復的基本原理就是利用後備副本、日誌檔案、資料庫映象中的冗餘資料來重構資料庫
    7.事務不僅是恢復的基本單位,也是併發控制的單位
    8.保證事務的一致性、隔離性,資料庫隔離系統需要對併發操作操作進行控制