一張思維導圖縱觀MySQL資料安全體系

阿新 • • 發佈：2018-12-27

作者介紹：
楊奇龍，前阿里資料庫團隊資深DBA，主要負責淘寶業務線，經歷多次雙十一，有海量業務訪問DB架構設計經驗。目前就職於有贊科技，負責資料庫運維工作，熟悉MySQL效能優化、故障診斷、效能壓測。

簡介

和團隊內部的同事一起溝通，討論了MySQL資料庫系統資料安全性問題，主要針對MySQL丟資料、主從不一致的場景，還有業務層面使用不得當導致主備庫資料結構不一樣的情況，本文是基於以上的討論和總結做的思維導圖。

思維導圖

內容展示

OS

BBU：資料庫伺服器要配置BBU，BBU在電源供應出現問題的時候，為RAID控制器快取提供電源。當電源斷電時，BBU電力可以使控制器內快取中的資料可以儲存一定時間（根據BBU的型號而決定）。使用者只需要在BBU電力耗盡之前恢復正常供電，快取中的資料即可被完整的寫回RAID中,避免斷電導致資料丟失

防止OS異常斷電導致資料無法正常落盤
磁碟禁用cache，MySQL的 O_DIRECT 方式可以跳過pagecache寫資料

單機

（1）redo log

innodb_flush_log_at_timeout

< 5.6.6：每隔一秒將redo log buffer中的資料重新整理到磁碟

>= 5.6.6：每隔innodb_flush_log_at_timeout秒將資料重新整理到磁碟中去

（2）binlog

sync_binlog =1

（3）innodb buffer data

不同的flush mathod刷資料的圖形展示。圖片來自hatemysql.com。

（4）InnoDB 落盤

MySQL資料落盤的路徑，圖片來自李春hatemysql.com。

主從不一致

主庫insert之後再回滾，主備庫自增主鍵不一致
使用replace into操作，導致主備庫自增主鍵不一致
set session sql_log_bin=0

業務架構

常見的雙寫

“丟”資料的場景

（1）slave_skip_counter 不合理

slave_skip_counter =1
slave_skip_counter >1

（2）DB Crash，OS正常

innodb_flush_log_at_trx_commit=0
事務提交時，不重新整理快取，系統重新整理的頻率是1s，故會丟失1s的資料。

innodb_flush_log_at_trx_commit=1
事務提交時，會重新整理到磁碟，保證事務落盤，故不丟資料。

innodb_flush_log_at_trx_commit=2
事務提交時，重新整理到os cache，系統沒有crash，資料無丟失。

（3）DB正常，OS Crash

帶有 BBU

innodb_flush_log_at_trx_commit=0
事務提交時，不重新整理快取，系統重新整理的頻率是1s，故會丟失1s的資料。

innodb_flush_log_at_trx_commit=1
事務提交時，會重新整理到磁碟，保證事務落盤，故不丟資料。

innodb_flush_log_at_trx_commit=2
事務提交時，重新整理到os cache，系統沒有crash，資料無丟失。

（4）slave非實時寫redo和binlog丟失資料

在slave機器上會存在三個檔案來保證事件的正確重放：relay log、 relay log info、 master info。

（5）非同步模式

事務T1寫入binlog buffer；
dumper執行緒通知slave有新的事務T1；
binlog buffer進行checkpoint；
slave因為網路不穩定，一直沒有收到t1；master掛掉，slave提升為新的master，t1丟失。

（6）semi sysnc

after_commit

比如主庫操作update t1 set val=1 where id=10將val從5修改為1 。

會話session1在主庫提交update t1 set val=1 where id=10 ；commit；
主庫根據二階段提交將資料持久化到innodb和提交日誌binlog；
同步日誌到slave ，並等待slave 返回ack資訊，等待的實際時間以 rpl_semi_sync_master_timeout 為準，超過該設定時間則超時，主庫返回給客戶端成功寫入資訊。
接收到來自slave的ack資訊，返回成功給OK客戶端。

分析：

第四步之前，master還未收到slave的ack資訊，此時由於事務已經提交，除了session1，其他會話是可以看到 val=1。
主庫伺服器down或者主庫例項crash，此時發生HA切換。
主庫未接收到slave的ack資訊，slave接收到日誌並落盤，應用binlog更新。t1.val=1，此時業務切換到slave上能獲取到一致的資料。
如果在slave還未接收到binlog並且主庫掛了，因為主庫已經提交，此時主庫t1.val是1而從庫t1.val是5，主備不一致。
after_sync

比如主庫操作update t1 set val=1 where id=10將val從5修改為1。
1. 會話session1在主庫提交 :update t1 set val=1 where id=10；commit；
2. 主庫將事務寫入binlog。
3. 將binlog同步給slave，不提交。
4. 等待slave返回ack資訊，等待的實際時間以rpl_semi_sync_master_timeout為準，如果超時master改為非同步模式。
5. 接收到來自slave的ack資訊，主庫進行提交併且返回成功給OK客戶端。
分析：
- 如果在第3步等待slave ack的過程中，主庫發生crash(此時t1.val=5),HA 切換到slave，應用查詢slave 。如果slave接收到binlog併發送ack給master，則t1.val=1。
- 如果slave響應主庫，但是主庫crash ，此時因為主庫還沒提交t1.val=1, slave t1.val=5，但是主庫啟動恢復之後t1.val會變成5，主備還是一致的。
- 如果slave未接收到事務和響應主庫，此時t1.val=5，無論哪種狀態，對於所有客戶端資料庫都是一致，事務都沒有丟失。
  知識點：兩階段提交
  
  第一階段是先prepare、再同步寫redo log，第二階段同步寫binlog、再commit，如果在寫入commit標誌時崩潰，則恢復時，會重新對commit標誌進行寫入。
  
  HA切換
  
  （6）主從
  
  binlog_format
  
  ROW（最安全）
  MIXED（不推薦）
  STATEMENT（不推薦）
  
  sync_binlog
  
  =0：由os系統的重新整理機制來控制，重新整理資料到磁碟的頻率
  =1：每次commit重新整理到磁碟
  >1：每N次提交重新整理到磁碟
  
  innodb_support_xa
  
  版本要開啟，保證binlog提交的順序，否則亂序的binlog在恢復或者slave應用的時候會有問題，及以後廢棄，始終支援兩階段提交。
  
  crash safe
  
  crash-safe就是將relay-info.log的資訊儲存在InnoDB的事務表中，這時執行relay log中的事務和寫relay info在一個事務中，就能得到原子性保證。從而避免已執行的binlog位點和寫入relay log info的位點資訊不一致的情況發生。
  
  IO thread
  
  master-info-repository=TABLE
  sync_master_info=N：每N個event重新整理一次表
  
  SQL thread
  
  relay-log-info-repository=TABLE
  sync_relay_info=N：每N個event重新整理一次表
  
  relay-log-recovery
  
  當slave從庫宕機後，假如relay-log損壞了，導致一部分中繼日誌沒有處理，則自動放棄所有未執行的relay-log，並且重新從master上獲取日誌，這樣就保證了relay-log的完整性。
  
  relay_log_info_repository = TABLE
  relay_log_recovery = 1
  
  http://mysqlserverteam.com/relay-log-recovery-when-sql-threads-position-is-unavailable/
  
  semi_sync
  - after commit：master把每一個事務寫到二進位制日誌並儲存到磁碟上，並且提交（commit）事務，再把事務傳送給從庫，開始等待slave的應答。響應後master返回結果給客戶端，客戶端才可繼續。
  - after sync：master把每一個事務寫到二進位制日誌並儲存磁碟上，並且把事務傳送給從庫，開始等待slave的應答。確認slave響應後，再提交（commit）事務到儲存引擎，並返回結果給客戶端，客戶端才可繼續。
  GTID
  
  相比位點複製，能減少不一致的概率
  參考資料
  - MySQL資料丟失討論http://hatemysql.com/?p=395
  - 細看InnoDB資料落盤http://hatemysql.com/?p=503
  - MySQL5.7 深度解析：Loss-Less半同步複製技術
  - MySQL 5.7 Replication相關新功能說明
  原文來自微信公眾號：DBAplus社群

一張思維導圖縱觀MySQL資料安全體系

作者介紹：楊奇龍，前阿里資料庫團隊資深DBA，主要負責淘寶業務線，經歷多次雙十一，有海量業務訪問DB架構設計經驗。目前就職於有贊科技，負責資料庫運維工作，熟悉MySQL效能優化、故障診斷、效能壓測。簡介和團隊內部的同事一起溝通，討論了MySQL資料庫系統資料安全性問題，主要針對MySQL丟資

一張思維導圖縱觀MySQL資料安全體系！

楊奇龍 2017-06-29 09:52:10 786 作者介紹楊奇龍，前阿里資料庫團隊資深DBA，主要負責淘寶業務線，經歷多次雙十一，有海量業務訪問DB架構設計經驗。目前就職於有贊科技，負責資料庫運維工作，熟悉MySQL效能優化、故障診斷、效能壓測。

一張思維導圖縱觀MySQL數據安全體系！

存儲引擎 safe list info 無法 log 用戶設計數據安全楊奇龍 2017-06-29 09:52:10 786 作者介紹楊奇龍，前阿裏數據庫團隊資深DBA，主要負責淘寶業務線，經歷多次雙十一，有海量業務訪問DB架構設計經驗。目前就職於有贊科技，負

一張思維導圖學會如何構建高效能MySQL系統！

作者介紹楊奇龍，前阿里資料庫團隊資深DBA，主要負責淘寶業務線，經歷多次雙十一，有海量業務訪問DB架構設計經驗。目前就職於有贊科技，負責資料庫運維工作，熟悉MySQL效能優化，故障診斷，效能壓測一、簡介最近在壓測新的儲存，正好把工作過程中積累的對高效能MySQL相關的知識體系構建起來，做成思維

一張思維導圖教你使用google一下

聯系 type ogl 頁面包含 mage str 包含 class 對比導圖總覽 google搜索技巧.png 雙引號代表完全匹配搜索也就是說搜索結果返回的頁面包含雙引號中出現的所有的詞，連順序也必須完全匹配例如搜索"java 排

專案管理的掙值計算，一張思維導圖全搞定

最近做專案管理的題，老是碰見掙值計算相關的，糊里糊塗的，樓主一氣之下熬夜用思維導圖梳理了一遍，如果有誰還看了之後還沒學會掙值計算的，樓主就要吐血了，PV,AC,EV,SV,CV,SPI,CPI,BAC.EAC,ETC,這10個引數已經被樓主梳理的清清楚楚了

一文總結學習 Python 的 14 張思維導圖

本文主要涵蓋了 Python 程式設計的核心知識（暫不包括標準庫及第三方庫，後續會發布相應專題的文章）。首先，按順序依次展示了以下內容的一系列思維導圖：基礎知識，資料型別（數字，字串，列表，元組，字典，集合），條件&迴圈，檔案物件，錯誤&異

資料 | Python的14張思維導圖（可後臺下載）

微信公眾號關鍵字全網搜尋最新排名【機器學習演算法】：排名第一【機器學習】：排名第一【Python】：排名第三【演算法】：排名第四來自：AI科技大本營下載方式請見文末總覽 14 張思維導圖基礎知識資料型別序列字串列表

JavaScript八張思維導圖

vue com http 服務程序思維系列系列文章 reac 不知不覺做前端已經五年多了，無論是從最初的jQuery還是現在火熱的Angular，Vue，React等前端框架，甚至是nodejs等服務端的興起，歸根到底，我始終覺著一切的核心還是JavaScript。

Linux學習之一-從三個重要人物的故事和一張思維導圖說起

工具困難一個人人工智計算全世界 str 三方微軟 Linux是一套自由加開放源代碼的類Unix操作系統，誕生於1991年10月5日（第一次正式向外公布），由芬蘭學生Linus Torvalds和後來陸續加入的眾多愛好者共同開發完成。 Linux是一個基於POSI

5張思維導圖，jQuery知識點梳理

好記性不如爛筆頭，有人幫你，是你的幸運，沒人幫你，才是正常的生活。整理了以前的jquery思維導圖，個別添加了小案例，有需要的小夥伴自行下載檢視哦~ “我自己是一名從事了5年web前端開發的老程式設計師，辭職目前在做線上教育講師（我的微信：web_kc，加我好友時

[鞏固基礎]總結Python基礎知識的14張思維導圖

閒聊有時候總感覺自己的程式碼太low，卻又沒有什麼辦法去改善，就很氣！不知道作為看官的你是否由此感受呢，不過最近我找到辦法解決這個問題了，那就是鞏固基礎--系統的學習python初級、高階語法，一段時間後，我明顯

Python系統學習的 14 張思維導圖！

本文主要涵蓋了 Python 程式設計的核心知識(暫不包括標準庫及第三方庫)。首先，按順序依次展示了以下內容的一系列思維導圖：基礎知識，資料型別(數字，字串，列表，元組，字典，集合)，條件&迴圈，檔案物件，錯誤&異常，函式，模組，面向物件程式設計;

Python 的全套 14 張思維導圖

本文主要涵蓋了 Python 程式設計的核心知識（暫不包括標準庫及第三方庫）。按順序依次展示了以下內容的一系列思維導圖：基礎知識，資料型別（數字，字串，列表，元組，字典，集合），條件&迴圈，檔案物件，錯誤&異常，函式，模組，面向物件程式設計；

學習php的15張思維導圖

15 張思維導圖來快速學習 PHP 語言基礎。 PHP 簡介 PHP安裝 PHP語法 PHP資料型別 PHP變數 PHP陣列(點選圖片檢視大圖) PHP常量 PHP超級全域性變數 PHP魔術變數 PHP運算子 PHP流

十張思維導圖掌握javascript重點

下面附上十張javascript思維導圖，其中囊括了js大部分的知識點，倘若全部精通，那可以說就相當厲害了。思維導圖的呈現方式使得js的整體知識體系更加條理清晰，對大家系統的掌握js很有幫助，歡迎大家收藏！ 1. js資料型別 2. js變數

學習Python的14張思維導圖

點選圖片參加推薦閱讀：學習過程中發現的學習資源分享給大家。原文連結：本文主要涵蓋了 Python 程式設計的核心知識（暫不包括標準庫及第三方庫，後續會發布相應專題的文章）。首先，按順序依次展示了以下內容的一系列思維導圖：基礎知識，資料型別（數字，字串，列表，元組，字典，集合）

14 張思維導圖學懂Python

來源：https://woaielf.github.io/關注“七月線上實驗室”，微信後臺回覆【

Hadoop學習筆記（十一）思維導圖整理（附原始檔）

在父親生病的這幾個月斷斷續續把《Hadoop實戰》和《Hadoop權威指南》看了一遍，之前寫的《Hadoop筆記》還有許多坑沒填，有機會再填填坑。之後思考一下學習的方向，看看自己究竟是往HDFS

一張思維導圖縱觀MySQL資料安全體系

簡介

思維導圖

內容展示

OS

單機

主從不一致

業務架構

“丟”資料的場景

相關推薦