MySQL加鎖分析

阿新 • • 發佈：2021-01-28

前言

最近遇到一次MySQL死鎖的問題，也算是少見的一件事情。公司的MySQL隔離級別是Read Commited，已經沒有了gap lock，而且程式碼裡的sql都再簡單不過，沒有顯式加鎖的sql語句。因此抽出時間看了一下原因。
分析具體問題之前，先整體的瞭解一下MySQL的加鎖邏輯，之後再分析起來就遊刃有餘了：

MySQL的鎖

為什麼MySQL要加鎖呢？OLTP資料庫離不開事務，事務也離不開併發操作下一致性的問題。現代資料庫解決事務的併發控制有兩種辦法，2PL和MVCC[1]。
2PL是加鎖方案的代表，就是將資料操作分為加鎖和解鎖兩個階段，任何資料操作都會將訪問物件加上鎖，後續對這個物件的資料操作就會被阻塞直到鎖釋放（事務提交）。傳統資料庫大都是用2PL來實現併發控制的。

MVCC(多版本併發控制)是無鎖方案的代表，通過對資料庫每一次變更記錄版本快照，實現讀-寫互不阻塞，寫-寫是否阻塞取決於具體實現（例如postgres的SERIALIZABLE級別下寫-寫互不阻塞，發生衝突丟擲異常）。
對於MySQL(innoDB)來說，是通過MVCC實現讀-寫併發控制，又是通過2PL寫-寫併發控制的，因此依然保留著(悲觀)鎖這個概念，既然有悲觀鎖，自然就有可能產生死鎖問題。
MySQL的事務我之前在這篇文章裡做過一些粗淺的理解：傳送門（痛心的是網上大部分資料還是顯示mySql在RR隔離級別下會幻讀。。）

那麼MySQL會如何加鎖呢[2]：

MySQL鎖的模式：

共享/排它鎖(S鎖/X鎖) (Shared and Exclusive Locks)
- S鎖與X鎖衝突，S鎖與S鎖不衝突，X鎖和X鎖衝突
  - 鎖衝突意味著無法獲取鎖的事務需要等待，鎖被釋放後才能繼續。當然也有可能等待超時或檢測出死鎖
- 快照讀(普通select …)不加鎖
- select..lock in share mode / Serializable下的select 會加S鎖
- select..for update / 寫操作(insert update delete) 會加X鎖
- 上述的鎖都是行級別的，S鎖和X鎖同樣可以加在表級別上，對應的語句分別是LOCK TABLE … READ和LOCK TABLE … WRITE
意向鎖(IS鎖/IX鎖) (Intention Locks)
- 意向鎖是表級別的鎖，用來標識該表上面有資料被鎖住（或即將被鎖）
- 一個事務在獲取（任何一行/或者全表）S鎖之前，一定會先在所在的表上加IS鎖。同理，獲取X鎖之前一定會加上IX鎖。
- 意向鎖提出的目的，就是要標識這個表上面有鎖，這樣一來，對於表級別鎖的請求（LOCK TABLE …），就可以直接判斷是否有鎖衝突，而不需要逐行檢查鎖的狀態了。從更大的角度來看，意向鎖就是為了實現不同粒度的鎖共存，每次加鎖都需要先對上面更粗粒度的資料結構加意向鎖，用來表達“這個資料結構中存在被鎖住的資料”。

其相容矩陣如下（+表示相容，-表示衝突）：

\	IS	IX	S	X
IS	+	+	+	–
IX	+	+	–	–
S	+	–	+	–
X	–	–	–	–

上面提到的鎖的模式，指的是如何鎖住資料，各種模式之間是否相容；下面提到的鎖的型別，定義的是具體鎖在哪裡。二者並不衝突，比如record lock可以分成record x lock和record s lock。

MySQL鎖的型別：

Record Locks
- 對單條索引記錄上加的鎖。準確的說，鎖是加在索引上的而非行上。因為innodb一定會有一個聚簇索引，因此最終的行鎖都會落到聚簇索引上。
- 可以加在聚簇索引或者二級索引上。
Gap Locks
- gap lock是對索引間隙加的鎖，可以是在一條索引記錄之前，也可以在一條索引記錄之後。
- gap lock的唯一作用，就是阻止其他事務向鎖住的gap裡插入資料。
- gap lock下的所有鎖的模式都是相容的，比如同一個位置的gap s lock和gap x lock是可以共存的。其作用也是完全相同的。
- 在READ COMMITTED隔離級別下，不會使用gap lock。因此下文關於gap lock的加鎖，對於RC隔離級別可以自動忽略。
Next-Key Locks
- Next-Key lock與record lock加鎖的粒度一樣，都是加在一條索引記錄上的。一個next-key lock=對應的索引記錄的record lock+該索引前面的間隙的gap lock
- 雖然說Next-Key Lock代表著record lock+前一個間隙的gap lock，在必要的情況下，最後一條記錄後面的gap也有可能作為一條單獨的gap lock被鎖住[3]。
- 由於鎖住的是前面的間隙，所以有些資料也會用左開右閉的區間來表示next-key lock，例如(1,3]
Insert Intention Locks
- Insert Intention Lock是一種特殊的間隙鎖，執行insert之前會向插入的間隙加上Insert Intention Lock
- Insert Intention Lock與已有的gap lock衝突，因此gap lock鎖住的間隙是不能插入資料的
- Insert Intention Lock與Insert Intention Lock之間不衝突，因此允許了同時向同一個間隙插入不同主鍵的資料

其相容矩陣如下，+表示相容，-表示衝突：

要加的鎖\ 已存在的鎖	record lock	gap lock	insert intention lock	next key lock
record lock	–	+	+	–
gap lock	+	+	+	+
insert intention lock	+	–	+	–
next key lock	–	+	+	–

如何檢視事務的加鎖情況

當存在鎖衝突/等待時，比較方便的檢視鎖衝突的方式：

// innodb_locks記錄了所有innodb正在等待的鎖，和被等待的鎖
select * from information_schema.innodb_locks;

// innodb_lock_waits記錄了所有innodb鎖的持有和等待關係
select * from information_schema.innodb_lock_waits'

但是上述方式只能看到存在鎖衝突的記錄，不能看到每個事務實際鎖住的記錄和範圍。因此更通用的辦法是，直接開啟innodb的鎖監控，在控制檯檢視詳細鎖狀態：
結果如上圖，可以看到當前事務id 4579持有著’new_table’表的聚簇索引=3的X鎖。事務id 4580正在等待’new_table’表的聚簇索引=3的X鎖。

mysql> set global innodb_status_output=ON; // 可選。將監控輸出到log_error輸出中，15秒重新整理一次
mysql> set global innodb_status_output_locks=ON; // 輸出的內容包含鎖的詳細資訊

通過show engine innodb status;語句，可以輸出每個事務當前持有的鎖結果，常見的結果型別解釋如下。死鎖日誌也會記錄如下的鎖記錄，因此可以用同樣的方式來讀MySQL的死鎖日誌。

// 表示事務4641對錶`sys`.`new_table`持有了IX鎖
TABLE LOCK table `sys`.`new_table` trx id 4641 lock mode IX

// space id=38，space id可以唯一確定一張表，表示了鎖所在的表
// page no 3，表示鎖所在的頁號
// index PRIMARY 表示鎖位於名為PRIMARY的索引上
// lock_mode X locks rec but not gap 表示x record lock
// 下方的資料表示了被鎖定的索引資料，最上面一行代表索引列的十六進位制值，在這裡表示的就是id=3的資料
RECORD LOCKS space id 38 page no 3 n bits 80 index PRIMARY of table `sys`.`new_table` trx id 4641 lock_mode X locks rec but not gap
Record lock, heap no 4 PHYSICAL RECORD: n_fields 8; compact format; info bits 0
0: len 4; hex 00000003; asc ;;
1: len 6; hex 0000000011e9; asc ;;
2: len 7; hex a70000011b0128; asc (;;
3: len 4; hex 8000012c; asc ,;;
4: len 1; hex 63; asc c;;
5: len 4; hex 80000006; asc ;;
6: len 3; hex 636363; asc ccc;;
7: len 2; hex 3333; asc 33;;

// lock_mode X表示的是next-key lock，即當前記錄的record lock+前一個間隙的gap lock
// 這個鎖在名為idx1的索引上，對應的索引列的值為100（hex 64對應十進位制），對應聚簇索引的值為1
RECORD LOCKS space id 38 page no 5 n bits 80 index idx1 of table `sys`.`new_table` trx id 4643 lock_mode X
Record lock, heap no 2 PHYSICAL RECORD: n_fields 2; compact format; info bits 0
0: len 4; hex 00000064; asc d;;
1: len 4; hex 00000001; asc ;;

// lock_mode X locks gap before rec表示的是對應索引記錄前一個間隙的gap lock
RECORD LOCKS space id 38 page no 5 n bits 80 index idx1 of table `sys`.`new_table` trx id 4643 lock_mode X locks gap before rec
Record lock, heap no 3 PHYSICAL RECORD: n_fields 2; compact format; info bits 0
0: len 4; hex 800000c8; asc ;;
1: len 4; hex 00000002; asc ;;

不同語句的加鎖情況

以下實驗資料基於MySQL 5.7。
假設已知一張表my_table，id列為主鍵。

id	name	num
1	aaa	100
5	bbb	200
8	bbb	300
10	ccc	400

對該表進行讀寫操作，可能產生的加鎖情況如下（僅考慮隔離級別為RR和RC）：

1. 查詢命中聚簇索引（主鍵索引）

1.1 如果是精確查詢，那麼會在命中的索引上加record lock。
例如：

// 在id=1的聚簇索引上加X鎖
update my_table set name='a' where id=1;

// 在id=1的聚簇索引上加S鎖
select * from my_table where id=1 lock in share mode;

1.2 如果是範圍查詢，那麼

1.2.1 在RC隔離級別下，會在所有命中的行的聚簇索引上加record locks（只鎖行）

// 在id=8和10的聚簇索引上加X鎖
update my_table set name='a' where id>7;

// 在id=1的聚簇索引上加X鎖
update my_table set name='a' where id<=1;

1.2.2 在RR隔離級別下，會在所有命中的行的聚簇索引上加next-key locks（鎖住行和間隙）。最後命中的索引的後一條記錄，也會被加上next-key lock。

// 在id=8、10(、+∞)的聚簇索引上加X鎖
// 在(5,8)(8,10)(10,+∞)加gap lock
update my_table set name='a' where id>7;
// 在id=1、5的聚簇索引上加X鎖
// 在(-∞,1)(1,5)加gap lock
update my_table set name='a' where id<=1;

1.3 如果查詢結果為空，那麼

1.2.1 在RC隔離級別下，什麼也不會鎖
1.2.2 在RR隔離級別下，會鎖住查詢目標所在的間隙。

// 在(1,5)加gap lock
update my_table set name='a' where id=2;

2. 查詢命中唯一索引

假設上述表中，num列加了唯一索引
2.1 如果是精確查詢，那麼會在命中的唯一索引，和對應的聚簇索引上加record lock。

// 在num=100的唯一索引上加X鎖
// 並在id=1的聚簇索引上加X鎖
update my_table set name='a' where num=100;

2.2 如果是範圍查詢，那麼

2.2.1 在RC隔離級別下，會在所有命中的唯一索引和聚簇索引上加record lock。同2.1
2.2.2 在RR隔離級別下，會在所有命中的行的唯一索引上加next-key locks。最後命中的索引的後一條記錄，也會被加上next-key lock。

// 在num=100和num=200的唯一索引上加X鎖
// 並在id=1和id=5的聚簇索引上加X鎖
// 並在唯一索引的間隙(-∞,100)(100,200)加gap lock
update my_table set name='a' where num<150;

2.3 如果查詢結果為空，同1.3。唯一差別在於，此時加的gap lock是位於唯一索引上的。

3. 查詢命中二級索引（非唯一索引）

假設上述表中，name列加了普通二級索引，num列沒有索引
3.1 如果是精確查詢，那麼

3.1.1 在RC隔離級別下，同2.1，對命中的二級索引和聚簇索引加record lock

// 在name='bbb'的兩條索引記錄上加X鎖
// 並在id=5和id=8的聚簇索引上加X鎖
update my_table set num=10 where name='bbb';

3.1.2 在RR隔離級別下，會在命中的二級索引上加next-key lock，最後命中的索引的後面的間隙會加上gap lock。對應的聚簇索引上加record lock。

// 在name='bbb'的兩條索引記錄上加X鎖
// 並在id=5和id=8的聚簇索引上加X鎖
// 並在二級索引的間隙('aaa','bbb')('bbb','bbb')('bbb','ccc')加gap lock
update my_table set num=10 where name='bbb';

3.2 範圍查詢、模糊查詢的情況比較複雜，此處不詳述。可以用上述方法自己實驗。

4. 查詢沒有命中索引

假設上述表中，name列加了普通二級索引，num列沒有索引
4.1 如果查詢條件沒有命中索引

4.1.1 在RC隔離級別下，對命中的資料的聚簇索引加X鎖。根據MySQL官方手冊[4]，對於update和delete操作，RC只會鎖住真正執行了寫操作的記錄，這是因為儘管innodb會鎖住所有記錄，MySQL Server層會進行過濾並把不符合條件的鎖當即釋放掉[5]。同時對於UPDATE語句，如果出現了鎖衝突（要加鎖的記錄上已經有鎖），innodb不會立即鎖等待，而是執行semi-consistent read：返回改資料上一次提交的快照版本，供MySQL Server層判斷是否命中，如果命中了才會交給innodb鎖等待。因此加鎖情況可以這樣來認為：

// 在id=5的聚簇索引上加X鎖
update my_table set num=1 where num=200;

// 先在id=1,5,8,10（全表所有記錄）的聚簇索引上加X鎖
// 然後馬上釋放id=1,8,10的鎖，只保留id=5的鎖
delete from my_table where num=200;

4.1.2 在RR隔離級別下，事情就很糟糕了，對全表的所有聚簇索引資料加next-key lock

// 在id=1,5,8,10（全表所有記錄）的聚簇索引上加X鎖
// 並在聚簇索引的所有間隙(-∞,1)(1,5)(5,8)(8,10)(10,+∞)加gap lock
update my_table set num=100 where num=200;

// 儘管name列有索引，但是like '%%'查詢不使用索引，因此此時也是鎖住所有聚簇索引，情況和上面一模一樣
update my_table set num=100 where name like '%b%';

5. 對索引鍵值有修改

假設上述表中，num列加了二級索引
如果一條update語句，對索引鍵值有修改，那麼修改前後的資料如何加鎖呢。這點要結合資料多版本的可見性來考慮：無論是聚簇索引，還是二級索引，只要其鍵值更新，就會產生新版本。將老版本資料deleted bti設定為1；同時插入新版本[6]。因此可以認為，一次索引鍵值的修改實際上操作了兩條索引資料：原索引和修改後的新索引。
從innodb的事務的角度來看，如果一個事務操作（寫）了一條資料，那麼這條資料一定要加鎖。因此可以認為，如果修改了索引鍵值，那麼修改前和修改後的索引都會加鎖。另外，由於修改的資料並沒有被作為查詢條件，那麼也不會有“不可重複讀”和“幻讀”的問題，因此無需加gap lock，索引修改只會加X record lock。

示例（RC和RR級別效果一樣）：

// 在id=1的聚簇索引上加X鎖
// 並在name='aaa'（name列索引原鍵值）和name='eee'（新鍵值）的索引上加鎖
update my_table set name='eee' where id=1;

6. 插入資料

假設上述表中，num列加了二級索引
insert加鎖過程：

唯一索引衝突檢查：表中一定有至少一個唯一索引，那麼首先會做唯一索引的衝突檢查。innodb檢查唯一索引衝突的方式是，對目標的索引項加S鎖（因為不能依賴快照讀，需要一個徹底的當前讀），讀到資料則唯一索引衝突，返回異常，否則檢查通過。
對插入的間隙加上插入意向鎖(Insert Intention Lock)
對插入記錄的所有索引項加X鎖

示例：

// 先對id=15加S鎖
// 再對間隙id(10,+∞)和name('ccc',+∞)加Insert Intention Lock
// 然後在id=15的聚簇索引上加X鎖（S鎖升級為X鎖）
// 並在name='fff'的索引上加X鎖
insert into my_table (`id`, `name`, `num`) values ('15', 'fff', '800');

還有一個有趣的問題，如果插入的二級索引鍵值已經存在，那麼這個插入意向鎖會加在哪個間隙中呢？
顧名思義，插入意向鎖鎖定的間隙一定是將要插入的索引的位置，如果二級索引鍵值相同，預設會按照聚簇索引的大小來排序（二級索引在儲存上其實就是{索引值,主鍵值}）。例如：

// 插入意向鎖加在間隙 ({'aaa',1},{'bbb',5}) 上
insert into my_table (`id`, `name`, `num`) values ('4', 'bbb', '800');

// 插入意向鎖加在間隙 ({'bbb',5},{'bbb',8}) 上
insert into my_table (`id`, `name`, `num`) values ('6', 'bbb', '800');

// 插入意向鎖加在間隙 ({'bbb',8},{'ccc',10}) 上
insert into my_table (`id`, `name`, `num`) values ('11', 'bbb', '800');

隱式鎖

為了降低鎖的開銷，innodb採用了延遲加鎖機制，即隱式鎖(implicit lock)[7]。
從資料儲存結構上看，每張表的資料都是掛在聚簇索引的B+樹下面的葉子節點上（每個節點代表一個page，每個page存放著多行資料）。每行儲存的資訊項中都會存有一隱藏列事務id。當有事務對這條記錄進行修改時，需要先判斷該行記錄是否有隱式鎖（原記錄的事務id是否是活動的事務），如果有則為其真正建立鎖並等待，否則直接更新資料並寫入自己的事務id。
二級索引雖然儲存上沒有記錄事務id，但同樣可以存在隱式鎖，只不過判斷邏輯複雜一些，需要依賴對應的聚簇索引做計算。
當然，隱式鎖只是一個實現細節，顯示還是隱式加鎖並不影響上文對加鎖的判斷。
另外，聚簇索引每行記錄的事務id，還有一個重要作用就是實現MVCC快照讀：由於事務id是全域性遞增的，那麼進行快照讀的時候，如果資料的事務id小於當前事務id並且不在活躍事務列表內（尚未提交），則直接返回當前行資料。否則需要根據roll pointer（和事務id一樣，也在每行的隱藏列中）去查詢undo日誌。

一個RC隔離級別下的死鎖

其實可以看到，RC隔離級別下的加鎖已經很少了，用官方文件的話說”greatly reduces the probability of deadlocks”。因此儘管MySQL的預設隔離級別是RR，但是網際網路應用更傾向與使用RC來避免死鎖+提高併發能力。例如阿里電商的MySQL預設級別就是RC。
尷尬的是，但是我也的的確確碰到了RC的死鎖。還是以這個表來舉例，假設id為主鍵，num列無索引。

id	name	num
1	aaa	100
5	bbb	200
8	bbb	300

按以下順序執行事務：

trx1	trx2
insert into my_table (id, name, num) values (‘16’, ‘rrr’, ‘888’);	-
-	insert into my_table (id, name, num) values (‘17’, ‘ttt’, ‘999’);
delete from sys.my_table where num=300; // waiting	-
-	delete from sys.my_table where num=400; // deadlock

對照上文的加鎖邏輯，insert會對聚簇索引加X鎖，因此trx1和trx2首先會分別持有id=16和id=17的X鎖。
接下來坑爹的事情來了，對於無索引欄位，delete操作不會執行semi-consistent read，而是先直接鎖住所有資料的聚簇索引（儘管後面會馬上釋放，但也需要先獲取鎖）。這樣一來，事務1的delete需要鎖住所有記錄，等待事務2持有的id=17的X鎖，而事務2的delete需要等待事務1的id=16的X鎖。死鎖就產生了。
在這個例子中，如果insert和delete的順序都顛倒一下，或者delete都變為update，死鎖都不會發生。

小結

索引記錄的間隙上用來避免幻讀。
Select（Serializable隔離級別除外）不會加鎖，而是執行快照讀。
寫操作都會加鎖，具體加鎖方式取決於隔離級別、索引命中情況以及修改的索引情況。
為了減少鎖的範圍，避免死鎖的發生，應該儘量讓查詢條件命中索引，而且命中的越精確加鎖越少。同時如果能接受RC級別對一致性的破壞，可以將隔離級別調整成RC。

參考資料

[1] 蕭美陽, 葉曉俊. 併發控制實現方法的比較研究[J]. 計算機應用研究, 2006, 23(6):19-22.
[2]MySQL 5.7 Reference Manual :: 15.5.1 InnoDB Locking
[3]MySQL 5.7 Reference Manual :: 15.5.4 Phantom Rows
[4]MySQL 5.7 Reference Manual :: 15.5.2.1 Transaction Isolation Levels
[5]MySQL 加鎖處理分析
[6]InnoDB多版本(MVCC)實現簡要分析
[7]Introduction to Transaction Locks in InnoDB Storage Engine

MySQL加鎖分析

前言

MySQL的鎖

如何檢視事務的加鎖情況

不同語句的加鎖情況

1. 查詢命中聚簇索引（主鍵索引）

2. 查詢命中唯一索引

3. 查詢命中二級索引（非唯一索引）

4. 查詢沒有命中索引

5. 對索引鍵值有修改

6. 插入資料

隱式鎖

一個RC隔離級別下的死鎖

小結

參考資料

MySQL加鎖分析

【重溫mysql】6、InnoDB 加鎖分析

驚！史上最全的select加鎖分析(Mysql)

MySQL update 語句加鎖分析

MySQL INNODB鎖分析心得

《轉》Mysql加鎖過程詳解（1）-基本知識

Mysql 加鎖過程詳解（1）- 基礎知識

解決死鎖之路3 - 常見 SQL 語句的加鎖分析（轉）

MySQL死鎖分析

Mysql 死鎖分析

線上BUG：MySQL死鎖分析實戰

select 加鎖分析

MySQL死鎖分析與解決之路

MySQL加鎖解鎖語句

MySQL語句加鎖的實現分析

關於MySQL死鎖問題的深入分析

mysql共享鎖與排他鎖用法例項分析

一個mysql死鎖場景例項分析

MySql之深入分析MySql事務與鎖

mysql 悲觀鎖與樂觀鎖的理解及應用分析

MySQL加鎖分析

前言

MySQL的鎖

如何檢視事務的加鎖情況

不同語句的加鎖情況

1. 查詢命中聚簇索引（主鍵索引）

2. 查詢命中唯一索引

3. 查詢命中二級索引（非唯一索引）

4. 查詢沒有命中索引

5. 對索引鍵值有修改

6. 插入資料

隱式鎖

一個RC隔離級別下的死鎖

小結

參考資料

相關推薦