1. 程式人生 > 資料庫 >sql server中死鎖排查的全過程分享

sql server中死鎖排查的全過程分享

前言

記得以前客戶在使用軟體時,有偶發出現死鎖問題,因為發生的時間不確定,不好做問題的重現,當時解決問題有點棘手了。

死鎖的四個必要條件:

  • 互斥條件(Mutual exclusion):資源不能被共享,只能由一個程序使用。
  • 請求與保持條件(Hold and wait):已經得到資源的程序可以再次申請新的資源。
  • 非剝奪條件(No pre-emption):已經分配的資源不能從相應的程序中被強制地剝奪。
  • 迴圈等待條件(Circular wait):系統中若干程序組成環路,該環路中每個程序都在等待相鄰程序正佔用的資源。

現總結下檢視死鎖的常用二種方式:

第一種是圖形化監聽:

sqlserver -->工具--> sql server profiler 登入後在跟蹤屬性中選擇如下圖:

監聽到的死鎖圖形如下圖

這裡的描述大致是:有二個程序 一個程序ID是96, 另一個ID是348. 系統自動kill 掉了程序ID:96,保留了程序ID:348 的事務Commit。

上面死鎖是由於批量更新出現PAG範圍鎖, 雙方程序在同一分割槽索引資源上。ID96,348都請求想獲取更新鎖(U),各佔排它鎖(x)不釋放,直到鎖超時。

第二種是使用日誌跟蹤(errorlog)

以全域性方式開啟指定的跟蹤標記

DBCC TRACEON(1222,-1)

DBCC TRACEON(1204,-1)

使用 EXEC master..xp_readerrorlog 檢視日誌。 由於記錄的死鎖資訊太多,貼出幾個重點說下(紅色加粗表示)

Deadlock encountered .... Printing deadlock information
Wait-for graph
NULL
Node:1 
PAGE: 7:1:6229275 CleanCnt:2 Mode:IX Flags: 0x3
Grant List 3:
Owner:0x00000004E99B7880 Mode: IX Flg:0x40 Ref:1 Life:02000000 SPID:219 ECID:0 XactLockInfo: 0x0000000575C7E970
SPID: 219 ECID: 0 Statement Type: UPDATE Line #: 84
Input Buf: Language Event: exec proc_PUB_StockDataImport
Requested by: 
ResType:LockOwner Stype:'OR'Xdes:0x0000000C7A905D30 Mode: U SPID:64 BatchID:0 ECID:59 TaskProxy:(0x0000000E440AAFE0) Value:0x8d160240 Cost:(0/0)
NULL

Node:2 
PAGE: 7:1:5692366 CleanCnt:2 Mode:U Flags: 0x3
Grant List 3:
Owner:0x0000000D12099B80 Mode: U Flg:0x40 Ref:0 Life:00000001 SPID:64 ECID:0 XactLockInfo: 0x000000136B4758F0
SPID: 64 ECID: 0 Statement Type: UPDATE Line #: 108
Input Buf: RPC Event: Proc [Database Id = 7 Object Id = 907150277]

-------- node:1 部分顯示的幾個關鍵資訊:

PAGE 7:1:6229275 (所在資料庫ID 7, 1分割槽, 6229275行數)

Mode: IX 鎖的模式 意向排它鎖

SPID: 219 程序ID

Event: exec proc_PUB_StockDataImport 執行的儲存過程名

-------node:2 部分顯示的幾個關鍵資訊

PAGE 7:1:5692366 (所在資料庫ID 7, 1分割槽,5692366行數)

Mode:U 鎖的模式 更新鎖

RPC Event: Proc 遠端呼叫

SPID: 64 程序ID

Victim Resource Owner:
ResType:LockOwner Stype:'OR'Xdes:0x0000000C7A905D30 Mode: U SPID:64 BatchID:0 ECID:59 TaskProxy:(0x0000000E440AAFE0) Value:0x8d160240 Cost:(0/0)
deadlock-list
deadlock victim=process956f4c8
process-list
process id=process956f4c8 taskpriority=0 logused=0 waitresource=PAGE: 7:1:6229275 waittime=2034 ownerId=2988267079 transactionname=UPDATE 
lasttranstarted=2018-04-19T13:54:00.360 XDES=0xc7a905d30 lockMode=U schedulerid=24 kpid=1308 status=suspended spid=64 sbid=0 ecid=59 priority=0 trancount=0 
lastbatchstarted=2018-04-19T13:53:58.033 lastbatchcompleted=2018-04-19T13:53:58.033 clientapp=.Net SqlClient Data Provider hostname=VMSERVER76 hostpid=16328 
isolationlevel=read committed (2) xactid=2988267079 currentdb=7 lockTimeout=4294967295 clientoption1=671088672 clientoption2=128056
executionStack
frame procname=Test.dbo.proc_CnofStock line=108 stmtstart=9068 stmtend=9336 sqlhandle=0x03000700c503123601ba25019ca800000100000000000000
update dbo.pub_stock
set UpdateTime=GETDATE()
from pub_stock a
join PUB_PlatfromStocktemp b on a.GUID=b.StockGuid

從上面的資訊能看到kill 掉的是程序id是process956f4c8,

程序spid=64

lockMode=U 獲取更新鎖

isolationlevel=read committed

executionStack 執行的堆資訊:

儲存名 procname=Test.dbo.proc_CnofStock

語句 update dbo.pub_stock set UpdateTime=GETDATE() ..

clientapp 發起事件的來源

最後總結 避免死鎖的解決方法

按同一順序訪問物件。

優化索引,避免全表掃描,減少鎖的申請數目.

避免事務中的使用者互動。

使用基於行版本控制的隔離級別。

將事務預設隔離級別的已提交讀改成快照

SET TRANSACTION ISOLATION LEVEL SNAPSHOT

使用nolock去掉共享鎖,但死鎖發生在u鎖或x鎖上,則nolock不起作用

升級鎖顆粒度(頁鎖,表鎖),以阻塞還代替死鎖

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,如果有疑問大家可以留言交流,謝謝大家對我們的支援。