1. 程式人生 > >dump解析入門-用VS解析dump檔案進行排障

dump解析入門-用VS解析dump檔案進行排障

突然有一天部署在伺服器的一個應用掛掉了,沒辦法只能進入伺服器開啟

 

【事件檢視器】檢視下,好不容易找到了開啟後一臉懵逼

 

事件檢視器查到的內容根本對我們排障沒有任何作用。

在這個時候如果有對應的dump檔案就能派上用場了,

只要有dump檔案就能查到應用掛掉那刻的一手情報,可能有人認為分析dump檔案是非常難的事情,

但是最近不斷有新的dump分析工具出來,例如用vs2017就能夠很簡單的分析dump檔案。

接下來我們用幾個實際的例子來看看如何用vs2017來分析dump檔案吧

dump檔案的收集

應用掛是一瞬間的事情,掛了之後就沒辦法生成dump檔案了。所以首先要設定一下自動生成dump檔案。

開啟登錄檔HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\Windows Error Reporting

 

在Windows Error Reporting下新建一個 LocalDumps資料夾

然後在這項裡面新增 DumpCount DumpFolder DumpType 這三項

 

演示stackoverflow錯誤導致的crash

我們有建立一個簡單的console程式

class Program

    {

        static void HogeHoge(string s)

        {

            HogeHoge(s);

        }

        static void Main(string[] args)

        {

            HogeHoge("hoge-");

        }

 }

編譯成exe 後執行 毫無疑問會出現如下錯誤

 

檢視下dump檔案果然生成了

 

那我們分析下這個dump檔案,用VS2017開啟它,會出現它的概要資訊

 

你會發現異常資訊處寫了 【該執行緒已用完其堆疊】就可以很明顯看出來是stackoverflow。

而且看右側【操作】處 有[使用 僅限託管 進行除錯] 和 [使用 混合 進行除錯] 和 [使用 僅限本機 進行除錯]

這裡牽扯出3個名詞

託管  ======> 適用於在公共語言執行時下執行的程式碼 所謂託管是指記憶體管理由系統而不是由程式設計師管理  大家都知道c#有關記憶體都是CLR來管理的

混合  ======>對託管程式碼和非託管程式碼都呼叫偵錯程式

本機  ======>適用於非託管程式碼

如果你的程式碼裡面沒有呼叫非託管程式碼的話 點選 前面2個按鈕都可以的

點選後會直接進入

 

這樣錯誤原始碼級別看的非常清楚了。因為是我們本機建立的工程 pdb 和 原始碼都有。所以才能直接定位到。但是實際上crash都是發生在伺服器上,把伺服器上的dump檔案開啟的話還會是這樣嗎

下面我們來做一個模擬

用Relase編譯 然後把 Program.cs檔案也給刪除掉。然後重新執行crash生成dump檔案

然後用同樣的步驟vs開啟點選除錯就會提示找不到 Program.cs

 

這樣一來可供我們排障的情報就少了很多。在這種情況下 我們可以利用vs 提供的幾個視窗來觀察

分別是以下三個

 

第一個視窗:執行緒視窗

 

實際的程式往往有很多執行緒在執行,每個執行緒的切換等重要資訊可以在這個視窗進行觀察。

第二個視窗:呼叫堆疊視窗

 

呼叫堆疊視窗是和執行緒視窗聯動的。

第三個視窗也是最重要的視窗:並行堆疊

 

如圖所示,每個執行緒和它的堆疊內容展示的很清楚。只不過本例子是比較簡單的,即使不看這個看前2個視窗就能知道原因了。

但是實際的應用若超過執行上百個執行緒的話,將這些執行緒用圖形可視化出來對於我們排查複雜問題是非常有用的!

CPU100和死鎖導致的crash解析

由於系統可以配置crash自動生成dump檔案。但是有些情況比如部署在iis上web服務cpu飆到100%下不來導致為web停止服務。這個時候就需要我們手動提取dump檔案了。

下面我們來模擬一下這種場景:

新建一個asp.net mvc程式

public class HomeController : Controller
{
    async Task<string> GetAsync()
    {
        var str = await new HttpClient().GetStringAsync("http://www.baidu.com/");
        return str;
    }

    public ActionResult Index()
    {
        var s = GetAsync().Result;
        return View();
    }
}

以上程式碼 async/await會造成死鎖

我們用iis來啟動這個web應用後頁面圈圈一直在轉網頁空白一片

開啟Windows工作管理員找到w3wp

 

用vs開啟這個dump檔案 點選除錯後後

開啟並行堆疊這個視窗

 

大家看會有很多分支,該從哪個開始分析呢,教大家一個小技巧,不知道如何下手的時候就選分支越長的!

 

從HomeController.Index進來,停止在ManualResetEventSlim.Wait

死鎖原因:

 

總結:

說到dump大家立馬可能想到的是windbg

但是windbg的各種命令對於新手們還是比較困難的,Vs工具也能幫助我們分析dump,能夠解決的問題也有很多

下一篇文章我將介紹記憶體洩露dump分析的例子