dump解析入门-用VS解析dump文件进行排障
突然有一天部署在服務(wù)器的一個應(yīng)用掛掉了,沒辦法只能進(jìn)入服務(wù)器打開
?
?
【事件查看器】查看下,好不容易找到了打開后一臉懵逼
?
?
?
事件查看器查到的內(nèi)容根本對我們排障沒有任何作用。
在這個時候如果有對應(yīng)的dump文件就能派上用場了,
只要有dump文件就能查到應(yīng)用掛掉那刻的一手情報,可能有人認(rèn)為分析dump文件是非常難的事情,
但是最近不斷有新的dump分析工具出來,例如用vs2017就能夠很簡單的分析dump文件。
接下來我們用幾個實(shí)際的例子來看看如何用vs2017來分析dump文件吧
?
dump文件的收集
應(yīng)用掛是一瞬間的事情,掛了之后就沒辦法生成dump文件了。所以首先要設(shè)置一下自動生成dump文件。
打開注冊表HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\Windows Error Reporting
?
?
?
在Windows Error Reporting下新建一個 LocalDumps文件夾
然后在這項(xiàng)里面新增 DumpCount DumpFolder DumpType 這三項(xiàng)
?
?
?
演示stackoverflow錯誤導(dǎo)致的crash
我們有創(chuàng)建一個簡單的console程序
class Program
??? {
??????? static void HogeHoge(string s)
??????? {
??????????? HogeHoge(s);
??????? }
??????? static void Main(string[] args)
??????? {
??????????? HogeHoge("hoge-");
??????? }
?}?
編譯成exe 后運(yùn)行 毫無疑問會出現(xiàn)如下錯誤
?
?
查看下dump文件果然生成了
?
?
那我們分析下這個dump文件,用VS2017打開它,會出現(xiàn)它的概要信息
?
?你會發(fā)現(xiàn)異常信息處寫了 【該線程已用完其堆棧】就可以很明顯看出來是stackoverflow。
而且看右側(cè)【操作】處 有[使用 僅限托管 進(jìn)行調(diào)試] 和 [使用 混合 進(jìn)行調(diào)試] 和 [使用 僅限本機(jī) 進(jìn)行調(diào)試]
這里牽扯出3個名詞
托管? ======> 適用于在公共語言運(yùn)行時下運(yùn)行的代碼 所謂托管是指內(nèi)存管理由系統(tǒng)而不是由程序員管理? 大家都知道c#有關(guān)內(nèi)存都是CLR來管理的
混合? ======>對托管代碼和非托管代碼都調(diào)用調(diào)試器
本機(jī)? ======>適用于非托管代碼
如果你的代碼里面沒有調(diào)用非托管代碼的話 點(diǎn)擊 前面2個按鈕都可以的?
點(diǎn)擊后會直接進(jìn)入?
?這樣錯誤源碼級別看的非常清楚了。因?yàn)槭俏覀儽緳C(jī)創(chuàng)建的工程 pdb 和 源碼都有。所以才能直接定位到。但是實(shí)際上crash都是發(fā)生在服務(wù)器上,把服務(wù)器上的dump文件打開的話還會是這樣嗎
下面我們來做一個模擬
用Relase編譯 然后把 Program.cs文件也給刪除掉。然后重新執(zhí)行crash生成dump文件
然后用同樣的步驟vs打開點(diǎn)擊調(diào)試就會提示找不到 Program.cs?
?這樣一來可供我們排障的情報就少了很多。在這種情況下 我們可以利用vs 提供的幾個窗口來觀察
分別是以下三個?
第一個窗口:線程窗口
?
實(shí)際的程序往往有很多線程在運(yùn)行,每個線程的切換等重要信息可以在這個窗口進(jìn)行觀察。?
第二個窗口:調(diào)用堆棧窗口?
?
調(diào)用堆棧窗口是和線程窗口聯(lián)動的。
?
第三個窗口也是最重要的窗口:并行堆棧
?
?
如圖所示,每個線程和它的堆棧內(nèi)容展示的很清楚。只不過本例子是比較簡單的,即使不看這個看前2個窗口就能知道原因了。
但是實(shí)際的應(yīng)用若超過運(yùn)行上百個線程的話,將這些線程用圖形可視化出來對于我們排查復(fù)雜問題是非常有用的!
?
CPU100和死鎖導(dǎo)致的crash解析
由于系統(tǒng)可以配置crash自動生成dump文件。但是有些情況比如部署在iis上web服務(wù)cpu飆到100%下不來導(dǎo)致為web停止服務(wù)。這個時候就需要我們手動提取dump文件了。
下面我們來模擬一下這種場景:
新建一個asp.net mvc程序
以上代碼 async/await會造成死鎖
我們用iis來啟動這個web應(yīng)用后頁面圈圈一直在轉(zhuǎn)網(wǎng)頁空白一片
打開Windows任務(wù)管理器找到w3wp
?
?
用vs打開這個dump文件 點(diǎn)擊調(diào)試后后
打開并行堆棧這個窗口
?
?
大家看會有很多分支,該從哪個開始分析呢,教大家一個小技巧,不知道如何下手的時候就選分支越長的!
??
從HomeController.Index進(jìn)來,停止在ManualResetEventSlim.Wait
死鎖原因:
?
?
總結(jié):
說到dump大家立馬可能想到的是windbg
但是windbg的各種命令對于新手們還是比較困難的,Vs工具也能幫助我們分析dump,能夠解決的問題也有很多
下一篇文章我將介紹內(nèi)存泄露dump分析的例子
原文地址:?https://www.cnblogs.com/yudongdong/p/9687320.html
.NET社區(qū)新聞,深度好文,歡迎訪問公眾號文章匯總 http://www.csharpkit.com
總結(jié)
以上是生活随笔為你收集整理的dump解析入门-用VS解析dump文件进行排障的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 张善友:自由之精神,中国之队长
- 下一篇: 微软发布Azure Pipelines,