JVM致命錯誤日誌(hs_err_pid.log)解讀
致命錯誤出現的時候,JVM生成了hs_err_pid<pid>.log這樣的檔案,其中往往包含了虛擬機器崩潰原因的重要資訊。因為經常遇到,在這篇文章裡,我挑選了一個,並且逐段分析它包含的內容(檔案可以在文章最後下載)。預設情況下檔案是建立在工作目錄下的(如果沒許可權建立的話JVM會嘗試把檔案寫到/tmp這樣的臨時目錄下面去),當然,檔案格式和路徑也可以通過引數指定,比如:
1 |
java - XX :ErrorFile=/var/log/java/java_error%p.log
|
這個檔案將包括:
- 觸發致命錯誤的操作異常或者訊號;
- 版本和配置資訊;
- 觸發致命異常的執行緒詳細資訊和執行緒棧;
- 當前執行的執行緒列表和它們的狀態;
- 堆的總括資訊;
- 載入的本地庫;
- 命令列引數;
- 環境變數;
- 作業系統CPU的詳細資訊。
首先,看到的是對問題的概要介紹:
1 |
# SIGSEGV (0xb) at pc=0x03568cf4, pid=16819, tid=3073346448
|
一個非預期的錯誤被JRE檢測到,其中:
- SIGSEGV是訊號名稱
- 0xb是訊號碼
- pc=0x03568cf4指的是程式計數器的值
- pid=16819是程序號
- tid=3073346448是執行緒號
如果你對JVM有了解,應該不會對這些東西陌生。
接下來是JRE和JVM的版本資訊:
1 2 3 |
# JRE version: 6.0_32-b05 # Java VM: Java HotSpot(TM) Server VM (20.7-b02 mixed mode linux-x86 )
|
執行在mixed模式下。
然後是問題幀的資訊:
1 2 3 |
# Problematic frame:
# C [libgtk-x11-2.0.so.0+0x19fcf4] __float128+0x19fcf4
|
- C:幀型別為本地幀,幀的型別包括:
- C:本地C幀
- j:解釋的Java幀
- V:虛擬機器幀
- v:虛擬機器生成的存根棧幀
- J:其他幀型別,包括編譯後的Java幀
- libgtk-x11-2.0.so.0+0x19fcf4:和程式計數器(pc)表達的含義一樣,但是用的是本地so庫+偏移量的方式。
接下去第一部分是執行緒資訊:
1 |
Current thread (0x09f30c00): JavaThread "main" [_thread_in_native, id= 16822 , stack(0xb72a8000,0xb72f9000)]
|
當前執行緒的:
- 0x09f30c00:指標
- JavaThread:執行緒型別,可能的型別包括:
- JavaThread
- VMThread
- CompilerThread
- GCTaskThread
- WatcherThread
- ConcurrentMarkSweepThread
- main:名字
- _thread_in_native:執行緒當前狀態,狀態列舉包括:
- _thread_uninitialized:執行緒還沒有建立,它只在記憶體原因崩潰的時候才出現
- _thread_new:執行緒已經被建立,但是還沒有啟動
- _thread_in_native:執行緒正在執行原生代碼,一般這種情況很可能是原生代碼有問題
- _thread_in_vm:執行緒正在執行虛擬機器程式碼
- _thread_in_Java:執行緒正在執行解釋或者編譯後的Java程式碼
- _thread_blocked:執行緒處於阻塞狀態
- …_trans:以_trans結尾,執行緒正處於要切換到其它狀態的中間狀態
- id=16822:執行緒ID
- 0xb72a8000,0xb72f9000:棧區間
1 |
siginfo :si_signo = SIGSEGV : si_errno= 0 , si_code= 1 ( SEGV_MAPERR ), si_addr=0x00000010
|
這部分是導致虛擬機器終止的非預期的訊號資訊,含義前面已經大致提到過了。其中si_errno和si_code是Linux下用來鑑別異常的,Windows下是一個ExceptionCode。
1 2 3 |
EAX =0x00000000, EBX =0x0375dd84, ECX =0x00000000, EDX =0x00000000
ESP =0xb72f0fa0, EBP =0xb72f0fb8, ESI =0x00000000, EDI =0x0a6c1800
EIP =0x03568cf4, EFLAGS =0x00010246, CR2 =0x00000010
|
這是暫存器上下文。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
Top of Stack: (sp=0xb72f0fa0)
0xb72f0fa0: 00000000 00402250 0040217f 0375dd84
0xb72f0fb0: 00000000 0a6c1800 b72f0fe8 0356c2c0
0xb72f0fc0: 00000000 0a6c1800 b72f0fe8 003b3e77
0xb72f0fd0: 003e6c8b 0a1a70d0 0a193358 0375dd84
0xb72f0fe0: 0a276418 0a276418 b72f1048 03536c56
0xb72f0ff0: 0acad000 0b3ca978 0000000c 00dd0674
0xb72f1000: 00000003 0a2c7d50 b72f1038 0000330c
0xb72f1010: ffffffff ffffffff 00000001 00000001
Instructions: (pc=0x03568cf4)
0x03568cd4: 89 14 24 89 75 f8 89 d6 89 7d fc 89 c7 e8 7e 1b
0x03568ce4: ea ff 89 34 24 89 87 d4 02 00 00 e8 30 00 ea ff
0x03568cf4: 8b 40 10 89 3c 24 c7 44 24 08 00 00 00 00 89 87
0x03568d04: d0 02 00 00 8b 83 88 24 00 00 89 44 24 04 e8 dd
|
棧頂程式計數器旁的操作碼,它們可以被反彙編成系統崩潰前執行的指令。
1 2 3 4 5 6 7 8 9 10 |
Register to memory mapping:
EAX=0x00000000 is an unknown value
EBX=0x0375dd84: <offset 0x394d84> in
|