線上故障排查-記憶體佔用高
這篇主要分析高記憶體佔用故障的排查。
搞Java開發的,經常會碰到下面兩種異常:
1、java.lang.OutOfMemoryError: PermGen space
2、java.lang.OutOfMemoryError: Java heap space
要詳細解釋這兩種異常,需要簡單重提下Java記憶體模型。
Java記憶體模型是描述Java程式中各變數(例項域、靜態域和陣列元素)之間的關係,以及在實際計算機系統中將變數儲存到記憶體和從記憶體取出變數這樣的低層細節。
在Java虛擬機器中,記憶體分為三個代:新生代(New)、老生代(Old)、永久代(Perm)。
(1)新生代New:新建的物件都存放這裡
(2)老生代Old:存放從新生代New中遷移過來的生命週期較久的物件。新生代New和老生代Old共同組成了堆記憶體。
(3)永久代Perm:是非堆記憶體的組成部分。主要存放載入的Class類級物件如class本身,method,field等等。
如果出現java.lang.OutOfMemoryError: Java heap space異常,說明Java虛擬機器的堆記憶體不夠。原因有二:
(1)Java虛擬機器的堆記憶體設定不夠,可以通過引數-Xms、-Xmx來調整。
(2)程式碼中建立了大量大物件,並且長時間不能被垃圾收集器收集(存在被引用)。
如果出現java.lang.OutOfMemoryError: PermGen space,說明是Java虛擬機器對永久代Perm記憶體設定不夠。
一般出現這種情況,都是程式啟動需要載入大量的第三方jar包。例如:在一個Tomcat下部署了太多的應用。
從程式碼的角度,軟體開發人員主要關注java.lang.OutOfMemoryError: Java heap space異常,減少不必要的物件建立,同時避免記憶體洩漏。
現在以一個實際的例子分析記憶體佔用的故障排查。
通過top命令,發現PID為9004的Java程序一直佔用比較高的記憶體不釋放(24.7%),出現高記憶體佔用的故障。
想起上一篇線上應用故障排查之一:高CPU佔用介紹的PS命令,能否找到具體是哪個的執行緒呢?
ps -mp 9004 -o THREAD,tid,time,rss,size,%mem
遺憾的是,發現PS命令可以查到具體程序的CPU佔用情況,但是不能查到一個程序下具體執行緒的記憶體佔用情況。
只好尋求其他方法了,幸好Java提供了一個很好的記憶體監控工具:jmap命令
jmap命令有下面幾種常用的用法:
•jmap [pid]
•jmap -histo:live [pid] >a.log
•jmap -dump:live,format=b,file=xxx.xxx [pid]
用得最多是後面兩個。其中,jmap -histo:live [pid] 可以檢視當前Java程序建立的活躍物件數目和佔用記憶體大小。
jmap -dump:live,format=b,file=xxx.xxx [pid] 則可以將當前Java程序的記憶體佔用情況匯出來,方便用專門的記憶體分析工具(例如:MAT)來分析。
這裡詳細介紹下jmap -histo:live [pid] 命令:
從上圖可以看出,int陣列、constMethodKlass、methodKlass、constantPoolKlass都佔用了大量的記憶體。
特別是佔用了大量記憶體的int陣列,需要仔細檢查相關程式碼。
最後,總結下排查記憶體故障的方法和技巧有哪些:
1、top命令:Linux命令。可以檢視實時的記憶體使用情況。
2、jmap -histo:live [pid],然後分析具體的物件數目和佔用記憶體大小,從而定位程式碼。
3、jmap -dump:live,format=b,file=xxx.xxx [pid],然後利用MAT工具分析是否存在記憶體洩漏等等。