1. 程式人生 > >cpu滿問題分析

cpu滿問題分析

比較 計算器 printf 性能問題 分析 int 什麽 部署 問題

功能問題,通過日誌,單步調試相對比較好定位。

性能問題,例如線上服務器CPU100%,如何找到相關服務,如何定位問題代碼,更考驗技術人的功底。

做為開發人員,肯定會遇到這類問題,介紹一下分析CPU 100%的方法,先確認是那個進程耗CPU高,再確認進程中的那個線程,最後根據javacore找到對應的線程,看此線程執行什麽代碼。

題目

某服務器上部署了若幹tomcat實例,即若幹垂直切分的Java站點服務,以及若幹Java微服務,突然收到運維的CPU異常告警。

問:如何定位是哪個服務進程導致CPU過載,哪個線程導致CPU過載,哪段代碼導致CPU過載?

步驟一、找到最耗

CPU的進程

工具:top

方法

  • 執行top -c ,顯示進程運行信息列表
  • 鍵入P (大寫p),進程按照CPU使用率排序

圖示

如上圖,最耗CPU的進程PID為10765

步驟二:找到最耗CPU的線程

工具:top

方法

  • top -Hp 10765 ,顯示一個進程的線程運行信息列表
  • 鍵入P (大寫p),線程按照CPU使用率排序

圖示

如上圖,進程10765內,最耗CPU的線程PID為10804

步驟三:將線程PID轉化為16進制

工具:printf

方法:printf “%x\n” 10804

圖示

如上圖,10804對應的16進制是0x2a34,當然,這一步可以用計算器。

之所以要轉化為16進制,是因為堆棧裏,線程id是用16進制表示的。

步驟四:查看堆棧,找到線程在幹嘛

工具:pstack/jstack/grep

方法:jstack 10765 | grep ‘0x2a34’ -C5 --color

  • 打印進程堆棧
  • 通過線程id,過濾得到線程堆棧

圖示

如上圖,找到了耗CPU高的線程對應的線程名稱“AsyncLogger-1”,以及看到了該線程正在執行代碼的堆棧。

cpu滿問題分析