簡單幾步使用zabbix監控Linux物理服務器CPU溫度
阿新 • • 發佈:2018-02-05
前段時間 檢測 自定義監控 時也 故障 安裝 根據 nsa 其中 前段時間有個屬於筆者維護的小機房空調故障,溫度過高導致系統卡慢,多日無人發現。於是想著使用zabbix監控CPU溫度並設置告警閥值,同時也能監控到風扇異常、擋風板太臟空氣不暢、進程死鎖導致CPU使用率超高等異常,側面監控服務器多種異常狀況。
服務器有兩臺四路x86服務器,系統是CentOS,用到軟件lm_sensors。使用zabbix監控系統自定義監控項,采集監控數據並設置告警。下面詳細介紹。
為四個監控項分別添加觸發器,閥值根據歷史記錄或個人經驗自定義
服務器有兩臺四路x86服務器,系統是CentOS,用到軟件lm_sensors。使用zabbix監控系統自定義監控項,采集監控數據並設置告警。下面詳細介紹。
安裝 lm_sensors 並獲取CPU溫度
yum install lm_sensors 安裝後運行 sensors-detect 檢測內核模塊,在引導下直接enter,使用默認選項 檢測結束後運行 sensors ,可以看到每顆CPU每個核心的溫度
配置zabbix,自定義監控項、自定義模板、設置觸發器
修改客戶端配置文件zabbix_agentd.conf
第一次自定義監控時要設置 UnsafeUserParameters=1
在配置文件中添加一行:
UserParameter=get_temp_cpu[*],sensors|grep "Physical id $1"|cut -c 17-20
//字符串截取位置以系統返回的實際結果為準調整
重啟客戶端
新建模板,配置監控項,單位設置為℃
由於設置發現規則比較費事,就在這裏為四路服務器創建了四個監控項,兩路服務器另外復制出一份模板刪減或在主機配置裏關閉無用監控項。
在模板中配置觸發器
為四個監控項分別添加觸發器,閥值根據歷史記錄或個人經驗自定義
查看歷史監控數據
將模板應用到主機一段時間後可以查看到監控數據。如下圖所示,對其中一臺服務器做壓力測試期間,CPU溫度有明顯變化。
簡單幾步使用zabbix監控Linux物理服務器CPU溫度