1. 程式人生 > >inux監控平臺搭建-監控項

inux監控平臺搭建-監控項

.com ios tel 應用層 時區 報警平臺 頻率 class 平臺服

linux監控平臺搭建-監控項

本人運維某生態互聯網監控平臺服務。過程中遇見了很多問題。目前互聯網有很多的開源監控工具:nagios、zabbix、falcon、cacti...各有優點。這裏不講解監控工具的優缺點。寫一些新搭建監控平臺。需要哪些監控項。避免監控一頭霧水。具體每個監控項會有若幹小項。

監控的簡單架構

技術分享圖片

具體一個機器監控項。基本就是下面的這些。盡量少的監控項,更加高效的分析報警

(1)首先一定是基礎的硬件層面(機器的的基礎組件)

ipmi 、監控cpu、溫度、卡槽、raid狀態、內存

技術分享圖片

(2)系統層面監控。(這裏只介紹linux的相關監控)

CPU、內存、連接數、網卡、磁盤、inode、系統負載、TCPEXT、遠控卡狀態、打開的文件數、磁盤只讀、進程數、swap讀寫頻率

采集系統信息:網絡上連、內存(廠商,型號,大小,個數)、磁盤(廠商,型號,大小,個數)、cpu(廠商,型號,大小,個數)

(3)基礎服務

日誌監控:系統日誌、基礎服務日誌、rsyslog、DNS檢查、ntp檢查時區、puppet自動化管理工具

(4)基礎操作與進程

端口,進程,登陸次數,密碼修改。使用人命令收集(保存7天)、cpu高的進程、連接數高的進程、內存高的進程

技術分享圖片

(5)應用層監控

mysql為例:cpu、磁盤、內存、日誌、連接數、隊列、鎖、操作頻率(增刪查改)

技術分享圖片

(6)補充監控

ping監控、web(http、https)監控,snmp監控,rpc接口監控、機器互相ping監控、telnet端口、系統基礎日誌分析

技術分享圖片

(7)報警平臺

報警平臺:郵件、短信、微信、電話

服務的日誌:采用的BI部門來分析。監控部門提供報警接口(采用token認證)

參考:

http://blog.51cto.com/asinego/1901154

inux監控平臺搭建-監控項