001.常見監控簡介 阿新 • • 發佈:2018-11-15 一 監控架構 1.1 組成 客戶端:資料採集部分 服務端:資料儲存分析告警展示 1.2 採集模式 被動模式:伺服器端到客戶端採集資料,對伺服器的開銷較大,適合小規模的監控環境。 主動模式:客戶端主動上報資料到伺服器端,對伺服器的開銷較小,適合大規模的監控環境。 1.4 協議 專用客戶端採集 公用協議採集:SNMP/SSH/Telnet 1.5 架構 C/S架構:被監控節點較少,產生的資料較少。 C/P/S架構:被監控節點較多,監控型別複雜,產生的資料和網路連線開銷很大,跨地域等環境下。 二 常見監控軟體 流量監控:MTRG、Cacti、SmokePing、Graphite等 效能告警:Nagios、Zabbix、Zenoss、Core、Ganglia、OpenTSDB等 三 常見監控內容 監控專案 描述 主機監控 CPU、記憶體、磁碟的剩餘空間/利用率和I/O、SWAP使用率、系統UP時間、程序數、負載 網絡卡監控 Ping的往返時間及包成功率、網絡卡流量,包括流入/流出量和錯誤的資料包數 檔案監控 監控檔案大小、Hash值,匹配查詢、字串存在與否 URL監控 監測制定URL訪問過程中的返回碼、下載時間及檔案大小,支援內容匹配 應用程式 埠和記憶體使用率、CPU使用率、服務狀態、請求數、併發連線數、 訊息佇列的位元組數、Client事務處理數、Service狀態等 資料庫 指定的表空間、遊標數、Session數、事務數、死鎖數、緩衝池命中率、庫Cache命中率、 當前連線數、程序的記憶體利用率等效能引數 日誌 錯誤日誌匹配,特定字串匹配 硬體 溫度、風扇轉速、電壓等 四 其他需求 4.1 時間需求 監控系統應根據實際情況,實時/非實時的採集和展示資料,包括歷史趨勢資料展示、分析,容量報表、可用性報告等。 4.2 告警需求 支援多種方式,郵件、簡訊、IM和其他介面,具有可定製化功能。 只是對告警內容分析自動處理,防止誤報、漏報、抖動等。