我們要監控的物件是什麼-IT監控系統系列
首先從大的分類來講:
1. 裝置物理監控系統
監視硬體裝置的物理健康特徵,如溫度、電壓、風扇工作狀態、電源狀態等;
2. 網路安全裝置
各大品牌的路由器、交換機、防火牆、IPS、IDS等;
3. 儲存裝置
磁碟陣列、光纖交換機;
4. 作業系統
AIX、BSD、HPUX、Linux、Solaris、Windows、虛擬化;
5. 系統軟體
各類資料庫、中介軟體、Web服務、DNS、AD、DHCP、儲存備份系統;
6. 應用系統
各類MIS、OA、Email、CRM、Web網站等;
7. 其他
其他還包括,動力環境監控,監控機房的溫度、溼度、漏水和精密空調等情況;UPS監控,監控UPS電影的電壓、溫度和供電時長等情況。
圖:監控分類圖
對於各種這種類別還有一個更細的分類,分類的維度稍有不同,列出了素有需要監控各個類別的明顯物件,如下圖:
圖:監控分類2
另外還要提到一個監控系統設計的重點,之前的監控系統只負責監控各類裝置是否允許正常,但實際上經常發生的情況是,終端使用者反映系統很慢或者根本訪問,但是各類IT的裝置都是執行正常的。因此我們監控系統從設計思路上進行一個轉變,就是已業務系統為核心的監控。
下面的圖我們看到一個最基本業務系統的情況:
業務業務系統為核心的監控是這樣的思路:
1. 業務系統響應情況監控,監控業務系統如OA的各個功能能否正常,有沒有不響應的;各個功能的響應時間是怎麼樣的,有沒有很慢;
2. 業務系統使用的資料庫和中介軟體情況效能如何,資料庫的使用者數、快取命中率、SQL語句的平均響應時間如何;
3. 與系統軟體管理的伺服器的情況,網路流量、CPU使用率、記憶體使用率、磁碟使用率等情況;
4. 與物理伺服器管理的網路裝置及其對應的埠是執行情況如何;
5. 與物理伺服器管理的儲存裝置效能情況,IOPS的情況,儲存還有多少空間,之後能否滿足業務的需求;
通過上面的內容,我們可以描繪出來,業務系統的響應情況不斷的有模擬使用者從不同的地方登入,監控它的響應情況,是否存在問題,如果發生問題,可以根據系統關係,關聯找出是哪些裝置或系統軟體出現問題,儘快在影響終端使用者之前解決響應的問題。
圖;業務系統監控圖