1. 程式人生 > >你不能錯過的十大網絡監控神器

你不能錯過的十大網絡監控神器

多個服務器 內部 停止 管理系 初始化 監測 點擊 底部 打印

  隨著網絡信息化應用項目的不斷推進,許多公司或單位都已經積累了一定的網絡硬件設備數量,而這些網絡硬件設備根據不同的功能,會分散在不同的物理位置上,可能有些網絡硬件設備是集中式管理,而部分網絡硬件設備無法集中式管理,而只能采取分散性放置。這樣會給計算機網絡設備管理帶來一定的困難,因為一旦網絡設備出現故障,而不能準確及時有效的分析出網絡故障所處的位置,對於建立在網絡硬件設施基礎之上的網絡信息系統應用的影響是非常巨大的,所產生的後果也是非常嚴重的。所以,如何準確有效的獲取這些網絡基礎設備的運行狀態信息,方便快捷的監控網絡硬件設備的運行狀態已經是擺在網絡管理人員面前,亟需解決的一個大問題。

1、OpenNMS

  OpenNMS 是網絡管理系統Network Management System 的簡稱,是一種開源軟件網絡監視工具。可用來自動發現網絡節點,監控網絡服務,如 HTTP,DNS,SSH 等,當系統服務停止時,OpenNMS會依管理者所建立的規則寄出通知,告知運維人員網絡障礙,事件匯整,自動執行對應動作,以及服務層級效能監控。 它可以支持SNMP網絡管理協議,確保管理的擴展性,並且提供定制功能從而有利於管理範圍的伸縮,流量和接點系統硬件使用情況需要在配置snmp.

目前,OpenNMS專註以下三個方面:

  • 服務輪詢 - 檢查應用服務的可用性,產生可用性報表。
  • 數據收集 - 收集、保存和報表網絡信息數據,並設定和觸發門限值。
  • 事件和提示管理 - 接受事件系統內部的和外部的事件,將源事件提供給強大的故障告警和故障升級系統。

  OpenNMS缺少足夠的中文文檔和本土服務支持,目前漢化還有很長的一段距離要走。 而且對技術要求很高,一般運維人員要想用好難度很大。在使用的過程中會出現不能啟動現象,特別是關於SNMP問題的,一般需要關掉TRAP服務。

技術分享

2、SugarNMS

  SugarNMS智和網管平臺已經實現的包括設備拓撲、故障管理、性能管理、配置管理以及安全管理等基礎網管功能,采用了設備統一接入模型,全面監控網絡設備、主機/服務器、中間件應用、Web服務等。

技術分享

1.自動發現:在自動發現的過程中可搜索到網絡設備,並識別設備類型和廠商型號,生成設備的面板圖或搜索設備資源,如:板卡、端口、CPU、內存、磁盤等,並發現設備之間的鏈路關系。

2.拓撲管理:以具象化拓撲圖方式展示網絡設備及其連接關系,用戶可編輯。通過拓撲圖可以對設備、設備資源、連接進行管理。

技術分享

3.設備管理:通過拓撲視圖中,用戶可以方便的管理設備及其配置參數。

4.設備資源管理:支持在拓撲圖的基礎上,進一步展示設備細節,包括設備的物理組件,服務器上的服務(Web服務器、中間件應用服務、數據庫服務器、郵件服務器)或者用戶定義的其他監控對象。

5.連接管理:用戶可以通過拓撲視圖編輯連接,選擇連接實時顯示的性能數據項。

6.故障管理:可以收集多種故障信息,並及時的展現出來,通過設備、資源、連接可以查看到故障信息,也可以通過統一的故障管理界面管理故障。

技術分享

7.性能管理:全面采集或接收設備資源的多種新能數據,通過曲線圖、柱狀圖或表格等形象化的展示出來,按天、星期、月 查看性能指標變化。

8.安全管理:支持多種安全管理功能,如QOS安全策略、MAC-IP綁定、黑白名單以及準入控制等。

9.統計報表:支持多項數據的統計功能,讓用戶對網絡有一個全面直觀的了解放。支持將軟件中的統計圖表導出或打印,以便備份或對比查看。

技術分享

3、Nagios

  Nagios是一個開源服務器/網絡監控解決方案,為服務器、交換機、應用程序和服務提供完整的監控和報警機制。它有一個插件API,所以你可以擴展它的開箱即用的功能。Nagios可運行在Linux/Unix平臺之上,同時提供一個可選的基於瀏覽器的WEB界面以方便系統管理人員查看網絡狀態,各種系統問題,以及日誌等等。

Nagios的主要功能特點:

1.監視網絡服務 (SMTP, POP3, HTTP, NNTP, PING等)

2.監視主機資源 (進程, 磁盤等)

技術分享

3.簡單的插件設計可以輕松擴展Nagios的監視功能

4.服務等監視的並發處理

5.錯誤通知功能 (通過email, pager, 或其他用戶自定義方法)

6.可指定自定義的事件處理控制器

7.可選的基於瀏覽器的WEB界面以方便系統管理人員查看網絡狀態,各種系統問題,以及日誌等等

8.可以通過手機查看系統監控信息

技術分享

4、Collectd

  collectd是一個守護(daemon)進程,用來收集系統性能和提供各種存儲方式來存儲不同值的機制。比如以RRD 文件形式。當系統運行和存儲信息的時候,Collectd會周期性統計系統的相關統計信息。那些信息可以用來找到當前系統性能瓶頸。(如作為性能分析 performance analysis)和預測系統未來的load(如能力部署capacity planning).如果你需要美觀的圖形來顯示您的數據,並且已經厭煩了內部解決方案,恭喜您,你找到了正確的地方。

技術分享

collectd的強大之處在於其豐富的插件。在README文件中可以找到插件列表的描述。

  插件主要分為兩類:輸入和輸出

  輸入插件:用於周期性的查詢,通過某種方式查詢到想要得到的當前值提交給守護進程。比如,CPU插件讀取當前CPU計數器的各種參數(用戶,系統,nice等等)並派發這些值到守護進程

  輸出插件:從守護進程中取值處理。一般應用會寫到RRD文件和CSV文件,或者通過網絡發送數據到遠程盒子(a remote box)。

  當然並非所有插件都可以這樣劃分。比如,網絡插件(network plugin)可以發送(輸出)與接收(輸入)值。另外,該插件在初始化時啟動了一個socket端口,接收到數據後就發送數據,這一點不同於其他輸入插件。你可以理解為網絡插件是異步工作,這樣也很合理。

  除此之外,還有日誌插件(log)目前有兩個:logfile插件和syslog插件。通過這些插件,collectd可以提供給用戶解決方案的信息。你可以設置不同的log level。

  從版本4.3.0開始collectd支持了監測功能。這一點通過用戶定義閾值來實現。如果某個值超出了閾值範圍,通知將會被派發到通知插件(notification plugin)。

5、Monit

  Monit是一款功能非常豐富的進程、文件、目錄和設備的監測軟件,用於Unix平臺。它可以自動修復那些已經停止運作的程序,特使適合處理那些由於多種原因導致的軟件錯誤。Monit是一個跨平臺的用來監控Unix/linux系統(比如Linux、BSD、OSX、Solaris)的工具。Monit特別易於安裝,而且非常輕量級,並且不依賴任何第三方程序、插件或者庫。

技術分享

用monit來監控進程,尤其對監控守護進程很有用,比如在系統啟動時間啟動的 /etc/init.d,比如sendmail,ssh,apache,mysql等

1、你可以用Monit來監控files,directories,文件系統,monit可以監控這些項目的改變,比如時間戳,校驗和改變,文件大小改變,這樣比較安全,比如你改變了文件的內容,那麽它的md5或者sha1校驗碼不會改變。

2、monit可以監控到各種服務器的網絡鏈接,本地或者遠程,TCP還是UDP,Unix DomainSockets 都支持

3、monit可以用來在某些時候測試程序或者腳本,你可以測試程序的返回值,並以此為依據,進行一些必要的操作,比如執行某一個動作或者發送一個警報

4、Monit可以用來監控一般的系統資源,比如CPU使用,內存,以及負載均值(Load Acerage)

6、Cacti

  Cacti是一套基於PHP,MySQL,SNMP及RRDTool開發的網絡流量監測圖形分析工具。

  Cacti是通過 snmpget來獲取數據,使用 RRDtool繪畫圖形,而且你完全可以不需要了解RRDtool復雜的參數。它提供了非常強大的數據和用戶管理功能,可以指定每一個用戶能查看樹狀結 構、host以及任何一張圖,還可以與LDAP結合進行用戶驗證,同時也能自己增加模板,功能非常強大完善。界面友好。軟件 Cacti 的發展是基於讓 RRDTool 使用者更方便使用該軟件,除了基本的 Snmp 流量跟系統資訊監控外,Cacti 也可外掛 Scripts 及加上 Templates 來作出各式各樣的監控圖。

技術分享

  cacti是用php語言實現的一個軟件,它的主要功能是用snmp服務獲取數據,然後用rrdtool儲存和更新數據,當用戶需要查看數據的時候用rrdtool生成圖表呈現給用戶。因此,snmp和rrdtool是cacti的關鍵。Snmp關系著數據的收集,rrdtool關系著數據存儲和圖表的生成。

7、Icinga

  Icinga最開始是作為Nagios的分支,但最近被改寫為Icinga 2。這兩種版本都正在積極開發中,現在已經可用,Icinga 1.x向後兼容Nagios插件和配置。Icinga 2已經被開發為更小更時尚,它提供分布式監控和多線程框架,這是Nagios和Icinga 1中沒有的。你可以從Nagios遷移到Icinga 1,以及從Icinga 1到Icinga 2。

技術分享

  與Nagios一樣,Icinga可以用來監控任何使用IP通信的設備,正如你使用SNMP和定制插件及附件一樣。

  有幾個用於Icinga的Web用戶界面,與Nagios的主要區別是配置,其配置可以通過web用戶界面來進行,而不需要通過配置文件。對於喜歡管理配置而不是命令行的人,這是很好的優勢。

Icinga整合了各種圖形和監控軟件包,例如PNPP4Nagios、inGraph以及Graphite,提供堅實的性能可視化。Icinga還擴展了報表功能。

8、zabbix

  zabbix是一個基於WEB界面的提供分布式系統監視以及網絡監視功能的企業級的開源解決方案。能監視各種網絡參數,保證服務器系統的安全運營;並提供柔軟的通知機制以讓系統管理員快速定位/解決存在的各種問題。

技術分享

  zabbix server可以通過SNMP,zabbix agent,ping,端口監視等方法提供對遠程服務器/網絡狀態的監視,數據收集等功能,它可以運行在Linux, Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X等平臺上。  

  zabbix agent需要安裝在被監視的目標服務器上,它主要完成對硬件信息或與操作系統有關的內存,CPU等信息的收集。zabbix agent可以運行在Linux ,Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X, Tru64/OSF1, Windows NT4.0, Windows 2000/2003/XP/Vista)等系統之上。

技術分享

  zabbix server可以單獨監視遠程服務器的服務狀態;同時也可以與zabbix agent配合,可以輪詢zabbix agent主動接收監視數據(trapping方式),同時還可被動接收zabbix agent發送的數據(trapping方式)。

技術分享

9、Ganglia

  Ganglia是UC Berkeley發起的一個開源集群監視項目,設計用於測量數以千計的節點。Ganglia的核心包含gmond、gmetad以及一個Web前端。主要是用來監控系統性能,如:cpu 、mem、硬盤利用率,I/O負載、網絡流量情況等,通過曲線很容易見到每個節點的工作狀態,對合理調整、分配系統資源,提高系統整體性能起到重要作用。

技術分享

  每臺計算機都運行一個收集和發送度量數據的名為 gmond 的守護進程。接收所有度量數據的主機可以顯示這些數據並且可以將這些數據的精簡表單傳遞到層次結構中。正因為有這種層次結構模式,才使得 Ganglia 可以實現良好的擴展。gmond 帶來的系統負載非常少,這使得它成為在集群中各臺計算機上運行的一段代碼,而不會影響用戶性能。所有這些數據多次收集會影響節點性能。網絡中的 抖動”發生在大量小消息同時出現時,可以通過將節點時鐘保持一致,來避免這個問題。

技術分享

  gmetad可以部署在集群內任一臺節點或者通過網絡連接到集群的獨立主機,它通過單播路由的方式與gmond通信,收集區域內節點的狀態信息,並以XML數據的形式,保存在數據庫中。

10、Munin

  Munin是一個功能強大的服務器監控軟件,與傳統的服務器狀態監控軟件Nagios、cacti所不同的是,Munin不需要PHP、MysqL,沒有Web操作界面,更節省服務器資源,同時Munin又具備了自動采集數據並繪出圖像出來,簡單、方便、快捷。

技術分享

  Munin的主要優點就是它能夠同時提供收集信息和分析信息的功能,這樣你就無需在每個節點上安裝一個web服務器,並且詳細信息頁面底部的附加信息能夠幫助你獲取一些重要數據的統計信息。

  功能主要為收集和分析功能,這可以幫助你收集多個服務器信息並在一個中央服務器上分析所有收集到的信息,通過apt源或者yum源使其安裝和更新都相當簡單。當你訪問http://localhost/munin時,Munin會顯示一張概覽圖向你展示所有連接到的節點,包括到節點的具體功能,如磁盤、網絡、NFS和進程。點擊節點名稱會顯示兩行的圖表,每一行都會在左邊顯示每日統計信息,右邊顯示每周統計信息,點擊這些圖表能夠提供顯示某日、某月的詳細信息頁面。在這項細節信息頁面的底部,顯示的是關於數據的更加詳細的信息,包括不規則活動通知等。

技術分享

  Monit是一款運行於應用層功能非常豐富的用於對系統中的進程、文件、目錄、以及設備等進行監視和管理的工具。Monit 包含一個內嵌的 HTTPS Web 界面,可以使用瀏覽器方便地查看 Monit 所監視的服務器。Monit 對管理員來說可謂神器也。Monit可以自動修復那些已經停止運作的程序,特使適合處理那些由於多種原因導致的軟件錯誤。 Nagios 也就是在監控,而 Monit 不但本地監控,遠程服務監控。可以做到服務就永遠都能死而復生”,是服務一直在線。

技術分享

你不能錯過的十大網絡監控神器