1. 程式人生 > >運維之監控與安全篇------3.監控常用命令 、 Nagios監控

運維之監控與安全篇------3.監控常用命令 、 Nagios監控

準備一臺新的主機 配置要求如下:配置固定ip  192.168.4.11、 網路yum、永久關閉firewalldselinux、 下載軟體包

提供監控服務的軟體:nagios   cacti    zabbix 

監控目的:提前發現問題 報告系統執行狀況(吞吐量、反映時間、使用率)

監控物件: 伺服器----- 網站  資料庫  郵件  檔案

監控資源:web  ftp   ssh database tcp\udp

網路頻寬:  網路介面資料進出的流量

硬體資源使用情況: 儲存    cpu     記憶體 

應用服務的執行狀態: running   stop

伺服器系統執行情況: 程序數   使用者數量(系統總使用者數量 的登入使用者數量)

 netstat  -utnalp  | grep   httpd :80

 ps aux | grep httpd

 systemctl  status  httpd

 nmap做掃描

4監控的手段:

程序監控 ps top

儲存監控 : free swapon -s df -h

網路監控:ifconfig netstat ping taceroute

系統性能監控命令:

Vim /etc/sercvices  #服務的傳輸協議與埠號

4.1 使用對應的系統命令檢視

a.#uptime

 02:11:06 up  4:31,  1 user,  load average: 0.00, 0.01, 0.05

uptime命令能夠列印系統總共運行了多長時間和系統的平均負載。

uptime命令可以顯示的資訊顯示依次為:現在時間、系統已經運行了多長時間、目前有多少登陸使用者、系統在過去的1分鐘、5分鐘和15分鐘內的平均負載。

b.[[email protected] nagios-plugins-2.1.4]# free

              total        used        free      shared  buff/cache   available

Mem:        1016916      380452      114184       13240      522280      455764

Swap:       2097148         336     2096812

c.[[email protected] 桌面]# mpstat  #檢視cpu狀態

Linux 3.10.0-327.el7.x86_64 (room8pc205.tedu.cn)  20171029日  _x86_64_(4 CPU)

171441秒  CPU    %usr   %nice    %sys %iowait    %irq   %soft  %steal  %guest  %gnice   %idle

171441秒  all    9.71    0.09    1.27    2.78    0.00    0.04    0.00    0.57    0.00   85.54

%user      internal時間段裡,使用者態的CPU時間(%),不包含nice值為負程序  (usr/total)*100

%nice      internal時間段裡,nice值為負程序的CPU時間(%)   (nice/total)*100

%sys       internal時間段裡,核心時間(%)       (system/total)*100

%iowait    internal時間段裡,硬碟IO等待時間(%) (iowait/total)*100

%irq       internal時間段裡,硬中斷時間(%)     (irq/total)*100

%soft      internal時間段裡,軟中斷時間(%)     (softirq/total)*100

%idle      internal時間段裡,CPU除去等待磁碟IO操作外的因為任何原因而空閒的時間閒置時間(%) (idle/total)*1001.

 問:對於軟中斷,I/O操作是否是由核心中的I/O裝置驅動程式完成?

答:對於I/O請求,核心會將這項工作分派給合適的核心驅動程式,這個程式會對I/O進行佇列化,以可以稍後處理(通常是磁碟I/O),或如果可能可以立即執行它。通常,當對硬中斷進行迴應的時候,這個佇列會被驅動所處理。當一個I/O請求完成的時候,下一個在佇列中的I/O請求就會發送到這個裝置上。

2. 問:軟中斷所經過的操作流程是比硬中斷的少嗎?換句話說,對於軟中斷就是:程序 ->核心中的裝置驅動程式;對於硬中斷:硬體->CPU->核心中的裝置驅動程式

答:是的,軟中斷比硬中斷少了一個硬體傳送訊號的步驟。產生軟中斷的程序一定是當前正在執行的程序,因此它們不會中斷CPU。但是它們會中斷呼叫程式碼的流程。

d.[[email protected] 桌面]# vmstat  #檢視記憶體或磁碟狀態

procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----

 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st

 0  0      0 4780500   2052 5918124    0    0    35    68   95   77 10  1 86  3  0

表示執行佇列(就是說多少個程序真的分配到CPU),我測試的伺服器目前CPU比較空閒,沒什麼程式在跑,當這個值超過了CPU數目,就會出現CPU瓶頸了。這個也和top的負載有關係,一般負載超過了3就比較高,超過了5就高,超過了10就不正常了,伺服器的狀態很危險。top的負載類似每秒的執行佇列。如果執行佇列過大,表示你的CPU很繁忙,一般會造成CPU使用率很高。

表示阻塞的程序,這個不多說,程序阻塞,大家懂的。

swpd 虛擬記憶體已使用的大小,如果大於0,表示你的機器實體記憶體不足了,如果不是程式記憶體洩露的原因,那麼你該升級記憶體了或者把耗記憶體的任務遷移到其他機器。

free   空閒的實體記憶體的大小,我的機器記憶體總共8G,剩餘3415M

buff   Linux/Unix系統是用來儲存,目錄裡面有什麼內容,許可權等的快取,我本機大概佔用300M

cache cache直接用來記憶我們開啟的檔案,給檔案做緩衝,我本機大概佔用300M(這裡是Linux/Unix的聰明之處,把空閒的實體記憶體的一部分拿來做檔案和目錄的快取,是為了提高 程式執行的效能,當程式使用記憶體時,buffer/cached會很快地被使用。)

si  每秒從磁碟讀入虛擬記憶體的大小,如果這個值大於0,表示實體記憶體不夠用或者記憶體洩露了,要查詢耗記憶體程序解決掉。我的機器記憶體充裕,一切正常。

so  每秒虛擬記憶體寫入磁碟的大小,如果這個值大於0,同上。

bi  塊裝置每秒接收的塊數量,這裡的塊裝置是指系統上所有的磁碟和其他塊裝置,預設塊大小是1024byte,我本機上沒什麼IO操作,所以一直是0,但是我曾在處理拷貝大量資料(2-3T)的機器上看過可以達到140000/s,磁碟寫入速度差不多140M每秒

bo 塊裝置每秒傳送的塊數量,例如我們讀取檔案,bo就要大於0bibo一般都要接近0,不然就是IO過於頻繁,需要調整。

in 每秒CPU的中斷次數,包括時間中斷

cs 每秒上下文切換次數,例如我們呼叫系統函式,就要進行上下文切換,執行緒的切換,也要程序上下文切換,這個值要越小越好,太大了,要考慮調低執行緒或者程序的數目,例如在apachenginx這種web伺服器中,我們一般做效能測試時會進行幾千併發甚至幾萬併發的測試,選擇web伺服器的程序可以由程序或者執行緒的峰值一直下調,壓測,直到cs到一個比較小的值,這個程序和執行緒數就是比較合適的值了。系統呼叫也是,每次呼叫系統函式,我們的程式碼就會進入核心空間,導致上下文切換,這個是很耗資源,也要儘量避免頻繁呼叫系統函式。上下文切換次數過多表示你的CPU大部分浪費在上下文切換,導致CPU幹正經事的時間少了,CPU沒有充分利用,是不可取的。

us 使用者CPU時間,我曾經在一個做加密解密很頻繁的伺服器上,可以看到us接近100,r執行佇列達到80(機器在做壓力測試,效能表現不佳)

sy 系統CPU時間,如果太高,表示系統呼叫時間長,例如是IO操作頻繁。

id  空閒 CPU時間,一般來說,id + us + sy = 100,一般我認為id是空閒CPU使用率,us是使用者CPU使用率,sy是系統CPU使用率。

wt 等待IO CPU時間。

4.2  crond  執行監控指令碼

4.3  搭建監控伺服器,執行監控服務

+++++++++++++++++++++++++++++++++++++

Nagios簡介:監視系統和網路的開原應用軟體

--利用外掛實現對本機和遠端服務的監控

--監控異常,報警-

--自定義shell指令碼來監控服務

--通過web顯示物件狀態、日誌報警

Cacti簡介:基於LAMP展現的網路流量監測及分析工具

--資料採集:基於SNMP技術或自定義指令碼從目標裝置/主機獲取監控指標資訊

--資料儲存:通過RRDTool 繪製結果圖形

--資料展現:web展現

區別:cacti圖形化好;nagios:側重於監控應用狀態、故障分析、報警靈活

Zabbix簡介:是一個高度整合的監控解決方案

--實現企業級的開原分散式監控

--通過c/s模式採集監控資料

--通過B/S模式實現web管理

監控伺服器

:監控伺服器可以通過SNMPAgent採集資料

:資料可以寫入MYSQLOracle 等資料庫中

:伺服器使用LAMP實現WEB前端的管理

被監控主機

  :安裝Agent

:常見網路裝置支援SNMP

功能

:主機效能監控網路裝置監控、資料庫監控

:多種報警機制

:支援自動發現網路裝置和伺服器

:支援分散式、能集中展示、管理分散式的監控

:編寫外掛容易,可自定義監控項

:具有實時繪圖功能

搭建nagios監控伺服器(192.168.4.11

部署nagios服務的執行環境

#yum  -y  install   http   php gd  gcc gcc-c++ glibc glibc-common  #安裝

GD庫是php處理圖形的擴充套件庫,GD庫提供了一系列用來處理圖片的API,使用GD庫可以處理圖片,或者生成圖片,也可以給圖片加水印。

GCCGNU Compiler CollectionGNU編譯器套件),是由 GNU 開發的程式語言編譯器。它是以GPL許可證所發行的自由軟體,也是 GNU計劃的關鍵部分。GCC原本作為GNU作業系統的官方編譯器,現已被大多數類Unix作業系統(如LinuxBSDMac OS X等)採納為標準的編譯器,GCC同樣適用於微軟的Windows[2]  GCC是自由軟體過程發展中的著名例子,由自由軟體基金會以GPL協議釋出。

glibc是GNU釋出的libc庫,即c執行庫。glibc是linux系統中最底層的api,幾乎其它任何執行庫都會依賴於glibc

#rpm  -q  httpd  php   php gd  gcc  gcc-c++  glibc gblic-common

#systemctl   start httpd                                      #起服務

#systemctl   enable httpd

#vim  /var/www/html/test.php                                 #寫測試指令碼

<?php

echo  "hello wrold";

?>

:wq

#yum  -y  install elinks 

             hello wrold

254# firefox  http://192.168.4.11/test.php

                    hello wrold

2安裝軟體包

2.1安裝準備

gcc、gcc-c++  因為安裝的是原始碼包,所以需要安裝他們。

[[email protected] ~]# yum -y install  gcc gcc-c++ 

[[email protected] ~]# useradd nagios   #建立使用者

[[email protected] ~]# groupadd nagcmd  #建立組

[[email protected] ~]# usermod -G nagcmd nagios  #把使用者新增到組裡。

2.2裝包

用不同的命令裝不同的程式.

[[email protected] ~]tar -zxvf nagios-4.2.4.tar.gz

[[email protected] ~]# cd nagios-4.2.4/

[[email protected] nagios-4.2.4]# ./configure --help  #檢視幫助資訊。

[[email protected]]#./configure --with-nagios-user=nagios --with-nagios-group=nagcmd --with-command-user=nagios --with-command-group=nagcmd   #指定使用者名稱、使用者組

[[email protected] nagios-4.2.4]# make all  #編譯

[[email protected] 5 nagios-4.2.4]# make install  #安裝程式

[[email protected] 5 nagios-4.2.4]# make install-init  #安裝控制指令碼

[[email protected] 5 nagios-4.2.4]# make install-commandmode #調許可權

[[email protected] 5 nagios-4.2.4]# make install-config #安裝配置

[[email protected] 5 nagios-4.2.4]# make install-webconf #部署網站配置

[[email protected] 5 nagios-4.2.4]# make install-exfoliation 

[[email protected] nagios-4.2.4]# ls /usr/local/nagios/

          bin  etc  libexec  sbin  share  var

目錄檔案的作用:

bin:可執行命令

etc :配置檔案        .cfg結尾的檔案

libexec:監控外掛      軟體裡面提供的命令就是外掛 

sbin:cgi檔案         .cgi結尾的檔案,實現功能的指令碼

share :HTML網頁檔案  .html .php結尾的檔案

var :日誌檔案         變化的資料

2.3安裝監控外掛:nagios-plugins-2.1.4.tar.gz

[[email protected] ~]# tar -zxvf nagios-plugins-2.1.4.tar.gz

[[email protected] ~]# cd nagios-plugins-2.1.4/

[[email protected] nagios-plugins-2.1.4]# ./configure

[[email protected] nagios-plugins-2.1.4]#make 

[[email protected] nagios-plugins-2.1.4]# make install

[[email protected]]#ls /usr/local/nagios/libexec/check_*

2.4啟動服務

2.4.1 修改配置檔案,設定訪問監控頁面的使用者名稱(nagiosadmin)和密碼

[[email protected] ~]#cat  /etc/httpd/conf.d/nagios.conf

[[email protected] ~]# vim /etc/httpd/conf.d/nagios.conf 

 #檔案裡定義了網頁檔案的目錄和訪問許可權

[[email protected] ~]# htpasswd -c /usr/local/nagios/etc/htpasswd.users   

            nagiosadmin         #建Web管理使用者名稱 密碼

               New password:  #輸入密碼 2次

[[email protected] ~]# cat /usr/local/nagios/etc/htpasswd.users

nagiosadmin:$apr1$zREfnOjO$yR.c.eA98zvQBbYhzmEHE0 

 使用者名稱    :     密碼

[[email protected] ~]# systemctl restart httpd  #啟動Web服務

[[email protected] ~]# /etc/init.d/nagios start #啟動nagios服務

預設就監控本機,監控物件時哪些?

cpu負載    check_load

系統登入使用者數量   check_users

網站伺服器執行狀態 check_http

ping  check_ping

根分割槽使用量   check_disk

ssh服務執行狀態  check_ssh 

交換分割槽使用量  check_swap

系統總程序數量  check_procs

2.6 nagios服務的監控過程?

服務執行時,載入配置檔案,在配置檔案中呼叫監控外掛,呼叫監控外掛

時,設定監控閥值“ 警告值”和 “錯誤值”,把監控到的資料和設定的警告值 、錯誤值比較,安裝如下規律顯示監控狀態:

監控到的資料  <  警告值  顯示狀態是   ok 

監控到的資料  >   警告值   and  <   錯誤值   顯示狀態是   warning

監控到的資料  >    錯誤值   顯示狀態是   critical

正在獲取資料  顯示狀態是   pending

監控項配置錯誤  顯示狀態是 unknown

2.7 使用監控外掛 /usr/local/nagios/libexec/

格式:./外掛名   --help       #檢視外掛的幫助資訊

[[email protected] ~]# cd /usr/local/nagios/libexec/

[[email protected] libexec]# ./check_users  -w   3    -c   5

#dd  if=/dev/zero  of=/boot/test.txt  bs=1M  count=200 

df -h 

./check_disk  -w  25%  -c  10%  -p  /boot

./check_disk  -w  25%  -c  10%  -p  /

./check_procs  -w   50  -c  60

./check_procs  -w   50  -c  60   -s  R

./check_procs  -w   50  -c  60   -s  Z

./check_procs  -w   100  -c  101

./check_ssh   -H  192.168.4.254 

./check_ssh   -H  192.168.4.254  -p  2212

./check_http   -H  192.168.4.254 

./check_http   -H  192.168.4.254  -p  8080

./check_tcp     -H  192.168.4.254  -p  25

./check_tcp     -H  192.168.4.254  -p  3306

./check_ping  -H 192.168.4.254 -w  10.0,30% -c 20.0,40%  -p 2 -t 5

配置檔案說明  cd  /usr/local/nagios/etc/

cgi.cfg           設定cgi檔案訪問許可權

nagios.cfg     服務主配置檔案

resource.cfg  巨集定義檔案(定義服務使用的變數)

ls  objects/

commands.cfg    定義監控命令配置檔案(定義使用的監控外掛)

contacts.cfg        定義接收報警郵件郵箱地址的配置檔案

localhost.cfg       監控本機配置檔案  

timeperiods.cfg   定義"監控時間模板"檔案配置檔案

templates.cfg      定義"監控模板"配置檔案  

windows.cfg  監控Windows作業系統伺服器配置檔案

switch.cfg  監控交換機配置檔案

printer.cfg  監控印表機配置檔案

commands.cfg  定義監控命令的語法格式:

   define  command {

          command_name   命令名

          command_line       $USER1$/監控外掛名  引數

   }

local.cfg 監控主機配置檔案的語法格式

定義被監控主機的ip地址

define host {

use   監控模板

host_name   主機名

alias              描述資訊

   address        IP地址   

}

定義監控物件

define service {

                  use   監控模板

host_name   主機名

service_description   描述資訊

                  check_command     監控命令

}

3 配置

3.1 監控本機

要求如下:

修改監控登入系統使用者數量的值 > 1 警告狀態   > 2 錯誤狀態

不監控交換分割槽

監控本機引導分割槽

監控本機ftp服務的狀態

監控本機執行程序的數量

1 定義監控命令

[[email protected] 5 ~]# cd /usr/local/nagios/etc/objects/

[[email protected] 5 objects]# vim commands.cfg 

define command {

        command_name check_local_boot

        command_line $USER1$/check_disk -w 30%  -c 15%  -p /boot

}

define command {

        command_name  check_local_ftp

        command_line  $USER1$/check_ftp  -H localhost

}

define command {

        command_name check_local_rpoce

        command_line /usr/local/nagios/libexec/check_procs -w $ARG1$ -c $ARG2$  -s $ARG3$

}

2 在監控主機的配置檔案裡呼叫監控命令

# vim /usr/local/nagios/etc/objects/localhost.cfg

#define service{    #註釋掉此模組的內容

     use   local-service         ; Name of service template  to use

       host_name                       localhost

       service_description             Swap Usage

#check_command                   check_local_swap!20!10

       }

define service{

        use       local-service         ; Name of service template to use

        host_name                       localhost

        service_description             Current Users

        check_command                   check_local_users!1!2

        }

define service{

        use                             local-service

        host_name                       localhost

        service_description             boot

        check_command                  check_local_boot

        }

define service{

        use                             local-service

        host_name                       localhost

        service_description             ftp

        check_command                   check_local_ftp

        }

define service{

        use                             local-service

        host_name                       localhost

        service_description             runnig_process

        check_command                   check_local_rpoce!50!51!R

        }

3 驗證配置是否正確

# /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg

#檢查主配置檔案是否有語法錯誤   0是沒有錯誤 

4 重啟服務

#/etc/init.d/nagios  stop

#/etc/init.d/nagios  start

5 登入管理頁面檢視監控資訊

http://192.168.4.5/nagios

6 若有 警告狀態或錯誤狀態的監控項時,檢視是否收到報警郵件

#su  - nagios

#mail

:124,129s/^/#/  # 一起註釋掉多行。

3.2 監控遠端主機 192.168.4.10

3.2.1 監控公有資料

要求:

讓監控伺服器192.168.4.5  監控主機192.168.4.10 網站服務的執行狀態。

1.在主配置檔案裡新增監控新主機的配置檔案

[[email protected] ~]# vim  /usr/local/nagios/etc/nagios.cfg 

cfg_file=/usr/local/nagios/etc/objects/web10.cfg

2 .編寫監控新主機的配置檔案

[[email protected] ~]#cd /usr/local/nagios/etc/objects

[[email protected] objects]# vim  web10.cfg

define host{

        use                     linux-server 

        host_name               web10

        alias                   web10

        address                 192.168.4.10

        }

define service{

        use                             local-service 

        host_name                       web10

        service_description             httpd

check_commandcheck_10_http

        }

3  定義監控主機時,使用的監控命令

vim /usr/local/nagios/etc/objects/commands.cfg

define command {

command_name check_10_http

command_line /usr/local/nagios/libexec/check_http -H 192.168.4.10

}

4  驗證配置

# /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg

5  重啟服務

#/etc/init.d/nagios  stop

#/etc/init.d/nagios  start

6   登入管理頁面檢視監控資訊

3..2.2 監控私有資料

要求:監控遠端主機192.168.4.10的系統執行情況:

系統登陸使用者數量

系統程序數量:在正執行狀態的、殭屍狀態的、 休眠狀態的、 總程序數量

儲存空間的使用:根分割槽、引導分割槽

1.客戶端配置192.168.4.10

A.安裝監控外掛

支援外掛的軟體包:nagios-plugins-2.1.4.tar.gz

[[email protected] 桌面]# scp nagios-plugins-2.1.4.tar.gz 192.168.4.99:/root/

#rpm -q gcc gcc-c++ ||yum -y install gcc gcc-c++  #安裝軟體

[[email protected] ~]# tar -zxvf nagios-plugins-2.1.4.tar.gz

[[email protected] ~]# cd nagios-plugins-2.1.4/

[[email protected] nagios-plugins-2.1.4]# ./configure

[[email protected] nagios-plugins-2.1.4]# make

[[email protected] nagios-plugins-2.1.4]# make install

[[email protected] nagios-plugins-2.1.4]# ls /usr/local/nagios/

include  libexec  share

[[email protected] nagios-plugins-2.1.4]# ls /usr/local/nagios/libexec/check_*

#/usr/local/nagios/libexec/check_users -w 1 -c 3

#/usr/local/nagios/libexec/check_procs -w 50 -c 51 -s R

#/usr/local/nagios/libexec/check_procs -w 10 -c 11 -s S

#/usr/local/nagios/libexec/check_procs -w 5 -c 6 -s Z

#/usr/local/nagios/libexec/check_procs -w 100 -c 101

#/usr/local/nagios/libexec/check_disk  -w  20%  -c   10%   -p  /

#/usr/local/nagios/libexec/check_disk  -w  10%  -c   5%   -p  /boot

B.執行nrpe服務

[[email protected] nrpe-3.0.1]# ls docs/

NRPE.odt  NRPE.pdf

[[email protected] nrpe-3.0.1]# scp docs/NRPE.pdf 192.168.4.254:/root/桌面

[[email protected] 桌面]# scp nrpe-3.0.1.tar.gz 192.168.4.99:/root/

Nrpe:此服務用來

openssl openssl-devel  :提供加密程式軟體包

[[email protected] ~]# rpm -q openssl openssl-devel  #檢視安全的軟體包是否安裝

[[email protected] ~]# yum -y install  openssl openssl-devel

[[email protected] ~]# useradd nagios  #建立程序執行的所有者

[[email protected] ~]# tar -zxvf nrpe-3.0.1.tar.gz

[[email protected] ~]#cd nrpe-3.0.1/

[[email protected] nrpe-3.0.1]# ./configure

[[email protected] nrpe-3.0.1]# make all

[[email protected] nrpe-3.0.1]# make  #檢視幫助資訊

[[email protected] nrpe-3.0.1]# make install-daemon

[[email protected] nrpe-3.0.1]# make install-config

[[email protected] nrpe-3.0.1]# make install-plugin

[[email protected] nrpe-3.0.1]# make install-init

2.修改配置檔案

格式:287 command[名程]=外掛 引數

監控伺服器 :預設是允許127.0.0.1地址訪問

[[email protected] ~]# vim /usr/local/nagios/etc/nrpe.cfg 

293 command[nrpe_10_user]=/usr/local/nagios/libexec/check_user -w 1 -c 3

    #總程序數量 

294 command[nrep_10_proces_r]=/usr/local/nagios/libexec/check_procs -w 50 -c 51 -s R   #正執行狀態

295 command[nrep_10_proces_s]=/usr/local/nagios/libexec/check_procs -w 10 -c 11 -s S   #休眠狀態 

296 command[nrecp_10_proces_Z]=/usr/local/nagios/libexec/check_procs -w 5 -c 6  -s Z   #殭屍狀態、

297 command[nrecp_10_disk_root]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /   #磁碟/root

298 command[nrecp_10_disk_boot]=/usr/local/nagios/libexec/check_disk -w 10% -c 5%  -p /boot  # 引導檔案/boot

 98行 allowed_hosts=127.0.0.1,192.168.4.100  #新增指定的IP地址

3.啟動服務

[[email protected] ~]# systemctl start nrpe

[[email protected] ~]# systemctl enable nrpe

[[email protected] ~]# netstat -utnalp |grep :5666

4.測試配置

[[email protected] ~]# /usr/local/nagios/libexec/check_nrpe --help #檢視幫助資訊

[[email protected] ~]# /usr/local/nagios/libexec/check_nrpe -H 127.0.0.1 -p5666  -c nrpe_10_proces_sum

NRPE: Command 'nrpe_10_proces_sum' not defined

2.監控伺服器配置192.168.4.5

安裝連線nrpe服務的外掛 nrpe-3.0.1.tar.gz

[[email protected] 5 ~]# rpm -q openssl openssl-devel

[[email protected] 5 ~]# yum -y install openssl-devel

[[email protected] 5 ~]# useradd nagios

[[email protected] 5 ~]# tar -zxvf nrpe-3.0.1.tar.gz 

[[email protected] 5 ~]# cd nrpe-3.0.1/

[[email protected] nrpe-3.0.1]# make all

[[email protected] nrpe-3.0.1]# make  #檢視幫助資訊

[[email protected] nrpe-3.0.1]# make install-daemon

[[email protected] nrpe-3.0.1]# make install-config

[[email protected] nrpe-3.0.1]# make install-plugin

[[email protected] nrpe-3.0.1]# make install-init

#ls /usr/local/nagios/libexec/check_nrpe

A.定義監控遠端主機私有資料的監控命令

# /usr/local/nagios/libexec/check_nrpe -H 192.168.4.10 -p 5666  -c nrpe_10_users

# cd /usr/local/nagios/etc/objects

[[email protected] 5 objects]# vim commands.cfg 

define command {

        command_name check_web10_user

        command_line /usr/local/nagios/libexec/check_nrpe -H 192.168.4.99  -p 5666 -c nrpe_10_users

}

B.在監控遠端主機的配置檔案裡新增新的監控項

# cd /usr/local/nagios/etc/objects

# vim web10.