1. 程式人生 > >zabbix使用之常用功能使用心得

zabbix使用之常用功能使用心得

ZABBIX 使用

Written by: Jane.Hoo

1.zabbix監控概念介紹

專案(iterm)定義收集被監控的資料項,如收集被監控機記憶體使用情況

應用集(application)一些專案的彙總,目錄與檔案的關係

觸發器(trigger)通過專案獲得的資料或通過計算來判斷主機狀態的定義

圖形(graph)通過專案獲得資料,以圖形方式展示

模板(template)可將專案,集合,觸發器,圖形彙總為一個模板,直接連線到一類主機,實現批量定義

主機(host)被監控物件,伺服器或其他網路裝置

主機組(host group)一類主機可以定義到一個主機組

動作(action)觸發器,自動發現或自動註冊狀態改變觸發的動作

自動發現(discovery)通過定義自動發現條件,配合動作批量加監控主機

維護(maintenace)定義主機什麼時候處於維護狀態

拓撲圖(map)可以繪畫出主機的拓撲

螢幕(screen)多種型別顯示到一個screen裡

IT服務(IT service)有時一臺主機宕掉可能不會影響服務,IT服務定義服務容忍額限度

儀表盤(dashboard)監控的整體狀態顯示

總覽(overview)顯示所有的機器的資料或者觸發器狀態

web:通過定義場景監控web伺服器

最新資料(last data)可檢視主機專案獲得的最新資料

事件(event)觸發器狀態改變的記錄

報表(reports)建立事件報表

資產記錄(Inventory)可以記錄相關伺服器的硬體資訊等

告警型別(media types)定義相關告警方式

2.configuration


2.1 Host groups         

Host groups、主機組,是主機的一個集合,定義主機組所包含的模板及主機列表。

注意點:1、建主機連結到主機組後,可以繼承主機組所包含的所有模板;

            2、一個主機可以隸屬於多個主機組;

            3、組名必須唯一,不得與其它組名重複;

            4、新建的組允許不包含任何模板和主機;

            5、zabbix內建的主機組不允許刪除;

            6、建議根據應用模組劃分主機組;

2.2 Templates

Templates 模板,一系列監控項、觸發器、圖、場景的集合

注意點:

1、  模板定義的時候可以定義此模板應用到哪些主機主和模板;模板修改後,對應的主機監控專案也會改變;

2、  模板定義時可以巢狀模板,巢狀模板是一個繼承的關係,會繼承被巢狀模板的所有子項;

3、   如果模板間有相互衝突的專案(使相同鍵值的專案),做相互關聯或一同應用到同一主機的時候,報錯。

4、  模板可以克隆,只需修改模板名稱就可以在其基礎上做修改,很快地完成一個新模板;完全克隆,比clone多一點東西,例如screen;

5、  Delete:刪除模板,如果主機有巢狀當前模板,那麼item依舊保留在主機上,主機不受影響;

6、  Delete and clear:刪除模板,如果主機有巢狀當前模板,那麼item也會被刪除掉;

7、  模板可以外部匯入也可以內部新建;

2.3 Hosts

Hosts是zabbix監控的基本載體,所有監控專案都是基於hosts的。

注意點:1、主機可以外部匯入也可以內部新建;

            2、主機名(hostname)不允許重複,由字母、下劃線、數字,標點符號組成,必須和客戶端配置檔案中的hostname保持一致;

            3、unlink:取消和模板的關聯,但是已有的監控專案不會刪除;

            4、unlink and clear: 取消和模板的關聯並刪除已有的監控專案;

            5、hostname必須與客戶端配置檔案內的hostname一致。
            但也可以通過在伺服器端的/etc/hosts檔案裡新增對應的ip 主機名配置,實現即使和客戶端hostname不一致也不影響監控,但此時hostname必須和伺服器端/etc/hosts中的hostname保持一致。

 
         

2.3.1 Items

Items可以在單臺機器上新增,也可以在templates上面新增,然後再通過模板連線到主機上。定義Items需要先定義key。

在zabbix agentd端檢視配置檔案zabbix_agentd.conf檢視記錄,如:

include=/usr/local/zabbix/etc/zabbix_agentd.conf.d/

修改對應目錄下的引數定義檔案:

----------------------------------------------------------------------------

|   key的格式為:UserParameter=,

|   key的組成:數字、字母、下劃線

|   傳遞引數UserParameter=wc[*],grep -c "$2" $1

|     zabbix_get -s 127.0.0.1 -k wc[/etc/passwd,root]

----------------------------------------------------------------------------

UserParameter=count.line.passwd,wc -l /etc/passwd|awk '{print $1}'

修改配置檔案後,需要重啟客戶端:

service zabbix_agentd restart

key建立成功後,通過如下命令來檢測:

zabbix_get -s 127.0.0.1 -k count.line.passwd

注意:1、可以定義該值得更新頻率(upate interval)、歷史資料保留天數,整體變化趨勢保留時間段;

         2、定義完成後,點選status啟動/禁用該監控項;

2.3.2 Triggers

Triggers是觸發器,當Items採集值滿足trigger觸發條件時,就會產生actions。每一個trigger必須對應一個trigger,但一個item可以對應多個trigger。通過設定多個trigger,實現觸發條件不同,達到不同級別的告警。

         Expression:選擇對應的item、觸發方式及觸發值

                     ---------------------------------------------------------------------------

                     |   last value 最近一次採集

                     |   maximal value for period of time:一段時間內的最大值

                     | sum(600) 600秒內所有值的和

                     | sum(#5)  最近5秒值得和  //可以用#表示一個變數有不同的意思

                     | last(#5)  返回第5個值

                     |avg,count,last,minand max 支援在某個時間段之前的。avg(1h,1d),

                     | 表示1小時之前的1天的平均值

                     | 觸發器表示式中支援單位符號,5m(分鐘)代替300s(秒)

                ----------------------------------------------------------------------------

         severity:告警級別

         注意:1、引用自template的trigger觸發值是不能單獨修改的,必須在template中修改,或是複製一個同樣的trigger再修改,然後禁用掉之前的。

2.3.3 Graphs

新建圖表選項的各項引數說明:
          

Items屬性展示:

          

在建立圖表的過程中,我們可以隨時預覽修改的配置圖表,點選標籤preview即可。備註:如果是template預覽時沒有意義的,畢竟沒有任何資料。關於觸發器限制:如果圖表的高度小於120畫素,那麼圖示上將不會展示觸發器相關資訊。

2.4 web

web monitoring 是用來監控web程式的,可以監控到web程式的下載速度、返回碼及響應時間,還支援一組連續的web動作作為一個整體來監控。

scenaria:必須選擇host後才能建立,zabbix的所有items都必須建立在hosts上

Application:選擇這個scenario所在的application組

Name:   scenario(方案)的名字

status:   預設為active

variables: 變數定義,這裡定義的變數可以在後續的steps中使用

steps: web程式的各個步驟,選擇add新增一個Login的step,來模擬使用者登入

         URL:監控的web頁面

         POST:傳遞給頁面的引數,多個引數用&相連

         Timeout:超時時間

         Required:頁面中能匹配到字元,匹配不到即認為錯誤

         Status codes:頁面返回碼

定義完成後,就可以在web頁面看到監控的狀態和圖示,可以給對應的scenaria建立對應的觸發器

2.4 Actions

action是告警動作,當觸發器條件被滿足時,就會執行指定的action

action支援如下事件:觸發器事件、發現事件、自動註冊時間、內部事件

action的conditions配置:

   ----------------------------------------------------------------------------------------

   |       Type of calculation:各種條件之間的關係

   |        condition:機器不在維護狀態

   |                   觸發器狀態為problems

   |   new condition:可以定位到某個、某些或全部觸發器

   ----------------------------------------------------------------------------------------

action的operations配置:

           

2.5 Medias

    一般使用scripts媒介,可以實現郵件、微信、簡訊告警方式

2.6 Users

         建立使用者時可以根據使用者的不同作用劃分到不同的組,media中天入告警接受地址及告警接受時間等資訊。

user:  使用者姓名、所屬組別、密碼、語言集、每頁顯示行數及首頁設定

media:一個使用者可以有多個媒介,接收地址,接收時間段,狀態

permissions: 對應主機組、主機、模板的讀寫許可權

2.6 Screens

將多種資訊放在一起展示,便於集中展示某個host的多個資訊,或者比較多個host的同一種資訊。這些資訊可以是graphs、maps、server infos等等,幾乎涵蓋zabbix所有的監控資訊。

         選擇建立幾行幾列的screens

         點選change,新增響應資訊,設定對齊方式

2.7 Maps

新增關於主機的拓撲圖,configuration-maps,在右上角可以create maps或者import map

建立圖中的+-可以增加主機,link說明主機的連線 情況。

2.8 Discovery

通過zabbix的discovery功能自動新增主機並附加相應模版到制定的主機組內

http://blog.chinaunix.net/uid-26204366-id-4318443.html