Code-zabbix:zabbix-3.4-快速入門
ylbtech-Code-zabbix:zabbix-3.4-快速入門 |
1.返回頂部 |
1 登陸和配置用戶
登陸Zabbix,以及在Zabbix內建立一個系統用戶。
用戶名:Admin 或者 admin
密碼 : zabbix
- 增加用戶
可以在 管理(Administration) → 用戶(Users)下 查看用戶信息。
點擊 創建用戶(Create user) 以增加用戶。
在添加用戶的表單中,確認將新增的用戶添加到了一個已有的用戶組,比如‘Zabbix administrators‘。
默認情況下,沒有為新增的用戶定義媒介(media,即通知發送方式) 。如需要創建,可以到 ‘媒介(Media)‘標簽下,然後點擊 增加(Add)。
- 增加權限
一個新用戶默認沒有權限訪問主機。在組(Groups)下,點擊用戶所在的組(這裏為‘Zabbix administrators‘),為用戶提升權限。在組的屬性表單下,點擊權限(Permissions)標簽。
為了使這個用戶對Linux servers組擁有只讀權限,點擊用戶組選擇欄位旁邊的選擇(Select)按鈕。
2 新建主機
Zabbix中的主機(Host)是一個你想要監控的網絡實體(物理的,或者虛擬的)。Zabbix中,對於主機的定義非常靈活。它可以時一臺物理服務器,一個網絡交換機,一個虛擬機或者一些應用。
- 增加主機
Zabbix中,可以通過配置(Configuration) → 主機(Hosts)菜單,查看已配置的主機信息。默認已有一個名為‘Zabbix server‘的預先定義好的主機。但我們需要學習如何添加另一個。
點擊 創建主機(Create host)以添加新的主機,這將向我們顯示一張主機配置表格。
至少需要填寫下列字段:
主機名稱(Host name)
輸入一個主機名稱,可以使用字母數字、空格、點”.“、中劃線”-“、下劃線”_“。
組
從右邊的選擇框中,選擇一個或者多個組,然後點擊 ? 移動它們到‘所在組(In groups)‘選擇框。
所有訪問權限都分配到主機組,而不是單獨的主機。這也是主機需要屬於至少一個組的原因。
IP地址
輸入主機的IP地址。註意如果這是Zabbix server的IP地址,它必須是Zabbix agent配置文件中‘Server’參數的值。
暫時保持其他選項的默認值。
當完成後,點擊添加(Add)。你可以在主機列表中看到你新添加的主機。
如果可用性(Availability)列中的ZBX圖標是紅色的,通信可能存在一些問題。將你的鼠標移動到上面查看錯誤信息。如果這個圖標是灰色的,說明目前狀態還沒更新。確認Zabbix server正在運行,同時過一會兒刷新這個頁面。
3 新建監控項
監控項是Zabbix中獲得數據的基礎。沒有監控項,就沒有數據——因為一個主機中只有監控項定義了單一的指標或者需要獲得的數據。
- 添加監控項
主機包含了所有的監控項。如果需要配置一個監控項的示例,我們需要前往 配置(Configuration) → 主機(Hosts) 並找到我們已創建的‘新主機(New host)‘。
在‘新主機(New host)‘行中,監控項(Items)的鏈接旁的數量會顯示為‘0‘。點擊這個鏈接,然後點擊創 建監控項(Create item),將會顯示一個監控項定義表格
對於監控項的示例,需要輸入以下必要的信息:
名稱(Name)
輸入 CPU Load 作為值。在列表中和其他地方,都會顯示這個值作為監控項名稱。
值(Key)
手動輸入 system.cpu.load 作為值。這是監控項的一個技術上的名稱,用於識別獲取信息的類型。這個特定值需要是Zabbix Agent預定義值重的一種。
信息類型(Type of information)
在此處選擇 Numeric (float)。這個屬性定義了想獲得數據的格式。
你也需要減少監控項歷史保留的天數,7或者14天。對於數據庫而言,最佳實踐是避免數據庫保留過多的歷史數據。
- 查看數據
當一個監控項定義完成後,你可能好奇它具體獲得了什麽值。前往 監控(Monitoring) → 最新數據(Latest data),點擊- other -前面的 + ,然後查看你之前定義的監控項和獲得的值。
同時,第一次獲得的監控項值最多需要60秒才能到達。默認情況下,這是服務器讀取變化後的配置文件,獲取並執行新的監控項的頻率。
如果你在‘變化(Change)’列中沒有看到值,可能到目前為止只獲得了一次值。等待30秒以獲得新的監控項值。
如果你在當前界面中沒有看到監控項的信息,請確認:
你輸入的監控項‘值(Key)‘ 和 ‘信息類型(Type of information)‘ 同截圖中的一致
agent和server都在運行狀態
主機狀態為‘監控(Monitored)‘並且它的可用性圖標是綠色的
監控項處於啟用狀態
- 圖表
當監控項運行了一段時間後,可以查看可視化圖表。 簡單圖表 適用於任何被監控的數值型(numeric)監控項,且不需要額外的配置。這些圖表會在運行時生成。
前往監控(Monitoring) → 最新數據(Latest data),然後點擊監控項後的‘圖表(Graph)‘鏈接以查看圖表。
4 新建觸發器
監控項只是用於收集數據。如果需要自動評估收到的數據,我們則需要定義觸發器。觸發器包含了一個表達式,這個表達式定義了數據的可接受的閾值級別。
如果收到的數據超過了這個定義好的級別,觸發器將被“觸發”,或者進入“異常(Problem)”狀態——從而引起我們的註意,讓我們知道有問題發生。如果數據再次恢復到合理的範圍,觸發器將會到“正常(Ok)”狀態。
- 添加觸發器
為監控項配置觸發器,前往 配置(Configuration) → 主機(Hosts),找到‘新增主機(New host)‘,點擊旁邊的 觸發器(Triggers) ,然後點擊創 建觸發器(Create trigger)。這將會像我們展現一個觸發器定義表單。
對於觸發器,有下列必填項:
名稱(Name)
輸入 CPU load too high on ‘New host‘ for 3 minutes 作為值。這個值會作為觸發器的名稱被現實在列表和其他地方。
表達式(Expression)
輸入:{New host:system.cpu.load.avg(180)}>2
值時觸發器的表達式。確認這個表達式輸入正確,包括所有的符號。此處,監控項值(system.cpu.load)用於指出具體的監控項。這個特定的表達式大致是說如果3分鐘內,CPU負載的平均值超過2,那麽就觸發了問題的閾值。你可以查看更多的觸發器表達式語法信息。
完成後,點擊添加(Add)。新的觸發器將會顯示在觸發器列表中。
- 顯示觸發器狀態
當一個觸發器定義完畢後,你可能想查看它的狀態。
前往 監控(Monitoring) → 觸發器(Triggers)以查看。3分鐘後(我們需要等待3分鐘以評估這個觸發器的3分鐘平均值),觸發器會在這裏顯示。應該會有一個綠色的‘OK‘在‘狀態(Status)‘列中閃爍。
閃爍意味著這個觸發器狀態最近30分鐘內發生過變化。
如果此處出現一個閃爍的紅色‘PROBLEM‘,顯然,這說明了CPU負載已經超過了你在觸發器裏定義的閾值級別。
5 獲取問題通知
當監控項收集了數據後,觸發器會根據異常狀態觸發報警。根據一些報警機制,它也會通知我們一些重要的事件,而不需要我們直接在Zabbix前端進行查看。
這就是通知(Notifications)的功能。E-mail是最常用的異常通知發送方式。我們將會學習如何配置e-mail通知。
- E-mail設置
Zabbix中最初內置了一些預定義的通知發送方式。E-mail 通知是其中的一種。
前往 管理(Administration) → 媒體類型(Media types),點擊預定義媒體類型列表中的 Email,以 配置E-mail。
根據你的環境,設置SMTP服務器,SMTP helo, SMTP e-mail的值。
‘SMTP email‘將作為Zabbix通知的‘發件人(From)‘地址。
一切就緒後,點擊 更新(Update)。
現在你已經配置了‘Email‘作為一種可用的媒體類型。一個媒體類型必須通過發送地址來關聯用戶(如同我們在配置一個新用戶]中做的]),否則它將無法生效。 === 新建動作 === 發送通知是Zabbix中[[manual:config:notifications:action|動作(actions)執行的操作之一。因此,為了建立一個通知,前往 配置(Configuration) → 動作(Actions),然後點擊 創建動作(Create action)。
在這個表單中,輸入這個動作的名稱。
{TRIGGER.STATUS} 和 {TRIGGER.NAME} 是宏(macros)或者變量,可以在Default subject 和 Default message 區域查看。會以實際的觸發器狀態和觸發器名稱的值替代。
在大多數簡單的例子中,如果我們不添加更多的指定條件,這個動作會在觸發器從 ‘Ok‘ 變為 ‘Problem‘是發生。
我們還需要定義這個動作具體做了什麽 —— 即在 操作(Operations) 標簽頁中執行的操作。點擊新建(New),將會打開一個操作表單。
這裏,在發送給用戶(Send to Users)塊中點擊添加(Add),然後選擇我們之前定義的用戶(‘user‘)。選擇‘Email‘作為Send only to的值。完成後,在操作明細區域中,點擊添加(Add)。
這是一個簡單的動作配置步驟,即點擊動作表單中的添加(Add)。
- 獲得通知
現在,發送通知配置完成,我們看看它如何將通知發送給實際接收人。為了實現這個目的,我們需要你主機的負載,這樣我們的觸發器才會被觸發,我們會收到異常通知。
打開主機的控制臺,並運行:
cat /dev/urandom | md5sum
你需要運行一個或者多個這樣的進程。
現在,前往監控(Monitoring) → 最新數據(Latest data),查看‘CPU Load‘的值是否已經增長。記住,為了使我們的觸發器觸發(fire),‘CPU Load‘的值需要在在3分鐘運行的過程中超過2。一旦滿足這個條件:
在監控(Monitoring) → 觸發器(Triggers)中,你會看到這個觸發器的狀態呈現一個綠色閃爍的‘Problem‘
你的e-mail中,會收到一個異常通知
如果通知功能沒有正常工作:
再次驗證e-mail設置和動作設置已經被正確配置
確認你創建的用戶對生成事件的主機至少擁有讀(read)權限。正如添加用戶步驟中提到的,‘Zabbix administrators‘用戶組中的用戶必須對‘Linux servers‘主機組(該主機所屬組)至少擁有讀(read)權限。
另外,你可以在報告(Reports) → 動作日誌(Action log)中檢查動作日誌。
6 新建模版
- 添加模版
開始使用模版,你必須先創建一個。在 配置(Configuration) → 模版(Templates)中,點擊 創建模版(Create template)。這將會像我們展現一個模版配置表格。
需要輸入以下必填字段:
模版名稱(Template name)
輸入一個模版名稱。可以使用數字、字母、空格及下劃線。
組(Groups)
從右邊的選擇框中選擇一個或者多個組,點擊 ? 移動它們到‘所在組(In groups)‘選擇框。模版必須屬於至少一個組。
完成後,點擊添加(Add)。你新建的模版可以在模版列表中查看。
你可以在這看到模版信息。但這個模版中沒有任何信息——沒有監控項、觸發器活著其他對象。
- 在模版中添加監控項
為了在模版中添加監控項,前往‘New host‘的監控項列表。在配置(Configuration) → 主機(Hosts),點擊‘New host’旁邊的監控項(Items)。
然後:
選中列表中‘CPU Load‘監控項的選擇框
點擊列表下方的復制(Copy)
選擇想要復制這個監控項的目標模版
監控項源地址 → 復制到新地址(主機監控,模板監控項都行)
你現在可以前往配置(Configuration) → 模版(Templates),‘新模版(New template)‘中會有一個新的監控項。
我們目前至創建了一個監控項,但你可以用同樣的方法在模版中添加其他的監控項,觸發器以及其他對象,直到完成滿足特定需求(如監控OS,監控單個應用)的完整的對象組合。
- 鏈接模版到主機
準備一個模版後,將它鏈接到一個主機。前往 配置(Configuration) → 主機(Hosts),點擊‘新主機(New host)‘打開表單,前往模版(Templates)標簽頁。
點擊鏈接新模版(Link new templates)旁邊的選擇(Select),在彈出的窗口中,點擊我們創建模版的名稱(‘New template‘),它會出現在鏈接新模版(Link new templates)區域,點擊添加(Add)。這個模版會出現在已鏈接模版(Linked templates)列表中。
點擊更新(Update)保存配置。現在,新模版及其所有的對象被添加到了主機。
你可能會想到,我們可以使用同樣的方法將模版應用到其他主機。任何在模版級別的監控項、觸發器及其他對象的變更,也會傳遞給所有鏈接該模版的主機。
鏈接預定義模版到主機
你可能註意到,Zabbix為各種操作系統、設備以及應用準備一些預定於的模版。為了快速部署監控,你可能會將它們中的一些與主機關聯。但請註意,一些模版需要根據你的實際環境進行合適的調整。比如:一些檢查項是不需要的,一些輪詢周期過於頻繁。
2、2.返回頂部 |
3.返回頂部 |
4.返回頂部 |
5.返回頂部 |
6.返回頂部 |
作者:ylbtech 出處:http://ylbtech.cnblogs.com/ 本文版權歸作者和博客園共有,歡迎轉載,但未經作者同意必須保留此段聲明,且在文章頁面明顯位置給出原文連接,否則保留追究法律責任的權利。 |
Code-zabbix:zabbix-3.4-快速入門