zabbix監控網卡流量的一些事情
對象:監控linux物理服務器的網卡流量情況
模板:采用之前同事留下的模板 Linux template for physical server ,網上也能搜到。
監控方式:自動發現
可以用zabbix_get -s hostname -p 10050 -k net.if.discovery 去獲取目標設備的所有信息。
此發現規則匹配的正則表達式為
正則表達式的內容可以在管理-一般-右上角選擇正則表達式查看。
默認的是^(eth0|eth1|eth2|eth3|bond0|bond1)$。就是匹配這5塊。eth0,1,2,3是單塊的網卡,bond是單塊網卡流量的2倍(具體為什麽,我也不了解)。也就是千兆的網卡,那麽做了bond後,就是2千兆。所有下面的閾值設置是按照bond給的。
模板的trigger設置的是
由於單塊網卡最大是千兆,所所以此閾值不適合eth0,1,2,3。
問題1:如何監控單塊網卡的流量,閾值設為600M
問題2:如何監控萬兆網卡的流量。
先說問題2,很簡單,就是將原模板克隆,將此發現裏面的閾值調整為10倍即可,即10000M和16000M。
再說問題1:首先是想著在模板上單獨建一個監控單一網卡如eth0的item,但是由於自動發現中會產生要監控的網卡eth0的item了,導致沒辦法新增或更新。
解決,1,首先更改正則表達式,建議新增一個,不要在原來的上面改動,以防有其它的模板也使用這個,會受到影響。
2, 然後將模板裏的自動發現中的過濾器的宏替換,那麽此模板只會發現bond0,1,觸發器也是針對的bond0,1.
3,在模板的item裏面新增item,如下
比著自動發現裏的item做就行。
4,新增對應的trigger
5,更新模板,過一會去查看是否都能采集到數據
補充下:item裏的設置
另外我在更新模板的時候有些報有些設備以及存在此item,無法更新:1個原因是調整完觸發器後,時間較短,自動發現還未更新數據,需要等待幾分鐘;2是有些添加了此模板的設備處於未監控狀態,你更改了1,未監控的設備不會再執行自動發現了,導致之前發現的item一直存在,需要把這些設備unlink掉模板即可。
zabbix監控網卡流量的一些事情