運維監控篇(2)_Zabbix簡單的效能調優

阿新 • • 發佈：2019-01-19

Zabbix是一款高效能的分散式監控報警系統。比如現在常見的家用桌上型電腦配置處理器I5-3470、記憶體4GB1600MHz、硬碟7200rpm就能夠監控1000臺左右的HOST，是的沒錯Zabbix就是可以達到這樣的高效能。Zabbix執行時間長了會出現小小的瓶頸，小小瓶頸中最大的瓶頸是資料庫。怎樣解決瓶頸，提供一些可能的方法。

首先在zabbix-server上也裝上zabbix-agent，並啟用Template App Zabbix Server模板，監控zabbix-server服務內部的各項引數。啟用模板後會新增加相應的監控項item、圖形graph、觸發器trigger。

類似這樣的監控項會增加不少

新增加的圖形

類似這樣的觸發器也會增加很多

然後當Zabbix Server出現效能瓶頸的時候就會發出報警，根據觸發器的報警項，來更改zabbix-server的配置引數來適應當前工作環境環境。

下面分析可能出現的情景

1、關於 Zabbix data gathering process busy 問題（server收集資料時zabbix-server各個程序的效能監控）
監控項如下：

比如discoverer監控項報警：“Zabbix discoverer processes 75% busy”其實這時候檢視這項的監控圖或監控值可能達到了100%。
解決方法。編輯配置檔案/usr/local/zabbix/etc/zabbix-server.conf，將StartDiscoverers引數增大，預設為1,將該引數增大到合適的數值，比如5.然後重啟zabbix-server就好了，如果開啟discoverer服務程序的利用率還繼續飆高則繼續增大discoverer啟動程序數。

[[email protected]
 ~]

#vim
 /usr/local/zabbix/etc/zabbix-server.conf

StartDiscoverers=5

[[email protected]
 ~]

#/etc/init.d/zabbix_server
 restart

比如 ipmi pinger監控項報警：“Zabbix icmp pinger processes more than 75% busy”，同樣更改server的配置檔案，增大引數StartPingers，由預設的1改為合適的數值，比如5。然後重啟zabbix-server就好了。

[[email protected]
 ~]

#vim
 /usr/local/zabbix/etc/zabbix-server.conf

StartPingers=5

[[email protected]
 ~]

#/etc/init.d/zabbix_server
 restart

這個程序負載監控圖各個監控項對應配置檔案的引數和預設值如下，當某個程序負載過高時調整相應的值：

Zabbix
 busy trapper processes,

in


%                   StartTrappers=5

Zabbix
 busy poller processes,

in


%                      StartPollers=5

Zabbix
 busy ipmi poller processes,

in


%               StartIPMIPollers=0

Zabbix
 busy discoverer processes,

in


%                StartDiscoverers=1

Zabbix
 busy icmp pinger processes,

in


%              StartPingers=1

Zabbix
 busy http poller processes,

in


%                StartHTTPPollers=1

Zabbix
 busy proxy poller processes,

in


%              StartProxyPollers=1

Zabbix
 busy unreachable poller processes,

in


%    StartPollersUnreachable=1

Zabbix
 busy java poller processes,

in


%                 StartJavaPollers=0

Zabbix
 busy snmp trapper processes,

in


%            StartSNMPTrapper=0

Zabbix
 busy vmware collector processes,

in


%       StartVMwareCollectors=0

2、關於 Zabbix cache usage 問題（server各種快取資料空閒值的監控）
監控項如下：
這個快取監控圖各個監控項對應配置檔案的引數和預設值如下，當某項buffer不夠時增大容量到合適的值：

Zabbix-server:
 Zabbix trend write cache, %

free


TrendCacheSize=4M

Zabbix-server:
 Zabbix configuration cache, %

free


CacheSize=8M

Zabbix-server:
 Zabbix text write cache, %

free


HistoryTextCacheSize=16M

Zabbix-server:
 Zabbix

history


write cache, %

free


HistoryCacheSize=8M

Zabbix-server:
 Zabbix value cache, %

free


ValueCacheSize=8M

Zabbix-server:
 Zabbix vmware cache, %

free


VMwareCacheSize=8M

3、監控項Item得設定合適的資料取樣間隔interval，一般不要小於1分鐘，對於長時間不變的量如記憶體總大小、磁碟總大小等應該儘量間隔時間大點比如一天(1d)或一週(1w)。

4、實在Host太多，還能怎樣只能拆分架構，採用分散式架構減輕zabbix server 的壓力，將這些壓力分擔到proxy上去。

5、歷史資料是資料庫爆滿的主要原因。減少歷史資料的儲存時間，預設是90天，可以調成7天或更少，放心zabbix還儲存著趨勢資料，巨集觀上歷史資料不會丟。

6、對history型別的(history、history_uint等)大表進行拆分操作，關閉housekeeper禁止自動定期清除歷史記錄資料，因為對於資料庫特別是對於InnoDB引擎大資料刪除貌似很蛋疼。

運維監控篇(2)_Zabbix簡單的效能調優

運維監控篇(2)_Zabbix簡單的效能調優

運維監控篇(4)_Zabbix SNMP裝置監控

mysql簡單效能調優（一）

JVM效能調優2：JVM效能調優引數整理

Hbase 日常運維監控效能指標調優

運維監控大數據的提取與分析

linux雲自動化運維基礎知識2（系統的基本操作）

zabbix運維監控 (1)

IT運維監控解決方案介紹

寫了一款自動運維監控工具

Open-falcon運維監控系統——微信接口二次開發

運維監控三劍客之Nagios

Jenkins用HTTP Request Plugin插件進行網站的監控/加探針（運維監控）

談談運維監控選型以及設計思路

Linux運維入門～2.命令列使用技巧

運維監控-Open-Falcon實戰部署

陌生又神祕的運維首篇無厘頭分析

讓運維監控不再成為你的短板!

自動化運維之saltstack(2)

資訊系統運維入門篇

運維監控篇(2)_Zabbix簡單的效能調優

相關推薦