運維監控篇(2)_Zabbix簡單的效能調優
Zabbix是一款高效能的分散式監控報警系統。比如現在常見的家用桌上型電腦配置處理器I5-3470、記憶體4GB1600MHz、硬碟7200rpm就能夠監控1000臺左右的HOST,是的沒錯Zabbix就是可以達到這樣的高效能。Zabbix執行時間長了會出現小小的瓶頸,小小瓶頸中最大的瓶頸是資料庫。怎樣解決瓶頸,提供一些可能的方法。
首先在zabbix-server上也裝上zabbix-agent,並啟用Template App Zabbix Server模板,監控zabbix-server服務內部的各項引數。啟用模板後會新增加相應的監控項item、圖形graph、觸發器trigger。
然後當Zabbix Server出現效能瓶頸的時候就會發出報警,根據觸發器的報警項,來更改zabbix-server的配置引數來適應當前工作環境環境。
下面分析可能出現的情景
1、關於 Zabbix data gathering process busy 問題(server收集資料時zabbix-server各個程序的效能監控)
監控項如下:
比如discoverer監控項報警:“Zabbix discoverer processes 75% busy”其實這時候檢視這項的監控圖或監控值可能達到了100%。
解決方法。編輯配置檔案/usr/local/zabbix/etc/zabbix-server.conf,將StartDiscoverers引數增大,預設為1,將該引數增大到合適的數值,比如5.然後重啟zabbix-server就好了,如果開啟discoverer服務程序的利用率還繼續飆高則繼續增大discoverer啟動程序數。
[[email protected]
~] #vim
/usr/local/zabbix/etc/zabbix-server.conf
StartDiscoverers=5
[[email protected]
~] #/etc/init.d/zabbix_server
restart
|
比如 ipmi pinger監控項報警:“Zabbix icmp pinger processes more than 75% busy”,同樣更改server的配置檔案,增大引數StartPingers,由預設的1改為合適的數值,比如5。然後重啟zabbix-server就好了。
[[email protected]
~] #vim
/usr/local/zabbix/etc/zabbix-server.conf
StartPingers=5
[[email protected]
~] #/etc/init.d/zabbix_server
restart
|
這個程序負載監控圖各個監控項對應配置檔案的引數和預設值如下,當某個程序負載過高時調整相應的值:
Zabbix
busy trapper processes, in
% StartTrappers=5
Zabbix
busy poller processes, in
% StartPollers=5
Zabbix
busy ipmi poller processes, in
% StartIPMIPollers=0
Zabbix
busy discoverer processes, in
% StartDiscoverers=1
Zabbix
busy icmp pinger processes, in
% StartPingers=1
Zabbix
busy http poller processes, in
% StartHTTPPollers=1
Zabbix
busy proxy poller processes, in
% StartProxyPollers=1
Zabbix
busy unreachable poller processes, in
% StartPollersUnreachable=1
Zabbix
busy java poller processes, in
% StartJavaPollers=0
Zabbix
busy snmp trapper processes, in
% StartSNMPTrapper=0
Zabbix
busy vmware collector processes, in
% StartVMwareCollectors=0
|
2、關於 Zabbix cache usage 問題(server各種快取資料空閒值的監控)
監控項如下:
這個快取監控圖各個監控項對應配置檔案的引數和預設值如下,當某項buffer不夠時增大容量到合適的值:
Zabbix-server:
Zabbix trend write cache, % free
TrendCacheSize=4M
Zabbix-server:
Zabbix configuration cache, % free
CacheSize=8M
Zabbix-server:
Zabbix text write cache, % free
HistoryTextCacheSize=16M
Zabbix-server:
Zabbix history
write cache, % free
HistoryCacheSize=8M
Zabbix-server:
Zabbix value cache, % free
ValueCacheSize=8M
Zabbix-server:
Zabbix vmware cache, % free
VMwareCacheSize=8M
|
3、監控項Item得設定合適的資料取樣間隔interval,一般不要小於1分鐘,對於長時間不變的量如記憶體總大小、磁碟總大小等應該儘量間隔時間大點比如一天(1d)或一週(1w)。
4、實在Host太多,還能怎樣只能拆分架構,採用分散式架構減輕zabbix server 的壓力,將這些壓力分擔到proxy上去。
5、歷史資料是資料庫爆滿的主要原因。減少歷史資料的儲存時間,預設是90天,可以調成7天或更少,放心zabbix還儲存著趨勢資料,巨集觀上歷史資料不會丟。
6、對history型別的(history、history_uint等)大表進行拆分操作,關閉housekeeper禁止自動定期清除歷史記錄資料,因為對於資料庫特別是對於InnoDB引擎大資料刪除貌似很蛋疼。
相關推薦
運維監控篇(2)_Zabbix簡單的效能調優
Zabbix是一款高效能的分散式監控報警系統。比如現在常見的家用桌上型電腦配置處理器I5-3470、記憶體4GB1600MHz、硬碟7200rpm就能夠監控1000臺左右的HOST,是的沒錯Zabbix就是可以達到這樣的高效能。Zabbix執行時間長了會出現小小的瓶頸,小小瓶頸中最大的瓶頸是資料庫。怎樣解
運維監控篇(4)_Zabbix SNMP裝置監控
支援SNMP協議的裝置有很多,比如交換機、Linux伺服器、印表機等大部分的網路裝置(聯網的裝置)。運維監控中最常見的就是交換機了(Linux伺服器採用Agent的方式監控),zabbix中監控SNMP裝置可以這樣整(以交換機為例)。 1、首先新增SNMP裝置,這裡主要是交換機,zabbix新增監控主機
mysql簡單效能調優(一)
以前都是做小專案,資料庫表的資料一般都不超過十萬條。最近接手一考試專案,個別表的資料已經超過四百萬的資料量。資料庫一直沒有優化過,所幸表字段不多,並沒有照成很大的隱患。藉此機會學習一下mysql的效能調優。 mysql讀取sql語句順序 一條sql語句經過機器解析,會分成若干
JVM效能調優2:JVM效能調優引數整理
關閉新生代收集擔保。 在一次理想化的minor gc中,Eden和First Survivor中的活躍物件會被複制到Second Survivor。然而,Second Survivor不一定能容納下所有從E和F區copy過來的活躍物件。為了確保minor gc能夠順利完成,GC需要在年老代中額外保留一塊
Hbase 日常運維監控效能指標調優
1.1監控Hbase執行狀況 1.1.1作業系統 1.1.1.1IO a.群集網路IO,磁碟IO,HDFS IO IO越大說明檔案讀寫操作越多。當IO突然增加時,有可能:1.compact佇列較大,叢集正在進行大量壓縮操作。 2.正在執行mapreduce作業 可以通過CDH前臺檢視整個叢集綜合的資料或進入指
運維監控大數據的提取與分析
monitor 運維監控 本文內容整理來自【敏捷運維大講堂】蔣君偉老師的線上直播分享。分別從以下3個維度來分享:1、雲時代監控分析的窘境;2、使用標簽標記監控數據的維度;3、監控數據應用場景。雲時代監控分析的窘境在虛擬化與容器技術廣泛應用的情況下,運維對象大規模地增長,監控平臺每天存儲的指標都以億計,
linux雲自動化運維基礎知識2(系統的基本操作)
linux運維切換用戶 如圖所示:在命令提示符之後輸入su - username 註意:高級用戶切換到低級用戶不需要密碼,低級用戶切換身份需要密碼。註意:此處密碼無回顯。2.虛擬控制臺:Ctrl+Alt+F(1|7) 進入圖形 Ctrl+Alt+F(2~6) 進入虛擬控制
zabbix運維監控 (1)
zabbix 監控一、監控概述1 分類:硬件監控 ----系統監控 ---- 應用監控 ---- 業務監控 ---- 安全監控 ---- 網絡監控 ----WEB監控 ---- 自動化監控 -----分布式監控 2 內容:磁盤容易壞、CPU(負載、用戶態及內核態、使用率) 、內存(使用率、尋址、大頁面內存)
IT運維監控解決方案介紹
rdquo one 雲監控 時間片 公眾 res 企業級 bat 效率 IT運維監控解決方案介紹 現狀 •小公司/ 創業團隊?< 500臺服務器規模? 開源方案:Zabbix、Nagios、Cacti…? 雲服務提供商:監控寶、on
寫了一款自動運維監控工具
signal 發送 監控 自動 cor 異常 硬盤 分發 tst AisinGioro 是一款自動運維監控工具,用於監控主機性能參數(心跳、CPU、內存、硬盤、網站連接數)、網絡連通性(Ping、Port、Http)、監控異常通知,基於B/S架構,主要技術 .Net/C#,
Open-falcon運維監控系統——微信接口二次開發
con 重寫方法 接口 ack sets image parse urlopen data 1、Open-falcon運維監控系統簡介 OpenFalcon是一款由小米運維團隊從互聯網公司的需求出發, 根據多年的運維經驗,結合市面上使用的一些運維監控系統的使用經驗和反饋,
運維監控三劍客之Nagios
操作系統 mar 瀏覽器 同時 ddc man pla dev group Nagios Nagios是一款LInux上成熟的監視系統運行狀態和網絡信息的開源IT基礎設施監控系統。Nagios能夠監控所指定的本地或遠程主機及服務,同時提供異常通知、事件處理等功能。它可以運
Jenkins用HTTP Request Plugin插件進行網站的監控/加探針(運維監控)
pla .org 需要 技術 通知 動作 設置 特定 name 使用的插件: 【HTTP Request Plugin】 思路: 說明:只能是網站是否正常打開,而不能是這個網站業務是否正常,如果是後者,則需要寫特定的接口進行請求處理。 1、通過插件,發送GET請求指定的UR
談談運維監控選型以及設計思路
size 文本 最好的 監控系統 nts centreon mys 現在 應用 運維行業有句話:“無監控、不運維”,是的,一點也不誇張,監控俗稱“第三只眼”。沒了監控,什麽基礎運維,業務運維都是“瞎子”。所以說監控是運維這個職業的根本。尤其是在現在DevOps這麽火的時候,
Linux運維入門~2.命令列使用技巧
這一節我們學習與linux互動的方式 作為一個windows的老使用者,初接觸linux系統,甚是不習慣,但是玩兩天,感覺這種輸程式碼,系統就會有回覆方式還是蠻有趣的, 甚至還能作出刪庫這種“有趣”的操作。。那麼廢話不多說,開始吧: 1.
運維監控-Open-Falcon實戰部署
運維監控-Open-Falcon實戰部署 作者:尹正傑 版權宣告:原創作品,謝絕轉載!否則將追究法律責任。 一. 二
陌生又神祕的運維首篇無厘頭分析
運維,一個看起來很陌生的詞語,這是什麼意思呢?運維,這裡指網際網路運維,通常屬於技術部門,與研發、測試、系統管理同為網際網路產品技術支撐的4大部門,這個劃分在國內和國外以及大小公司間都會多少有一些不同。那麼IT運維又是什麼意思呢?度娘是這麼解釋的。 &nbs
讓運維監控不再成為你的短板!
1.前言 隨間網際網路、雲端計算的飛速發展,越來越多的企業系統架構越來越複雜,且迭代的速度也為之迅速。隨著業務量、流量的增長,龐大的業務系統架構即將面臨一系列的問題,同時也是企業飛速發展所需解決的痛點。 複雜龐大的業務系統架構,給執行維護增加一定的難度與複雜度。 大量服
自動化運維之saltstack(2)
這次主要介紹saltstack的配置管理,這一部分在企業應用中比較重要,也經常用到。states是saltstack系統中的配置語言,在日常運維中需要編寫大量的states檔案,例如:建立使用者、安裝軟體、配置軟體、服務執行等。需要編寫一些"states sls"檔案。該檔案主要使用YAML語言,也可以支援使
資訊系統運維入門篇
I T行業幹了有17個年頭了,從最初的軟體開發到專案建設管理,到今天的資訊系統運維,基本沒有靜下心來總結一下,,年齡大了卻心越來越恐慌,恐慌到這麼多年沒有進步和成長的果實讓自己值得欣慰,趁現在還有點心思,今後堅持下去,定期發一些文章,不斷積累,今天總結一下資訊