告警系統郵件引擎, 運行告警系統
阿新 • • 發佈:2018-07-19
如果 ech mon 引擎 mail 運行 zabbix 小時 $1 告警系統郵件引擎
- 因為之前做zabbix的時候,做過mail.py的腳本,在這裏,直接復制到
mail目錄下就行 - 但是告警郵件引擎核心,conf主配置文件調用到的都是mail.sh ,所以這裏需要定義調用mail.py的sh腳本
- mail.sh目的是做告警收斂,如果不想做告警收斂,在發現問題的時候直接告警就好,但是,可能會發生1分鐘前發現問題,1分鐘戶問題解決,這樣就會變成誤報,這樣會很麻煩
- 收斂的目的就是1分鐘前發現問題,然後到10分鐘後,服務還沒有恢復,就會告訴管理人員10分鐘了服務還未恢復
#!/bin/bahs log=$1 t_s=`date +%s` t_s2=`date -d "2 hours ago" +%s` #定義2個小時前的時間戳 #日誌不存在就創建日誌 if [ ! -f /tmp/$log ] then echo $t_s2 > /tmp/$log fi #下面這段,等同於一個計時器 t_s2=`tail -1 /tmp/$log|awk ‘{print $1}‘` echo $t_s>>/tmp/$log v=$[$t_s-$t_s2] //時間戳對比 echo $v #當結果大於3600秒,就會進行告警 if [ $v -gt 3600 ] then ./mail.py $1 $2 $3 echo "0" > /tmp/$log.txt //等同於計數器 else #不然就重新計數 if [ ! -f /tmp/$log.txt ] then echo "0" > /tmp/$log.txt fi nu=`cat /tmp/$log.txt` nu2=$[$nu+1] echo $nu2>/tmp/$log.txt if [ $nu2 -gt 10 ] then ./mail.py $1 "trouble continue 10 min $2" "$3" echo "0" > /tmp/$log.txt //郵件告警結束以後,重新開始計數 fi fi
運行告警系統
- 可以每分鐘執行一次主腳本來運行告警系統
crontab -e * * * * * cd /usr/local/sbin/mon/bin ; bahs main.sh
- 調試,監控發送郵件的部分,有三個參數(發給誰,郵件名稱,內容),參數之間盡量少用空格,因為mail.py發送郵件是以空格來定義三個參數的
告警系統郵件引擎, 運行告警系統