十七周一次課
阿新 • • 發佈:2018-07-11
domain then 默認 文件中 efault pwd discuz 子目錄 分隔符 20.20 告警系統主腳本
定義監控系統的各個目錄,然後再去定義主腳本,因為是分布式的,所以需要每一臺機器都需要定義,事先創建好各個腳本和各個目錄,隨後腳本直接拷貝過去即可,然後再去做一些更改
所有的shell腳本放到 /usr/local/sbin/ 目錄下,方便查找
切換到 /usr/local/sbin/ 目錄下,並創建子目錄
[root@aiker ~]# cd /usr/local/sbin/ [root@aiker sbin]# mkdir mon [root@aiker sbin]# cd mon [root@aiker mon]# ls [root@aiker mon]# mkdir bin conf shares log mail [root@aiker mon]# ls bin conf log mail shares [root@aiker mon]#
切換到 bin 目錄下(主腳本放在 bin 目錄下,主腳本作為一個入口,應該去判斷配置文件,查看某監控項目是否需要監控,還需調用各個需要監控的子腳本)
[root@aiker mon]# cd bin
[root@aiker bin]# ls
[root@aiker bin]# vim main.sh //main.sh內容
#!/bin/bash #Written by Aiker # 是否發送郵件的開關 export send=1 # 過濾ip地址 export addr=`/sbin/ifconfig |grep -A1 "eth0: "|awk ‘/inet/ {print $2}‘` dir=`pwd` # 只需要最後一級目錄名 last_dir=`echo $dir|awk -F‘/‘ ‘{print $NF}‘` # 下面的判斷目的是,保證執行腳本的時候,我們在bin目錄裏,不然監控腳本、郵件和日誌很有可能找不到 if [ $last_dir == "bin" ] || [ $last_dir == "bin/" ]; then conf_file="../conf/mon.conf" else echo "you shoud cd bin dir" exit fi exec 1>>../log/mon.log 2>>../log/err.log echo "`date +"%F %T"` load average" /bin/bash ../shares/load.sh #先檢查配置文件中是否需要監控502 if grep -q ‘to_mon_502=1‘ $conf_file; then export log=`grep ‘logfile=‘ $conf_file |awk -F ‘=‘ ‘{print $2}‘ |sed ‘s/ //g‘` /bin/bash ../shares/502.sh fi
20.21 告警系統配置文件
告警系統mon.conf mon.conf內容
## to config the options if to monitor ## 定義mysql的服務器地址、端口以及user、password to_mon_cdb=0 ##0 or 1, default 0,0 not monitor, 1 monitor db_ip=10.20.3.13 db_port=3315 db_user=username db_pass=passwd ## httpd 如果是1則監控,為0不監控 to_mon_httpd=0 ## php 如果是1則監控,為0不監控 to_mon_php_socket=0 ## http_code_502 需要定義訪問日誌的路徑 to_mon_502=1 logfile=/data/log/xxx.xxx.com/access.log ## request_count 定義日誌路徑以及域名 to_mon_request_count=0 req_log=/data/log/www.discuz.net/access.log domainname=www.discuz.net
20.22 告警系統監控項目
load.sh內容
#! /bin/bash
##Writen by Aiker##
load=`uptime |awk -F ‘average:‘ ‘{print $2}‘|cut -d‘,‘ -f1|sed ‘s/ //g‘ |cut -d. -f1`
if [ $load -gt 10 ] && [ $send -eq "1" ]
then
echo "$addr `date +%T` load is $load" >../log/load.tmp
/bin/bash ../mail/mail.sh [email protected] "$addr\_load:$load" `cat ../log/load.tmp`
fi
echo "`date +%T` load is $load"
load.sh分析:
[root@aiker conf]# uptime |awk -F ‘average:‘ ‘{print $2}‘ |cut -d , -f1 |sed ‘s/ //g‘ |cut -d . -f1
0
##獲取1分鐘的cpu負載;也可以用這個:uptime |awk -F ‘average: ‘ ‘{print $2}‘ |cut -d . -f1
##echo "$addr `date +%T` load is $load" >../log/load.tmp 這個tmp文件是發郵件的內容;
##/bin/bash 就是調用的郵件腳本,發郵件咯;
502.sh內容
#! /bin/bash
d=`date -d "-1 min" +%H:%M`
c_502=`grep :$d: $log |grep ‘ 502 ‘|wc -l`
if [ $c_502 -gt 10 ] && [ $send == 1 ]; then
echo "$addr $d 502 count is $c_502">../log/502.tmp
/bin/bash ../mail/mail.sh $addr\_502 $c_502 ../log/502.tmp
fi
echo "`date +%T` 502 $c_502"
502.sh解析:
echo "$addr `date +%T` load is $load" >../log/load.tmp
##以上是獲取前一分鐘的時間;(因為我們都是對前一分鐘的日誌進行分析的)
c_502=`grep :$d: $log |grep ‘ 502 ‘|wc -l`
##統計502出現的行數;
disk.sh內容
#! /bin/bash
##Writen by Aiker
rm -f ../log/disk.tmp
for r in `df -h |awk -F ‘[ %]+‘ ‘{print $5}‘|grep -v Use`
do
if [ $r -gt 90 ] && [ $send -eq "1" ]
then
echo "$addr `date +%T` disk useage is $r" >>../log/disk.tmp
fi
if [ -f ../log/disk.tmp ]
then
df -h >> ../log/disk.tmp
/bin/bash ../mail/mail.sh $addr\_disk $r ../log/disk.tmp
echo "`date +%T` disk useage is nook"
else
echo "`date +%T` disk useage is ok"
fi
disk.sh內容解析:
[root@aiker conf]# df -h
Filesystem Size Used Avail Use% Mounted on
/dev/sda3 19G 7.8G 12G 42% /
devtmpfs 479M 0 479M 0% /dev
tmpfs 489M 0 489M 0% /dev/shm
tmpfs 489M 6.7M 482M 2% /run
[root@aiker conf]# df -h |awk -F ‘[ %]+‘ ‘{print $5}‘
Use
42
0
0
2
##awk -F ‘[ %]+‘ ‘{print $5}‘這裏是以空格和%為分隔符,打印第五行;如果沒有+號,則awk默認將空格和%分開來算,打印第五行就為空了
[root@aiker conf]# df -h |awk -F ‘[ %]+‘ ‘{print $5}‘ |grep -v ‘Use‘
42
0
0
2
[root@aiker conf]# df -h |awk -F ‘[ %]‘ ‘{print $5}‘
十七周一次課