監控基本概述
阿新 • • 發佈:2021-01-12
技術標籤:Zabbix
一、監控基本概述
1.什麼是監控?
在運維職業生涯中,及整套公司的服務架構,專案架構,產品的生命週期,監控系統都是最重要的一環,事前及時預警發現故障,事後提供詳細的資料用於追查定位問題
2.為什麼監控?
1. 對系統不間斷實時監控
2. 實時反饋系統的狀態
3. 保證服務可靠性安全性
4. 保證業務持續穩定執行
3.如何進行監控,監控記憶體的使用率
1. 如何檢視系統記憶體的使用率
2. 監控記憶體哪些指標 實體記憶體 虛擬記憶體
3. 如何獲取具體的值 怎麼得到使用率
4. 到達多大的值則進行報警
4.主要的監控流行工具
1. Nagios #系統監控 都是需要人為定義,沒有比較炫的圖形,也沒有辦法查詢歷史趨勢圖
2. Zabbix #系統監控 分散式監控 硬體 系統 網路 服務 業務 等等 圖形 趨勢圖 模板
3. Cacti #網路監控
4. Lepus #天兔 資料庫的監控
5. open-falcon #小米開發的 開源的
6. Prometheus #普羅米修斯 專門監控docker k8s 容器方面監控
5.如果進入了一家新公司 如何入手監控
#監控是需要站在公司的業務角度考慮的,而不是針對某個監控技術的使用
1. 公有云 雲監控 雲平臺自帶的 + 監控工具實現
2. 硬體監控 CPU溫度 風扇轉速 主機板溫度 電壓 功率 機房巡檢 ipmi工具監控 ipmitool命令
3. 系統監控 CPU 記憶體 磁碟 網路 程序 TCP ICMP
4. 服務監控 Nginx PHP redis mysql tomcat jetty apache
5. Web監控 請求時間 響應時間 載入時間
6. 網路監控 SNMP 第三方 監控寶
7. 業務監控 業務狀態 網頁速度 pv ip uv 使用者的活躍數量 成單量
8. 日誌監控 ELK 日誌易
9. 安全監控 FIrewalld WAF 第三方工具 安全寶 牛盾雲 安全狗
10. API監控 針對業務的介面
11. 分散式監控 多機房管理
12. 自動化監控 網路發現(被動的模式) 自動註冊(主動的模式)
13. 容器 微服務的監控 docker k8s 監控
14. 資料庫監控
二、單機時代如何進行監控
1.瞭解監控的命令
#監控命令彙總
https://man.linuxde.net/par/3
監控CPU: w top htop glances uptime ps
監控記憶體: free ps top htop glances
監控磁碟: df glances iotop iostat dstat
監控網路: ifconfig glances iftop nethogs
TCP監控: netstat -ant ss -ant
2.監控磁碟根分割槽的使用率
設定閾值
多長時間監控一次
[[email protected] ~]# cat disk.sh
#!/bin/bash
Hostname_Ip=$(hostname)-$(ifconfig eth0 | awk 'NR==2{print $2}')
Date=$(date +%F-%T)
while true
do
Disk_Use=$(df -h | awk '/\/$/{print $5}')
if [ ${Disk_Use%\%} -gt 10 ];then
echo "$Date:$Hostname_Ip:磁碟根分割槽的使用率不正常,當前使用率為:$Disk_Use"
fi
sleep 5
done
3.第三工具
單臺伺服器監控還行,如果遇到多臺伺服器,遠遠不能滿足我們的需求
#藉助第三方工具:
Zabbix: 1.0 2.0 3.0 4.0 5.0
2.0 -- 3.0 改動的非常大
3.0 -- 4.0 改動的比較小
#不足:
• 資料庫瓶頸,使用mysql作為底層儲存,大資料讀寫的時候,對於資料庫的壓力非常大
• 需要在主機中安裝agent
• 對容器監控支援不好,需要自己擴充套件。
#4.0 中文版安裝手冊
https://www.zabbix.com/documentation/4.0/zh/manual