Grafana+Prometheus+node_exporter實現伺服器監控
之前寫的平臺用oshi監控本機資料,被領導看見說這東西不錯,你給我把所有電腦都監控起來。今天就把坑給填了
1. 每臺需要監控的伺服器都要安裝採集器node_exporter。
linux推薦使用docker安裝(有的grafana儀表盤需要指定採集器的版本)
docker pull prom/node-exporter:v1.0.1
windows系統安裝windows_exporter,直接下載雙擊打卡即可。目前win7系統沒法安裝,猜測是軟體版本問題
https://github.com/prometheus-community/windows_exporter/releases
2.安裝完成之後開啟
linuxhttp://127.0.0.1:9100/metrics
windowshttp://127.0.0.1:9182/metrics
3.安裝prometheus,Prometheus 是由 SoundCloud 開源監控告警解決方案。這邊是監控伺服器,上面的是被監控的電腦
docker pull prom/prometheus
然後建立配置檔案
mkdir /opt/prometheus cd /opt/prometheus/ vim prometheus.yml
設變假設監控伺服器的ip地址是10.5.0.199global:
scrape_interval: 60s evaluation_interval: 60s #上面的預設就行 scrape_configs: - job_name: prometheus static_configs: - targets: ['localhost:9090']#這邊輸入需要採集器的ip地址和埠 labels: instance: prometheus#這個無所謂 - job_name: linux static_configs: - targets: ['10.5.0.11:9100','10.5.0.12:9100']#多個以逗號分開 labels: instance: localhost
#啟動docker
docker run -d \ -p 9090:9090 \ -v /opt/prometheus/prometheus.yml:/etc/prometheus/prometheus.yml \ prom/prometheusf
訪問10.5.0.199:9090/targets 看一下節點狀態
節點一開始沒起來過一會就會起來的,如果一直不起來很大原因是剛才的配置檔案有問題,導致docker沒起來,注意檢查配置檔案的空格
4.安裝grafana,grafana是資料視覺化工具
docker pull grafana/grafana:7.2.0
新建grafana-storage資料夾來儲存檔案
mkdir /opt/grafana-storage
設定許可權
chmod 777 -R /opt/grafana-storage
啟動grafana
docker run -d \ -p 3000:3000 \ --name=grafana \ -v /opt/grafana-storage:/var/lib/grafana \ grafana/grafana
訪問url:
http://10.5.0.199:3000/
預設密碼是admin/admin
新增資料來源:
新增儀表盤:因為監控的機器作業系統不同,採集的資料不同,所以不能通用
監控win10:https://grafana.com/grafana/dashboards/10467
監控linux:https://grafana.com/grafana/dashboards/8919
這樣就完成了,因為是現成的儀表盤,需要先閱讀說明文字,保證上面的採集器版本與說明文字中的相同。
監控自動報警等功能後續再更新吧