第六講：prometheus初探和配置

阿新 • • 發佈：2020-07-22

prometheus官網下載
prometheus開始安裝
prometheus啟動執行
prometheus基本配置檔案講解
安裝第一個個exporter -》node_exporter
prometheus連線exporter獲取資料
prometheus命令列入門

　　時間同步

ntpdate time1.aliyun.com

　　下載prometheus

　　本次下載版本為2.10.0

　　下載地址https://github.com/prometheus/prometheus/releases/tag/v2.10.0

　　　解壓安裝

mv prometheus-2.10.0.linux-amd64.tar.gz /usr/local/
cd /usr/local/
tar -xf prometheus-2.10.0.linux-amd64.tar.gz 
mv prometheus-2.10.0.linux-amd64 prometheus

　　啟動

cd prometheus
./prometheus

　　預設啟動埠是9090

　　prometheus解壓安裝以後，就預設自帶了一個基本的配置檔案，在解壓的資料夾下面的prometheus.yml

# cat prometheus.yml 
# my global config
global:
  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

# Alertmanager configuration
alerting:
  alertmanagers:
  - static_configs:
    - targets:
      # - alertmanager:9093

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
  # - "first_rules.yml"
  # - "second_rules.yml"

# A scrape configuration containing exactly one endpoint to scrape:
# Here it's Prometheus itself.
scrape_configs:
  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
  - job_name: 'prometheus'

    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.

    static_configs:
    - targets: ['localhost:9090']

　　配置檔案解析

#全域性變數，抓取資料的時間間隔，預設15秒，不建議定義成1秒
scrape_interval:     15s
#全域性變數，監控資料規則評估頻率
#這個引數是prometheus多長時間會進行一次監控規則評估
#例如我們設定當記憶體使用量大於70%發出報警 這麼一條rule（規則）
#那麼prometheus會預設每15秒來執行一次這個規則 檢查記憶體情況
evaluation_interval: 15s

Alertmanager是prometheus的一個用於管理和發出報警的外掛
這裡對Alertmanager暫時先不做介紹，暫時也不需要，我們採用4.0Grafana，本身就已經支援報警發出功能

#抓取資料配置
scrape_configs:
  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
  #定義一個任務名稱prometheus
  - job_name: 'prometheus'

    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.
    #定義監控節點targets
    static_configs:
    - targets: ['localhost:9090']

　　這裡可以繼續擴充套件加入其它需要監控的節點

static_configs:
    - targets: ['localhost:9090','server01:9100']

　　可以targets可以並列寫入多個節點，需要設定hosts可以解析，也可以設定IP地址（IP地址不直觀）

　　埠號：通常就是exporter的埠

　　這裡9100其實是node_exporter的預設埠

　　光搭建好prometheus_server是不夠的，我們需要給監控節點搭建第一個exporter用來採集資料

　　我們就選用企業中最常用的node_exporter這個外掛

　　node_exporter是一個以http_server方式執行在後臺，並且持續不斷採集Linux系統中各種作業系統本身相關的監控引數的程式

　　其採集量的很大很全的，往往預設的採集專案就遠超實際需求

　　下載node_exporter

　　下載地址：https://github.com/prometheus/node_exporter/releases/tag/v0.15.2

　　解壓執行

tar -xf node_exporter-0.15.2.linux-amd64.tar.gz 
mv node_exporter-0.15.2.linux-amd64 node_exporter
cd node_exporter
./node_exporter &

　　可以使用curl命令檢視

curl 192.168.1.101:9100/metrics

　　執行curl之後可以看到node_exporter返回了大量metrics型別的K/V資料

　　而這些返回的K/V資料，其中的key名稱就可以直接複製貼上在prometheus的查詢命令來看結果了

　　試試node_memory_MemFree 空閒記憶體

　　前提是prometheus修改配置把該主機的對應的ip和埠新增進來，新增後需要重啟prometheus

　　難一點的監控CPU使用率

　　node_cpu這個key也是node_exporter返回的一個用來統計CPU使用率的

　　返回的是一個持續不斷累加的近似於直線的龐大數值

　　這個其實關係到prometheus對Linux資料採集的精細特性

　　其實prometheus對Linux CPU的採集並不是直接返回給我們一個CPU使用率的百分百，而是返回Linux很底層的cpu時間片累積數值這樣一個數據

　　當我們平時習慣top/uptime這種簡單的方式檢視CPU使用率，往往淺嘗輒止，沒有好好深入理解CPU使用率在linux到底是怎麼回事

　　其實如果想要真的弄明白CPU使用率這個概念在Linux要先從CPU時間這個概念開始建立

　　Linux CPU時間實際是指：從作業系統開啟算起CPU就開始工作了，並記錄在自己的工作中，總共使用的時間的累積量把它儲存在系統中

　　而累積的CPU使用時間還會分成幾個重要的狀態

　　比如CPU time分成 CPU user time/sys time/nice time/idle time/irq等

　　翻譯過來就是CPU 使用者態使用時間系統核心態使用時間 nice值分配使用時間空閒時間中斷時間等

　　CPU使用率最準確的定義其實是CPU各種狀態中除了idle（空閒）外，其他所有CPU狀態的和/總CPU時間

　　得出來的就是CPU使用率

　　那麼會到我們剛才使用node_cpu這個key如果直接輸入jinq

　　返回的其實是CPU剛剛狀態下從開機開始一直累積下來CPU使用時間的累積值

　　CPU時間狀態解釋

us（user time） 表示CPU執行使用者程序的時間，包括ni時間。通常我們只看這項。 



sy(system time) 表示CPU在核心執行時間，包括IRQ和softirq時間,系統CPU佔用率高，表明系統某部份存在瓶頸，通常值越低越好。 



wa(waiting time) CPI在等待I/O操作完成所花費的時間，系統不應該花費大量時間來等待I/O操作，否則說明I/O存在問題。



id(idle time) 系統處於空閒期，等待程序執行。 

ni(nice time) 系統調整程序優先順序所花費的時間。

hi(hard irq time) 系統處理硬中斷所花費的時間。

si(softirq time) 系統處理軟體中斷所花費的時間。

st(steal time) 被強制等待虛擬CPU的時間，此時hypervisor在為另一個虛擬處理器服務。

　　所以：如果在prometheus中，想對CPU的使用率準確來查詢

(1-((sum(increase(node_cpu{mode="idle"}[1m]))by(instance))/(sum(increase(node_cpu[1m]))by(instance))))*100

　　在web頁面輸入執行

　　prometheus這種精細的底層的計算特性雖然學起來難不過帶來的好處也是顯而易見的

　　1）prometheus這種底層資料採集所形成的監控是最準確最可信的

　　2）prometheus本身也逼著使用它的運維同學，你不踏實下來好好真正把Linux技術學習過關的話就沒有辦法使用好這個超強力的監控工具了

第六講：prometheus初探和配置

prometheus官網下載 prometheus開始安裝 prometheus啟動執行 prometheus基本配置檔案講解安裝第一個個exporter -》node_exporter

第八講：prometheus命令列使用擴充套件

　　本講內容 prometheus命令列格式 rate函式使用 increase函式使用 sum函式使用　　　　（一）prometheus命令列格式

Web第六講：HTML基礎

內容提要： HTML文件的基本結構標記(標籤)型別、標記(標籤)語法 body標記的屬性的設定方法

React學習筆記 | 第六節：使用axios和fetch實現Ajax請求

技術標籤：React 本文是學習React筆記，對應視訊為：https://www.bilibili.com/video/BV1oW41157DY的 24 - 25 節。

react進階第六講：context

只講解新版本context，v16.3以後版本類元件和函式元件只在consumer上有區別。 const ThemeContext = React.createContext(null) // 主題顏色Context

跟我學 Spring Cloud | 第七篇：Spring Cloud Config 配置中心高可用和refresh

Springboot: 2.1.6.RELEASE SpringCloud: Greenwich.SR1 如無特殊說明，本系列教程全採用以上版本

第036講：類和物件：給大家介紹物件 | 課後測試題及答案

測試題： 0. 物件中的屬性和方法，在程式設計中實際是什麼？屬性就是靜態的特徵；方法呢就是動態的動作，可以是一個個的函式。

第037講：類和物件：面向物件程式設計

課堂小筆記面向物件最重要的概念就是類（Class）和例項（Instance），必須牢記類是抽象的模板，比如Student類，而例項是根據類創建出來的一個個具體的“物件”，每個物件都擁有相同的方法，但各自的資料可

第038講：類和物件：繼承課後測試題及答案

課堂筆記如果子類中定義與父類同名的方法或屬性，則會自動覆蓋父類對應的方法或屬性：

第040講：類和物件：一些相關的BIF

#搬運自FishC論壇,該系列已完結,共有00~96節，本人學習過程中的記錄等。 #FishC論壇：http://bbs.fishc.com/forum.php

第041講：魔法方法：構造和析構

#搬運自FishC論壇,該系列已完結,共有00~96節，本人學習過程中的記錄等。 #FishC論壇：http://bbs.fishc.com/forum.php

第十四講：Prometheus 企業級實際使⽤二

　　本講內容　　Prometheus+grafana TCP等待連結監控企業實際使⽤　　　　使⽤公式

小甲魚Python第036講：類和物件：給大家介紹物件 | 課後測試題及參考答案

測試題： 0.物件中的屬性和方法，在程式設計中實際是什麼？　　變數（屬性）和函式（方法）

第39講：類和物件——拾遺/組合

一組合的相關概念 1 組合：把類的例項化放在一個新類裡面，就把舊類的內容組合到了新類裡面

小甲魚Python第038講：類和物件：繼承 | 課後測試題及參考答案

測試題： 0.繼承機制給程式設計師帶來的最明顯的好處是？　　可以有效的減少程式碼量。如果一個類A繼承自另一個類B，就把A叫做B的子類，把B稱作A的父類。A會擁有擁有的全部屬性和方法，不需要對於A再進行相似編輯。

第六節：Core SignalR中的重連機制和心跳監測機制詳解

一. 重連機制宣告：　　本節僅介紹重連機制和心跳監測機制，基於Core 3.1框架，至於SignalR其它的一些基本使用，包括引入、Hub、配置等常規操作，在本節中不介紹，後續寫Core下的SignalR

第6講：Hello World 例項結構和流程（黃菊華NET網站開發、C#網站開發、Razor網站開發教程）

技術標籤：NET教程例項結構和流程 Hello World 例項結構和流程一個 C# 程式主要包括以下部分：  名稱空間宣告（Namespace declaration）  一個 class  Class 方法  Class 屬性  一個 Main 方法  語

第六章：執行期語義學：物件的構造和析構

一、全域性變數　　全域性變數要求在第一次執行前就被準備好，在程式結束時被銷燬。因為建構函式在執行期才能實施，所以需要對一個全域性物件做靜態初始化。如下面程式碼所示，後三行的物件沒法在編譯器完成初始化（

第六章：new和delete

一、普通new運算子和delete運算子　　1.new運算子實際上由兩個步驟組成：　　①分配所需的記憶體：通過呼叫適當庫的new運算子函式來分配記憶體（實際上所有new運算子都是由malloc完成，自己過載new時也應該用mallo

藍橋杯第六講雙指標、BFS和圖論

一、雙指標(滑動視窗) 1238. 日誌統計以D為單位列舉時間段，刪去區間開頭時間的帖子數量，加上區間結尾的帖子數量

第六講：prometheus初探和配置

時間同步

下載prometheus

相關推薦

　　時間同步

　　下載prometheus