通過TCP Allocate連線數告警瞭解prometheus-NodeExporter資料採集及相關知識擴散

阿新 • • 發佈：2022-03-23

1.問題由來

近日有環境告警如下：TCP Allocate連線數過多

很多資料告訴我們使用:netstat –ant | grep ^tcp | wc –l命令查詢，但查詢的值與告警中獲取的只相差很大，於是抱著學習的心態下載NodeExporter的原始碼進行檢視進行一探究竟。

2.NodeExporter原始碼初探

通過檢視node_exporter-1.1.2程式碼瞭解到node_sockstat_TCP_alloc呼叫的是node_exporter.go程式碼中parseSockstatProtocol函式。

func parseSockstatProtocol(kvs map[string]int) NetSockstatProtocol {
	var nsp NetSockstatProtocol
	for k, v := range kvs {
		// Capture the range variable to ensure we get unique pointers for
		// each of the optional fields.
		v := v
		switch k {
		case "inuse":
			nsp.InUse = v
		case "orphan":
			nsp.Orphan = &v
		case "tw":
			nsp.TW = &v
		case "alloc":
			nsp.Alloc = &v
		case "mem":
			nsp.Mem = &v
		case "memory":
			nsp.Memory = &v
		}
	}

	return nsp
}

進一步分析呼叫可知TCP Alloc的值取自於/proc/net/sockstat檔案。

// NetSockstat retrieves IPv4 socket statistics.
func (fs FS) NetSockstat() (*NetSockstat, error) {
	return readSockstat(fs.proc.Path("net", "sockstat"))
}

那麼第一個疑問解決了，知道了TCP Alloc的取值方法。

那麼問題來了，為什麼netstat –ant | grep ^tcp | wc –l和/proc/net/sockstat檢視的不一樣。

3.ss VS netstat

3.1.socket

socket是用於與網路通訊的Linux檔案描述符。在Linux中，所有東西都是一個檔案。在這種情況下，可以將socket視為寫入網路而不是寫入磁碟的檔案。socket在TCP和UDP中有不同的風格。

3.2.procfs

Procfs（proc filesystem）是Linux公開的一種檔案系統，它就像窺探核心記憶體一樣。它存在於/proc中，並在/proc/net/tcp和/proc/net/udp 中暴露TCP和UDP套接字的資訊。

3.3.ss VS netstat

通過查詢netstat相關資料《netstat》瞭解到如下資訊，人們正在從netstat轉向ss，因為netstat(實際上是網路工具)已被棄用。但為什麼還要如此多的人在使用netstat，猜測是因為netstat也可能被安裝在更多的地方。

On Linux, netstat (part of "net-tools") is superseded by ss (part of iproute2). The replacement for netstat -r is ip route, the replacement for netstat -i is ip -s link, and the replacement for netstat -g is ip maddr, all of which are recommended instead.

ss包含在iproute2包中，是netstat的替代品。它除了顯示類似於netstat的資訊。並且可以顯示比其他工具更多的TCP和狀態資訊。對於跟蹤TCP連線和套接字，它是一種新的、非常有用的和更快的(與netstat相比)工具，同時ss直接查詢核心，響應速度比netstat快得多。。

關於netstat的替代如下：

$ netstat -r   replaced by   $ ip route
$ netstat -i   replaced by   $ ip -s lin
$ netstat -g   replaced by   $ ip maddr

而ss命令是怎麼獲取到相關引數的？通過檢視ss原始碼發現ss實際上是解析/proc/net/sockstat的輸出。

tcp_total在/proc/net/sockstat的輸出中實際上是“alloc”;
tcp4_hash在/proc/net/sockstat的輸出中實際上是“inuse”;
tcp_tws在/proc/net/sockstat的輸出中實際上是“tw”;

因此，/proc/net/sockstat的輸出必須與ss -s的輸出一致。

#  cat /proc/net/sockstat &&  echo "----" && cat /proc/net/sockstat6 && echo "---" && ss -s
sockets: used 7095
TCP: inuse 2066 orphan 0 tw 193 alloc 3235 mem 290
UDP: inuse 6 mem 3
UDPLITE: inuse 0
RAW: inuse 0
FRAG: inuse 0 memory 0
----
TCP6: inuse 1072
UDP6: inuse 4
UDPLITE6: inuse 0
RAW6: inuse 0
FRAG6: inuse 0 memory 0
---
Total: 7095 (kernel 17923)
TCP:   3428 (estab 3079, closed 290, orphaned 0, synrecv 0, timewait 193/0), ports 0

Transport Total     IP        IPv6
*	     17923       -         -        
RAW	       0         0         0        
UDP	      10        6         4        
TCP	      3138      2066      1072     
INET	  3148      2072      1076     
FRAG	  0         0         0

讓我們手動解析下/proc/net/sockstat和sockstat6的輸出：

s.tcp4_hashed = 2066 
s.tcp6_hashed = 1072
s.closed      = 290
s.tcp_tws     = 193

我們可得出如下公式：

alloc=s.tcp_total=s.tcp_total =s.tcp4_hashed + s.tcp6_hashed + s.closed  - s.tcp_tws

減去s.tcp_tws是因為290個closed套接字中193個是tcp_tws狀態。

關於/proc/net/sockstat的輸出資訊如下：

sockets: used：已使用的所有協議套接字總量
TCP: inuse：正在使用（正在偵聽）的TCP套接字數量。
TCP: orphan：無主（不屬於任何程序）的TCP連線數（無用、待銷燬的TCP socket數）
TCP: tw：等待關閉的TCP連線數。
TCP：alloc(allocated)：已分配（已建立、已申請到sk_buff）的TCP套接字數量。
TCP：mem：套接字緩衝區使用量（單位不詳。用scp實測，速度在4803.9kB/s時：其值=11，netstat –ant 中相應的22埠的Recv-Q＝0，Send-Q≈400）

4.什麼是tcp alloc

在socket統計中，有兩種型別的TCP套接字：allocated (已分配)的和inuse(使用狀態)。

1,.allocated ：所有的TCP socket狀態都被計數為alloc。

2,inuse：除TCP_CLOSE之外的所有TCP socket狀態都被計算為inuse(使用狀態)。

在許多情況下，TCP套接字可以標記為TCP_CLOSE。然而，核心將TCP套接字的初始狀態設定為“TCP_CLOSE”。

因此，如果名為Closed的列具有較高的數字，而名為timewait的列具有較低的數字，那麼應用程式可能會建立TCP套接字，而不做其他任何事情。在許多情況下，核心可能會將一個TCP套接字標記為TCP_CLOSE。這種情況就是其中一種，也是最常見的情況。

5.NodeExporter採集記憶體和CPU的方式

5.1.NodeExporter採集記憶體使用率

在prometheus中獲取記憶體使用率的公式為：

(1 - (node_memory_MemAvailable_bytes{instance=~"$node"} / (node_memory_MemTotal_bytes{instance=~"$node"})))* 100

通過分析NodeExporter的原始碼node_exporter-1.1.2/node_exporter_test.go，可知記憶體讀取/proc/meminfo檔案：

func (fs FS) Meminfo() (Meminfo, error) {
	b, err := util.ReadFileNoStat(fs.proc.Path("meminfo"))
	if err != nil {
		return Meminfo{}, err
	}

	m, err := parseMemInfo(bytes.NewReader(b))
	if err != nil {
		return Meminfo{}, fmt.Errorf("failed to parse meminfo: %v", err)
	}

	return *m, nil
}

從而可知prometheus中node_memory_MemAvailable_bytes的值是取自/proc/meminfo的MemAvailable引數值，node_memory_MemTotal_bytes是取自/proc/meminfo的MemTotal引數值。

而記憶體使用率公式為：

(1-MemAvailable/MemTotal)*100

5.2.NodeExporter採集CPU使用率

在prometheus中獲取記憶體使用率的公式為：

100 - (avg by (instance) (irate(node_cpu_seconds_total{instance=~"$node",mode="idle"}[5m])) * 100)

通過分析NodeExporter的原始碼procfs-0.0.8/procfs-0.0.8/stat.go，可知記憶體讀取/proc/stat檔案：

func (fs FS) Stat() (Stat, error) {
	fileName := fs.proc.Path("stat")
	data, err := util.ReadFileNoStat(fileName)
	if err != nil {
		return Stat{}, err
	}

	stat := Stat{}

如果通過shell指令碼讀取/proc/stat檔案內容計算出CPU使用率可參考：LINUX 根據 /proc/stat 檔案計算cpu使用率的shell指令碼

通過TCP Allocate連線數告警瞭解prometheus-NodeExporter資料採集及相關知識擴散

1.問題由來

2.NodeExporter原始碼初探

3.ss VS netstat

3.1.socket

3.2.procfs

3.3.ss VS netstat

4.什麼是tcp alloc

5.NodeExporter採集記憶體和CPU的方式

5.1.NodeExporter採集記憶體使用率

5.2.NodeExporter採集CPU使用率

通過TCP Allocate連線數告警瞭解prometheus-NodeExporter資料採集及相關知識擴散

Win10如何手動更改TCP/IP連線數限制

簡單瞭解springboot中的配置檔案相關知識

深入瞭解python中元類的相關知識

簡單瞭解Android效能優化方向及相關工具

Linux通過netstat命令統計連線數

JAVA SQLServerException: 通過埠 1433 連線到主機 127.0.0.1 的 TCP/IP 連線失敗

Zabbix - 解決方案 - 監控TCP連線數-Linux

Zabbix - 解決方案 - 監控TCP連線數-Windows

TCP 連線數

TCP 連線狀態及相關命令學習

檢視mysql當前連線數的方法詳解

mysql最大連線數設定技巧總結

Mysql檢視最大連線數和修改最大連線數的講解

python 通過SSHTunnelForwarder隧道連線redis的方法

解決python通過cx_Oracle模組連線Oracle亂碼的問題

MongoDB最大連線數設定失效的異常分析過程與解決方法

雲資料庫如何通過外網連線

php實現通過stomp協議連線ActiveMQ操作示例

docker中修改mysql最大連線數及配置檔案

通過TCP Allocate連線數告警瞭解prometheus-NodeExporter資料採集及相關知識擴散

1.問題由來

2.NodeExporter原始碼初探

3.ss VS netstat

3.1.socket

3.2.procfs

3.3.ss VS netstat

4.什麼是tcp alloc

5.NodeExporter採集記憶體和CPU的方式

5.1.NodeExporter採集記憶體使用率

5.2.NodeExporter採集CPU使用率

相關推薦