Linux效能調優 | 01 平均負載的理解和分析

阿新 • • 發佈：2019-12-31

01 uptime命令

通常我們發現系統變慢時，我們都會執行top或者uptime命令，來檢視當前系統的負載情況，比如像下面，我執行了uptime，系統返回的了結果。

[root@lincoding ~]# uptime
 08:31:49 up 27 min,1 user,load average: 0.07,0.04,0.00
複製程式碼

前幾列的資訊，相信大家都很熟悉，它們分別是當前時間、系統執行時間和正在登陸的使用者個數，最後一個就是系統平均負載的情況。

08:31:49                        // 當前時間
up 27 min                       // 系統執行時間
1 user                          // 正在登入使用者數
load average: 0.07,0.00  // 平均負載的情況
複製程式碼

Load Average的三個數字，依次則是過去1分鐘、5分鐘、15分鐘的平均負載。可以通過觀察這三個數字的大小，可以簡單判斷系統的負載是下降的趨勢還是上升的趨勢。

如果 load average: 1.00,5.00,10.00 三個數字依次增大，則說明在過去的 1 分鐘系統的負載比過去 15 分鐘系統的負載小，表明系統的負載是下降的趨勢。
如果 load average: 10.00,1.00 三個數字依次降低，則說明在過去的 1 分鐘系統的負載比過去 15 分鐘系統的負載大，表明系統的負載是上升的趨勢。
如果 load average: 0.07,0.0 三個數字基本相同，或者相差不大，表明系統的負載是平穩的。

所以分析系統的負載情況，必須要看三個不同時間間隔的平均值。

02 平均負載概念

平均負載很多人容易理解成單位時間內的 CPU 使用率，這是不正確的。平均負載確實與 CPU 使用率有關係，但不是直接的關係。

簡單來說，平均負載是指單位時間內，系統處於可執行狀態和不可中斷狀態的平均程式數，也就是平均活躍程式數，它和 CPU 使用率並沒有直接關係。

可執行狀態，是指正在使用 CPU 或者正在等待 CPU 的程式，也就是在 ps 命令看到的 R 狀態的程式。
不可中斷狀態，是指正處於核心關鍵流程中的程式，並且這些流程是不可以打斷的，比如最常見的等待硬體裝置的 I/O 響應，也就是在 ps 命令看到的 D 狀態的程式。

因此，平均負載其實就是平均活躍程式數，可以更直觀的理解成單位時間內的活躍程式數。

既然平均的是活躍程式數，那麼最理想的，就是每個CPU上剛好執行著一個程式，這樣每個CPU就得到了充分利用。比如當平均負載為2時，意味著：

在只有 2 個 CPU 的系統上，意味著所有的 CPU 都剛好被完全佔用。
在4個CPU的系統上，意味著 CPU 有 50% 的空閒。
在只有 1 個 CPU 的系統中，則意味著有一半的程式競爭不到 CPU。

03 平均負載為多少時合理

在評判你當前的系統平均負載是否合理的時，首先你要知道系統有幾個 CPU，可以通過 lscpu 命令或者從檔案 /proc/cpuinfo 中讀取

# lscpu 命令檢視 CPU 個數
[root@lincoding ~]# lscpu
Architecture:          x86_64
CPU op-mode(s):        32-bit,64-bit
Byte Order:            Little Endian
CPU(s):                4 # 這裡數字表示 CPU 個數        
....

# 從檔案 /proc/cpuinfo 中檢視 CPU 個數
[root@lincoding ~]# grep 'model name' /proc/cpuinfo | wc -l
4
複製程式碼

有了 CPU 個數，我們就可以判斷出，當平均負載比 CPU 個數還大的時候，系統已經出現了過載。

這裡我再舉個例子，假設我們在一個單 CPU 系統上看到平均負載為 1.73，0.60，7.98

在過去 1 分鐘內，系統有 73% 的超載
在過 15 分鐘內，有 698%的超載，從整體趨勢來看，系統的負載在降低。

平均負載高於 CPU 數量 70% 的時候，就應該分析排查負載高的問題了。一旦負載過高，就可能導致程式響應變慢，進而影響服務的正常功能。

04 平均負載與 CPU 使用率

我們經常容易把平均負載和 CPU 使用率混淆，所以在這裡，我也做一個區分。

再次說明下，平均負載是指單位時間內，處於可執行狀態和不可中斷狀態的程式數。所以，它不僅包括了正在使用 CPU 的程式，還包括等待 CPU 和等待 I/O 的程式。

而 CPU 使用率，是單位時間內 CPU 繁忙情況的統計，跟平均負載並不一定完全對應。比如：

CPU 密集型程式，使用大量 CPU 會導致平均負載升高，此時這兩者是一致的；
I/O 密集型程式，等待 I/O 也會導致平均負載升高，但 CPU 使用率不一定很高；
大量等待 CPU 的程式排程也會導致平均負載升高，此時的 CPU 使用率也會比較高。

05 平均負載升高分析命令

我們現在很清楚的知道導致平均負載高的情況，不只是看 CPU 的使用率，也要觀察系統 I/O 等待時間高不高。

當發現平均負載升高時，可以使用 mpstat 命令檢視 CPU 的效能。

# -P ALL 表示監控所有CPU，後面數字1表示間隔1秒後輸出一組資料
$ mpstat -P ALL 1
Linux 2.6.32-431.el6.x86_64 (lzc) 	11/05/2019 	_x86_64_	(2 CPU)

07:51:45 PM  CPU    %usr   %nice    %sys %iowait    %irq   %soft  %steal  %guest   %idle
07:51:50 PM  all   42.90    0.00   49.39    0.41    0.00    4.56    0.00    0.00    2.74
07:51:50 PM    0   44.38    0.00   48.67    0.41    0.00    2.86    0.00    0.00    3.68
07:51:50 PM    1   41.57    0.00   49.80    0.40    0.00    6.43    0.00    0.00    1.81
複製程式碼

從上面發現

CPU 的使用者層（%usr）使用率高達45%左右；
CPU 的系統層（%sys）使用率高達50%左右；
CPU 的 I/0 - 等待（%iowait）佔用率為0.41%；
CPU 的空閒率（%idle）只有2~3%。

可以推斷出是由於 CPU 使用率導致平均負載升高的情況。

假設只有 CPU 的I/0 等待（%iowait）佔用率高，CPU 使用者層和系統層使用率很輕鬆，那麼導致平均負載升高的原因就是 iowait 的升高。

判斷了是因為 CPU 使用率升高還是 iowait 升高導致平均負載升高後，我們還需要定位是哪個程式導致的。可以用 pidstat 來查詢：

# 間隔1秒後輸出一組資料，-u表示CPU指標
$ pidstat -u 1
08:07:55 PM       PID    %usr %system  %guest    %CPU   CPU  Command
08:07:56 PM         4    0.00    1.00    0.00    1.00     0  ksoftirqd/0
08:07:56 PM         9    0.00    1.00    0.00    1.00     1  ksoftirqd/1
08:07:56 PM        11    0.00   16.00    0.00   16.00     0  events/0
08:07:56 PM        12    0.00   20.00    0.00   20.00     1  events/1
08:07:56 PM       616    7.00    6.00    0.00   13.00     1  pppoe
08:07:56 PM      2745    6.00    6.00    0.00   12.00     1  pppoe
複製程式碼

可以發現是 events/0 和 events/1 核心程式 CPU 使用率非常高，所以可能這兩個程式導致平均負載升高。

06 小結

平均負載提供了一個快速檢視系統整體效能的手段，反映了整體的負載情況。但只看平均負載本身，我們並不能直接發現，到底是哪裡出現了瓶頸。所以，在理解平均負載時，也要注意：

平均負載高有可能是 CPU 密集型程式導致的；
平均負載高並不一定代表 CPU 使用率高，還有可能是 I/O 更繁忙了；
當發現負載高的時候，你可以使用 mpstat、pidstat 等工具，輔助分析負載的來源。

Linux效能調優 | 01 平均負載的理解和分析

01 uptime命令通常我們發現系統變慢時，我們都會執行top或者uptime命令，來檢視當前系統的負載情況，比如像下面，我執行了uptime，系統返回的了結果。

Linux 效能調優CPU篇：平均負載與CPU使用率

平均負載檢視平均負載每次發現系統變慢時，我們通常做的第一件事，就是執行 top 或者 uptime 命令，來了解系統的負載情況：

linux效能調優總結

系統性能一直是個熱門話題。做運維這幾年也一直在搞效能調優，寫這個文章也算是對工作的總結。

sql server 效能調優之 SQL語句跟蹤採集分析(資訊包括:來源IP，耗時，執行緒狀態等)

一. 概述　　　有些sql語句的，通過dmv分析知道了效能有問題，需要找到請求的來源出處時，下面這個儲存過程就用派上用場了。可以把儲存過程到加入SQL JOB作業中，根據需要調整JOB的時間執行間隔。在不需要收集時，

ORACLE 11.2 效能調優之01(11GR2 Advanced Compress之OLTP Table Compress)

1.準備測試的表空間 #用於非壓縮表 create tablespace no_compress datafile \'/u02/oradata/DB112/no_compress1.dbf\' size 8M AUTOEXTEND ON NEXT 8M MAXSIZE UNLIMITED,

第四節：Nginx負載均衡配置、快取配置、效能調優

一. 負載均衡 1. 用法　通過proxy_pass 可以把請求代理至後端服務，但是為了實現更高的負載及效能，我們的後端服務通常是多個，這個是時候可以通過upstream 模組實現負載均衡。

記一次壓測引起的nginx負載均衡效能調優

這邊有個效能要求極高的api要上線，這個服務端是golang http模組實現的。在上線之前我們理所當然的要做壓力測試。起初是 “小白同學” 起頭進行壓力測試，但當我看到那壓力測試的結果時，我也是逗樂了。現象是，直接

Linux之7----效能調優命令之top

top命令是Linux下常用的效能分析工具，能夠實時顯示系統中各個程序的資源佔用狀況，類似於Windows的工作管理員。

Linux之9——效能調優之iftop命令詳解

iftop命令可以用來監控網絡卡的實時流量（可以指定網段）、反向解析IP、顯示埠資訊等，詳細的將會在後面的使用引數中說明。

Linux之8-----效能調優之iostat命令詳解

Linux系統中的iostat是I/O statistics（輸入/輸出統計）的縮寫，iostat工具將對系統的磁碟操作活動進行監視。它的特點是彙報磁碟活動統計情況，同時也會彙報出CPU使用情況。同vmstat一樣，iostat也有一個弱點，就是

Linux之16——free效能調優命令

功能說明 free 命令顯示系統使用和空閒的記憶體情況，包括實體記憶體、互動區記憶體(swap)和核心緩衝區記憶體。共享記憶體將被忽略

linux下修改核心引數進行Tcp效能調優 — 高併發

目錄(?)[+] 前言： Tcp/ip協議對網路程式設計的重要性，進行過網路開發的人員都知道，我們所編寫的網路程式除了硬體，結構等限制，通過修改Tcp/ip核心引數也能得到很大的效能提升，

ElasticSearch讀寫底層原理及效能調優

##一，讀寫底層原理 Elasticsearch寫人資料的過程 1）客戶端選擇一個node傳送請求過去，這個node就是coordinating node（協調節點）

Spring Cloud Feign 總結問題，注意點，效能調優，切換okhttp3

Feign常見問題總結 FeignClient介面如使用@PathVariable ，必須指定value屬性 //在一些早期版本中， @PathVariable(\"id\") 中的 \"id\" ，也就是value屬性，必須指定，不能省略。

效能調優-MySQL索引資料結構詳解與索引優化

轉載請註明出處！！！掘金:鳥不拉屎本篇文章主要學習了MySQL的索引的資料結構的認識，做一個大概的瞭解即可。

記錄一次系統效能調優過程

問題回顧線上上環境，由於業務場景需要，要求程式能夠在普通的4G機器中依然正常執行。

關於MySQL效能調優你必須瞭解的15個重要變數(小結)

前言: MYSQL 應該是最流行了 WEB 後端資料庫。雖然 NOSQL 最近越來越多的被提到，但是相信大部分架構師還是會選擇 MYSQL 來做資料儲存。本文作者總結梳理MySQL效能調優的15個重要變數，又不足需要補充的還望大佬指出

sql server效能調優 I/O開銷的深入解析

一.概述 IO 記憶體是sql server最重要的資源，資料從磁碟載入到記憶體，再從記憶體中快取，輸出到應用端，在sql server 記憶體初探中有介紹。在明白了sqlserver記憶體原理後，就能更好的分析I/O開銷，從而提升資料庫

mysql效能調優

mysql索引資料結構 mysql執行計劃與優化 mysql鎖與事務思維導圖

最全面的44個Java 效能調優細節

我認為，程式碼優化的最重要的作用應該是：避免未知的錯誤。在程式碼上線執行的過程中，往往會出現很多我們意想不到的錯誤，因為線上環境和開發環境是非常不同的，錯誤定位到最後往往是一個非常小的原因。

Linux效能調優 | 01 平均負載的理解和分析

01 uptime命令

02 平均負載概念

03 平均負載為多少時合理

04 平均負載與 CPU 使用率

05 平均負載升高分析命令

06 小結

相關推薦