效能測試必備知識（4）- 使用 stress 和 sysstat 分析平均負載過高的場景

阿新 • • 發佈：2020-07-17

做效能測試的必備知識系列，可以看下面連結的文章哦

https://www.cnblogs.com/poloyy/category/1806772.html

stress 介紹

Linux 系統壓力測試工具，這裡通過異常程序模擬平均負載升高的場景

來看看 stress 命令列引數的講解

欄位	含義
-?、--help	幫助文件
--version、-v	版本號
-q	退出
-n	顯示已完成指令的情況
-t N、--timeout N	執行 N 秒後停止
--backoff N	等待 N 微秒後開始執行
-c N、--cpu N	產生 N 個程序每個程序反覆的計算隨機數的平方根模擬 CPU 計算密集型場景
-i N、--io N	產生 N 個程序每個程序反覆呼叫 sync() 模擬 I/O 密集型場景
-m N、--vm N	產生 N 個程序每個程序不斷呼叫記憶體分配 malloc() 和記憶體釋放 free() 函式
--vm-bytes B	指定 malloc() 時記憶體的位元組數，預設256MB
--vm-hang N	指定執行 free() 前等待的秒數
-d N、 --hdd N	產生 N 個程序每個程序執行 write() 和 unlink() 的程序
--hdd-bytes B	每個 hdd worker 寫入 B 位元組（預設為1GB）

Numbers may be suffixed with s,m,h,d,y (time) or B,K,M,G (size)

時間單位可以為秒 s，分m，小時h，天d，年y，檔案大小單位可以為 K，M，G

sysstat 介紹

包含了常用的 Linux 效能工具，用來監控和分析系統的效能
接下來會用到 mpstat 和 pidstat 兩個命令
後面用單獨一篇詳細講解裡面包含的所有命令

mpstat

常用的多核 CPU 效能分析工具
實時檢視每個 CPU 的效能指標以及所有 CPU 的平均指標

pidstat

常用的程序效能分析工具
實時檢視程序的 CPU、記憶體、I/O 以及上下文切換等效能指標

安裝兩個工具

提供百度雲盤連結

連結：https://pan.baidu.com/s/1YENSYaGw7Ar1Z8hf8CXGqA

提取碼：2tpc

放到 Linux 下的某個目錄

解壓

tar -zxvf sysstat-12.1.5.tar.gz

tar -zxvf stress-1.0.4.tar.gz

分別進入解壓後的兩個資料夾執行以下命令

./configure

make&&make install

平均負載和 CPU 使用率的實際栗子

前言

前面一篇文章也講到了平均負載和 CPU 使用率的三個場景，接下來我們分別對這三個場景舉例子
需要開啟三個終端訪問同一個 Linux 機器哦
我的 Linux 是虛擬機器，2個cpu，2核

CPU 密集型程序

第一個終端

在第一個終端執行 stress 命令，模擬一個 CPU 使用率 100% 的場景

stress -c 1 -t 600

第二個終端

執行 uptime 檢視系統平均負載情況，-d 引數表示高亮顯示變化的區域

watch -d uptime

可以看到，1 分鐘的平均負載會慢慢增加到 1.00

第三個終端

執行 mpstat 檢視 CPU 使用率的變化情況

mpstat -P ALL 5

可以看出

僅有一個 CPU 的使用率接近 100%，但它的 iowait 只有 0
這說明，平均負載的升高正是由於 CPU 使用率為 100%

接下來，就要排查是哪個程序導致 CPU 的使用率這麼高的

使用 pidstat 命令

間隔 5 秒後輸出一組資料

pidstat -u 5 1

從這裡可以明顯看到，stress 程序的 CPU 使用接近 100%

I/O 密集型程序

第一個終端

執行 stress 命令，但這次模擬 I/O 壓力，即不停地執行 sync()

第二個終端

執行 uptime 檢視系統平均負載情況，-d 引數表示高亮顯示變化的區域

watch -d uptime

可以看到，1 分鐘的平均負載也會慢慢增加到 1.00

第三個終端

執行 mpstat 檢視 CPU 使用率的變化情況

mpstat -P ALL 5 1

靈魂拷問

其實 iowait 並沒有上去，反而還是系統態（%sys）升高了，這是怎麼回事？難道是工具的問題？

回答

iowait 無法升高是因為案例中 stress -i 使用的是 sync() 系統呼叫，它的作用是重新整理緩衝區記憶體到磁碟中
對於新安裝的虛擬機器，緩衝區可能比較小，無法產生大的io壓力
這樣大部分都是系統呼叫的消耗了
所以，只看到系統 CPU 使用率升高

解決辦法

使用 stress 的另一個引數 -d ，含義上面已經說了哦

stress --hdd 1 -t 600 --hdd-bytes 4G

再通過 mpstat 看看指標

mpstat -P ALL 5

可以看到

iowait 是明顯升高了，雖然我們的 CPU 使用率也較高
當做了幾次嘗試之後，包括啟動了 2個、4個程序，發現 CPU 使用率仍然保持在 30%+，而 iowait 則不斷升高，最高可達到40%+，而且平均負載也在不斷升高
所以可以看出平均負載的升高，很大原因是因為 iowait 的不斷升高

接下來，就要排查是哪個程序導致 iowait 這麼高了

使用 pidstat 命令

間隔 5 秒後輸出一組資料，收集 10 次，檢視最後的平均值

pidstat -u 5 10

可以看到

kworker 寫入位元組的程序和 stress 程序的 CPU 使用率都是偏高的

大量程序的場景

目的

當系統中執行程序超出 CPU 執行能力時，就會出現等待 CPU 的程序

第一個終端

這次模擬 8 個程序

stress -c 8 -t 600

第二個終端

執行 uptime 檢視系統平均負載情況，-d 引數表示高亮顯示變化的區域

watch -d uptime

我的系統只有 4 個 CPU，比 8 個程序少得多，CPU 處於嚴重的過載狀態，平均負載已經超過 8 了

第三個終端

可以直接通過 pidstat 來檢視程序的情況了，每隔 5s 收集一次，收集 5 次，看平均值

pidstat -u 5 5

可以看到

8 個程序在競爭 4 個 CPU
每隔程序等待 CPU 的時間（%wait）高達 50%
這些超出 CPU 計算能力的程序，導致 CPU 過載

對於平均負載的一個理解和總結

平均負載提供了一個快速檢視系統整體效能的手段，反映了整的負載情況
但只看平均負載本身，我們並不能直接發現到底是哪裡出現了瓶頸

平均負載過高的分析排查思路

有可能是 CPU 即密集型程序導致的
平均負載過高不代表 CPU 使用率高，也有可能是 I/O 更密集了
當發現平均負載過高時，可以通過 mpstat、pidstat 等工具，輔助分析負載的來源

通俗總結

平均負載過高是出現效能瓶頸的表現，分析瓶頸產生的源頭和原因，需要通過各類

效能測試必備知識（4）- 使用 stress 和 sysstat 分析平均負載過高的場景

做效能測試的必備知識系列，可以看下面連結的文章哦 https://www.cnblogs.com/poloyy/category/1806772.html stress 介紹 Linux 系統壓力測試工具，這裡通過異常程序模擬平均負載升高的場景來看看 stress 命令列引數的講

效能測試必備知識（3）- 深入理解“平均負載”

做效能測試的必備知識系列，可以看下面連結的文章哦 https://www.cnblogs.com/poloyy/category/1806772.html uptime 命令入門每次發現系統變慢時，通常做的第一件事，就是執行 top 或者 uptime

效能測試必備知識（5）- 深入理解“CPU 上下文切換”

做效能測試的必備知識系列，可以看下面連結的文章哦 https://www.cnblogs.com/poloyy/category/1806772.html 前言上一篇文章中，舉例了大量程序等待 CPU 排程的場景靈魂拷問既然程序是在等待，並沒有執行，為什麼系統的平均負載還是會

效能測試必備知識（6）- 如何檢視“CPU 上下文切換”

做效能測試的必備知識系列，可以看下面連結的文章哦 https://www.cnblogs.com/poloyy/category/1806772.html 課前準備，安裝 sysbench 下載 sysbench git clone https://github.com/akopytov/sy

效能測試必備知識（7）- 深入理解“CPU 使用率”

做效能測試的必備知識系列，可以看下面連結的文章哦 https://www.cnblogs.com/poloyy/category/1806772.html 回顧 CPU 使用率是單位時間內 CPU 使用情況的統計，以百分比的方式展示靈魂拷問最常用什麼指標來描述系統的 CPU 效

效能測試必備知識（9）- 深入理解“軟中斷”

做效能測試的必備知識系列，可以看下面連結的文章哦 https://www.cnblogs.com/poloyy/category/1806772.html 前言軟中斷（softirq）導致 CPU 使用率升高也是最常見的一種效能問題所以軟中斷這個硬骨頭必須啃下去！回憶下什

效能測試必備知識（10）- Linux 是怎麼管理記憶體的？

做效能測試的必備知識系列，可以看下面連結的文章哦 https://www.cnblogs.com/poloyy/category/1806772.html 記憶體對映日常生活常說的記憶體是什麼比方說，我的膝上型電腦記憶體就是 8GB 的這個記憶體其實是實體記憶體實體記憶體也稱為主存，大

效能測試必備知識（11）- 怎麼理解記憶體中的Buffer和Cache？

做效能測試的必備知識系列，可以看下面連結的文章哦 https://www.cnblogs.com/poloyy/category/1806772.html 快取從 free 命令可以看到，快取其實就是 Buffer 和 Cache 兩部分的總和字面意思，Buffer 是快取區，Cache

Jmeter效能測試工具學習（4.指令碼組成和元件搭配）

Jmter指令碼開發原則簡單：不要無用、無關的元件，同時能複用的儘量複用。比如：HTTP Request Ddfauits公共元件正確：對指令碼或者業務正確性進行必要的判斷，不能少也不能多。（返回200）高效：部分元件僅僅使用在指令碼開發模式下，在真正生產環境下不要使用。

軟件測試基礎知識（摘）

維護交互輸出結果失敗產生界面級別不能測試執行一、軟件測試基本概念　　1.軟件=程序+文檔，軟件測試=程序測試+測試文檔。　　“軟件”是指能夠實現某種功能的指令集合，“文檔”是指軟件在開發、使用和維護過程中產生的圖文集合。　　2.軟件分類　　　　按功

軟體測試基礎知識（摘）

一、軟體測試基本概念　　1.軟體=程式+文件，軟體測試=程式測試+測試文件。　　“軟體”是指能夠實現某種功能的指令集合，“文件”是指軟體在開發、使用和維護過程中產生的圖文集合。　　2.軟體分類　　　　按功能分：系統軟體、應用軟體　　　　按技術架構分：單機版軟體、C/S結構軟體、B/S結構軟

網路通訊基礎知識（4）

網路通訊基礎知識（4） DHCP（dynamic host configuration protocl，動態主機配置協議）（1）每臺計算機都需要一個IP地址，且區域網內各電腦IP地址不能重複，否則會地址衝突。（2）計算機的IP地址可以靜態設定，也可以動態分配（

效能測試—認識JMeter（一）

效能測試—認識JMeter（一）《零成本web效能測試》第二章 JMeter基礎知識總結和自己的理解一、JMeter百度詞條概念　　Apache JMeter是Apache組織開發的基於Java的壓力測試工具。用於對軟體做壓力測試，它最初被設計用於Web應用測試，但後來擴充

軟體測試基礎知識（1）

軟體測試：從執行狀態來看分為：動態測試、靜態測試；從按執行過程來看分為：手工測試、自動化測試；從內容劃分來看：功能測試、易用性測試、相容性測試、文件測試等，從用例設計來看：黑盒測試、白盒測試、灰盒測試；按開發：單元測試、系統測試、整合測試、驗

web測試基礎知識（一）web基礎

web測試的價值： a、挖掘測試深度，提高測試價值客戶端/瀏覽器----應用伺服器----資料庫伺服器資料從客戶端/瀏覽器接收，經過http協議、tcp/ip協議傳輸，來到應用伺服器，最後到達資料庫，前面我們分析過介面的輸入域，伺服器資料庫的後臺，但是我們沒有去關心

軟體測試經典測試題（4）

在您以往的工作中，一條軟體缺陷（或者叫Bug）記錄都包含了哪些內容？如何提交高質量的軟體缺陷（Bug）記錄？一條Bug記錄最基本應包含： bug編號； bug嚴重級別，優先順序； bug產生的模組；首先要有bug摘要，闡述bug大體的內容； bug對應的版本； bug

24 Giser必備知識（一）座標系

對於經常使用ArcMap的童鞋，肯定用過屬性表中的計算幾何的功能，但是有時候會提示面積計算與長度計算禁用但是選擇的明明是 Xian 1980座標系，這是為什麼呢？下面就來講一講這些個經常讓人“頭大”的座標系先po一張圖，後面的內容都圍繞此圖展開基礎知識：地理座標系（Geographic

效能測試--系統吞吐量（TPS）、使用者併發量、效能測試概念和公式

PS：下面是效能測試的主要概念和計算公式，記錄下：一．系統吞度量要素：一個系統的吞度量（承壓能力）與request對CPU的消耗、外部介面、IO等等緊密關聯。單個reqeust 對CPU消耗越高，外部系統介面、IO影響速度越慢，系統吞吐能力越低，反之越高。系統吞吐量幾個重要引數：QPS

效能測試瓶頸定位（2）

當懷疑記憶體不足時：　方法1：　　【監控指標】：Memory Available MBytes ，Memory的Pages/sec， page read/sec， Page Faults/sec 　　【參考值】：　　如果 Page Reads/Sec 比率持續保持為 5，表示可

效能測試 vbs使用（一）

這裡以一個性能測試中檢查Cpu為例子。 Cpu效能也是常見的，分析起來比較簡單，使用wins自帶的就可以檢視。但所指的不是資源管理器。 Win+R 鍵，perfmon開啟。 Cpu效能部分檢查點在於： Processor 處理器 Process 物件的程序 Thread 執行

效能測試必備知識（4）- 使用 stress 和 sysstat 分析平均負載過高的場景

stress 介紹

來看看 stress 命令列引數的講解

Numbers may be suffixed with s,m,h,d,y (time) or B,K,M,G (size)

sysstat 介紹

mpstat

pidstat

安裝兩個工具

提供百度雲盤連結

解壓

分別進入解壓後的兩個資料夾執行以下命令

平均負載和 CPU 使用率的實際栗子

前言

CPU 密集型程序

第一個終端

第二個終端

第三個終端

使用 pidstat 命令

I/O 密集型程序

第一個終端

第二個終端

第三個終端

靈魂拷問

回答

解決辦法

再通過 mpstat 看看指標

使用 pidstat 命令

大量程序的場景

目的

第一個終端

第二個終端

第三個終端

對於平均負載的一個理解和總結

平均負載過高的分析排查思路

通俗總結

相關推薦