效能測試常見瓶頸及調優方法

阿新 • • 發佈：2020-11-23

在效能測試過程中，最重要的一部分就是效能瓶頸定位與調優。而引發效能瓶頸的原因是多種多樣的，在之前的部落格：常見的效能測試缺陷有進行介紹。

這篇部落格，來聊聊效能測試過程中的一些注意事項，以及常見的一些效能缺陷表現及如何進行定位分析並且調優。。。

一、注意事項

1、斷言

在壓測時，為了判斷髮送的請求是否成功，一般會通過對請求新增斷言來實現。使用斷言時，建議遵循如下規範：

①、斷言內容儘量以status/code、msg/message來判斷（當然前提是介面設計遵循Restful規範）

Jmeter示例：

阿里雲PTS：

如果使用的是PTS壓測，則斷言設定中，以code/status、msg/message等於

對應的值為準；

②、儘可能不要將所有的Response Body內容作為斷言判斷的內容，這樣很可能會導致大量的“斷言”失敗；

PS：然後很遺憾的是，見過很多做壓測的童鞋，斷言內容以整個響應引數內容做斷言，導致大量的報錯。

2、成功率

一般在效能測試中，我們都追求99.99%的成功率，但在實際的測試過程中，為了儘可能覆蓋程式碼邏輯，在準備階段會盡可能的準備較多的熱點資料去做到覆蓋。

這樣的話，我們所關注的成功率指標，就要分為如下兩種：

①、事務成功率

事務成功率在某些時候也可以視為請求成功率，在斷言判斷時以code/status等內容來作為請求是否成功的衡量依據；

②、業務成功率

實際的業務場景中，所謂的成功率，並不能僅根據返回的code/status來判斷。比如：一個查詢請求，無論是返回正確的查詢結果還是由於對應資料返回空，這個請求都是成功的。

對應的響應引數可能是：{"status":"200","message":"success"}；也可能是：{"status":"200","message":"暫無對應結果"}。

PS：在效能測試過程中，考慮到業務成功率和請求成功率的不同指標，結合斷言內容，需要靈活設定斷言的方式（當然，我依然建議遵循如上的2點斷言規範）！

二、常見效能瓶頸解析及調優方案

在效能測試中，導致效能出現瓶頸的原因很多，但通過直觀的監控圖表現出來的樣子，根據出現的頻次，大概有如下幾種：

效能瓶頸出現頻次	具體表現
高	TPS波動較大
高	高併發下大量報錯
中	叢集類系統，各服務節點負載不均衡
中	併發數不斷增加，TPS上不去，CPU耗用不高
低	壓測過程中TPS不斷下降，CPU使用率不斷降低

下面對常見的幾種效能瓶頸原因進行解析，並說說常見的一些調優方案：

1、TPS波動較大

原因解析：出現TPS波動較大問題的原因一般有網路波動、其他服務資源競爭以及垃圾回收問題這三種。

效能測試環境一般都是在內網或者壓測機和服務在同一網段，可通過監控網路的出入流量來排查；

其他服務資源競爭也可能造成這一問題，可以通過Top命令或服務梳理方式來排查在壓測時是否有其他服務執行導致資源競爭；

垃圾回收問題相對來說是最常見的導致TPS波動的一種原因，可以通過GC監控命令來排查，命令如下：

1 # 實時列印到螢幕
2 jstat -gc PID 300 10
3 jstat -gcutil PID 300 10
4 # GC資訊輸出到檔案
5 jstat -gc PID 1000 120 >>/path/gc.txt
6 jstat -gcutil PID 1000 120 >>/path/gc.txt

調優方案：

網路波動問題，可以讓運維同事協助解決（比如切換網段或選擇內網壓測），或者等到網路較為穩定時候進行壓測驗證；

資源競爭問題：通過命令監控和服務梳理，找出壓測時正在執行的其他服務，通過溝通協調停止該服務（或者換個沒資源競爭的服務節點重新壓測也可以）；

垃圾回收問題：通過GC檔案分析，如果發現有頻繁的FGC，可以通過修改JVM的堆記憶體引數Xmx，然後再次壓測驗證（Xmx最大值不要超過服務節點記憶體的50%！）

2、高併發下大量報錯

原因解析：出現該類問題，常見的原因有短連線導致的埠被完全佔用以及執行緒池最大執行緒數配置較小及超時時間較短導致。

調優方案：

短連線問題：修改服務節點的tcp_tw_reuse引數為1，釋放TIME_WAIT scoket用於新的連線；

執行緒池問題：修改服務節點中容器的server.xml檔案中的配置引數，主要修改如下幾個引數：

# 最大執行緒數，即服務端可以同時響應處理的最大請求數
maxThreads="200"                        
# Tomcat的最大連線執行緒數，即超過設定的閾值，Tomcat會關閉不再需要的socket執行緒       
maxSpareThreads="200"               
# 所有可用執行緒耗盡時，可放在請求等待佇列中的請求數，超過該閾值的請求將不予處理，返回Connection refused錯誤
acceptCount="200"                 
# 等待超時的閾值，單位為毫秒，設定為0時表示永不超時
connectionTimeout="20000"

3、叢集類系統，各服務節點負載不均衡

原因解析：出現這類問題的原因一般是SLB服務設定了會話保持，會導致請求只分發到其中一個節點。

調優方案：如果確認是如上原因，可通過修改SLB服務（F5/HA/Nginx）的會話保持引數為None，然後再次壓測驗證；

4、併發數不斷增加，TPS上不去，CPU使用率較低

原因解析：出現該類問題，常見的原因有：SQL沒有建立索引/SQL語句篩選條件不明確、程式碼中設有同步鎖，高併發時出現鎖等待；

調優方案：

SQL問題：沒有索引就建立索引，SQL語句篩選條件不明確就優化SQL和業務邏輯；

同步鎖問題：是否去掉同步鎖，有時候不僅僅是技術問題，還涉及到業務邏輯的各種判斷，是否去掉同步鎖，建議和開發產品同事溝通確認；

5、壓測過程中TPS不斷下降，CPU使用率不斷降低

原因解析：一般來說，出現這種問題的原因是因為執行緒block導致，當然不排除其他可能；

調優方案：如果是執行緒阻塞問題，修改執行緒策略，然後重新驗證即可；

6、其他

除了上述的五種常見效能瓶頸，還有其他，比如：connection reset、服務重啟、timeout等，當然，分析定位後，你會發現，我們常見的效能瓶頸，

導致其的原因大多都是因為引數配置、服務策略、阻塞及各種鎖導致。。。

效能瓶頸分析參考準則：從上至下、從區域性到整體！

以上分析及調優方案僅供參考，具體定位還需要根據日誌監控等手段來分析調優。。。

轉載自：https://www.cnblogs.com/imyalost/p/10850811.html

效能測試常見瓶頸及調優方法

效能測試常見瓶頸分析及調優方法

💜一文了解MySQL效能測試及調優中的死鎖處理方法，你還看不明白？

以下從死鎖檢測、死鎖避免、死鎖解決3個方面來探討如何對 MySQL死鎖問題進行效能調優

JVM效能優化--JVM引數配置，使用JMeter簡單測試配合說明引數調優

一、JVM引數配置 1、常見引數配置 -XX:+PrintGC每次觸發GC的時候列印相關日誌 -XX:+UseSerialGC序列回收

快速定位隱蔽的sql效能問題及調優(r5筆記第38天)

在前幾天，有個開發同事問我一個問題，其實也算是技術救援，他說在有個job資料處理的頻率比較高，在測試環境中很難定位出在哪有問題，而且速度也還能接受，但是在生產環境中總是會慢一些，希望我能在測試環境中協助他

老大難的GC原理及調優，這下全說清楚了

概述本文介紹GC基礎原理和理論，GC調優方法思路和方法，基於Hotspot jdk1.8，學習之後將瞭解如何對生產系統出現的GC問題進行排查解決

深度學習模型調優方法（Deep Learning學習記錄）

深度學習模型的調優，首先需要對各方面進行評估，主要包括定義函式、模型在訓練集和測試集擬合效果、交叉驗證、啟用函式和優化演算法的選擇等。

.Net Core中GC分析及調優總結-乾貨

簡介　　GC管理你服務的記憶體分配和釋放,GC是執行公共語言執行時(CLR Common Language Runtime)中,GC可以幫助開發人員有效的分配記憶體和和釋放記憶體,大多數情況下是不需要去擔心的,但是有時候服務總是是出現莫名

Nginx原始碼安裝及調優配置(二)

由於Nginx本身的一些優點，輕量，開源，易用，越來越多的公司使用nginx作為自己公司的web應用伺服器，本文詳細介紹nginx原始碼安裝的同時並對nginx進行優化配置。

JVM常用調優方法

一、常用調優方法 1、將新物件預留在新生代由於 Full GC 的成本要遠遠高於 Minor GC ，因此儘可能將物件分配在新生代，在JVM 調優中，可以為應用程式分配一個合理的新生代空間，以最大限度避免新物件直接

【效能指標】一文搞懂效能測試常見指標

原文地址：https://testerhome.com/articles/21178 1. 前言上週，對效能測試系列專題，在公號內發表了第一篇介紹：【效能系列連載一】開篇：效能測試不可不知的“乾貨”，但反響貌似並不太好，但既然此前已答應了部

Django-silk效能測試工具安裝及使用解析

介紹 Silk是Django框架的實時分析和檢查工具。原始碼名稱:django-silk 原始碼網址: http://www.github.com/jazzband/django-silk

效能測試常見術語淺析

負載對被測系統不斷施加壓力，直到效能指標超過預期或某項資源使用達到飽和，以驗證系統的處理極限，為系統性能調優提供依據；

【效能測試必備】混合場景：基於ELK實現效能測試業務模型及tps提取

原文：https://mp.weixin.qq.com/s/31Yld0A5tfEi4r0UuvH51A 前言之前分享過《如何編寫效能測試用例》之單場景的文章（https://mp.weixin.qq.com/s/2HaLE7vMPXIPeAGdyuS22A），

一文搞懂效能測試常見指標

1. 前言上週，對效能測試系列專題，在公號內發表了第一篇介紹：【效能系列連載一】開篇：效能測試不可不知的 “乾貨”，但反響貌似並不太好，但既然此前已答應了部分讀者要連載分享效能這塊的知識，含著淚也得繼續

7.JVM調優-方法區,堆,棧調優詳解

通常我們都知道在堆空間新生代Eden區滿了，會觸發minor GC，在老年代滿了會觸發full GC，觸發full GC會導致Stop The World, 那你們知道還有一個區域滿了一會觸發Full GC麼？而且這個區域滿了會直接影響我們的開發

效能測試常見的指標（一）

效能測試最基本要考慮以下幾點： 1、時間特性，主要指的是軟體產品的事物響應時間（使用者發出請求到收到應答的這段時間）

效能測試常見問題

概述一下效能測試流程？ 1.分析效能需求。挑選使用者使用最頻繁的場景來測試。確定性能指標，比如：事務通過率為100%，TOP99%是5秒，最大併發使用者為1000人，CPU和記憶體的使用率在70%以下

效能測試常見的一些指標

在軟體測試中效能測試是很重要的一個階段，不同人群關注的效能指標也是各有側重點，從伺服器的角度看，效能測試主要關注cpu、記憶體、伺服器負載、網路、磁碟io等方面，而後臺服務介面的呼叫者一般只關心吞吐量、響應

效能測試常見問題分析

一、記憶體溢位 1、堆記憶體溢位現象：　　（1）壓測執行一段時間後，系統處理能力下降。這時用JConsole、JVisualVM等工具連上伺服器檢視GC情況，每次GC回收都不徹底並且可用堆記憶體越來越少。

效能測試常見瓶頸及調優方法

相關推薦