效能壓測過程中遇到的效能問題及解決辦法

阿新 • • 發佈：2021-01-09

一、測試過程中cpu過高

1、用vmstat實時監控cpu使用情況。很小的壓力AP cpu卻到了80%多，指標是不能超過60%。

vmstat 2(每二秒顯示一次系統記憶體的統計資訊)

2、分析是use cpu過高還是sys cpu過高，常見的是use cpu使用過高。

3、如果是sys cpu使用過高，先把消耗cpu最多的程序找出來（top命令），再找到該執行緒下消耗cpu過高的是哪幾個執行緒，再把該執行緒轉換成16進位制，再用jstack命令來dump執行緒棧，看這個執行緒棧在呼叫什麼東西導致use cpu過高。

①top->top -H -p pid->②printf '0x%x' tid->③stack pid | grep tid->④

jstackpid > dump01

二、記憶體溢位（堆溢位、棧溢位、持久代溢位）

1、堆記憶體溢位

1)穩定性壓測一段時間後報錯，日誌報java.lang.OutOfMemoryError.Java heap space。

2)用jmap -histo pid | head -20命令dump堆記憶體使用情況，檢視堆記憶體排名前20個物件，看是否有自己應用程式的方法，從最高的查起，如果有則檢查該方法是什麼原因造成堆記憶體溢位。

3)如果前20裡沒有自己的方法，則用jmap -dump來dump堆記憶體（jmap -dump:format=b,file=202007028.dump 105944），在用jvisualvm分析dump下來的堆記憶體，分析匯出記憶體溢位的方法。

4)如果應用程式的方法沒有問題，則需要修改JVM引數，修改xms，xmx，調整堆記憶體引數，一般是增加堆記憶體。

2、棧記憶體溢位

1)穩定性壓測一段時間後報錯，日誌報Java.Lang.StackOverflowError。

2)修改jvm引數，將xss引數改大，增加棧記憶體。

3)棧溢位一定是做批量操作引起的，減少批處理資料量。

3、持久代溢位

1)穩定性壓測一定時間後，日誌報Java.Lang.OutOfMenoryError.PermGen Space。

2)這種原因是由於類、方法描述、欄位描述、常量池、訪問修飾符等一些靜態變數太多，將持久代佔滿導致持久代溢位。

3)修改jvm配置，將XX:MaxPermSize=256引數調大。儘量減少靜態變數。

三、執行緒死鎖

1、容量測試壓測一段時間後，壓力工具報連線超時。

2、造成這種現象的原因很多，比如頻寬不夠，中介軟體執行緒池不夠用，資料庫連線池不夠，連線數佔滿等都會造成連線不上而報超時錯誤。

3、jstack命令dump執行緒棧，搜尋執行緒棧裡有沒有block，如果有的話就是執行緒死鎖，找到死鎖的執行緒，分析對應的程式碼。

四、資料庫死鎖

1、容量測試壓測一段時間後，報連線超時。

2、造成這種現象的原因很多，比如頻寬不夠，中介軟體執行緒池不夠用，資料庫連線池不夠，連線數佔滿等都會造成連線不上而報超時錯誤。

3、資料庫日誌中搜索block，能搜到block的話就是存在資料庫死鎖，找到日誌，檢視對應的sql，優化造成死鎖的sql。

五、資料庫連線池不釋放

1、容量測試壓測一段時間後，報連線超時。

2、造成這種現象的原因很多，比如頻寬不夠，中介軟體執行緒池不夠用，資料庫連線池不夠，連線數佔滿等都會造成連線不上而報超時錯誤。

3、去資料庫檢視應用程式到資料庫的連線有多少個（ show full processlist），假如應用程式裡面配置的資料庫連線為30，在資料庫檢視應用程式到資料庫的連線也是30，則表示連線池佔滿了。將配置改成90試試，去資料庫看如果連線到了90，則可以確定是資料庫連線池不釋放導致的。檢視程式碼，資料庫連線部分是不是有建立連線但是沒有關閉連線的情況。基本就是這種情況導致的，修改程式碼即可。

六、TPS上不去

1、壓力大的時候tps頻繁抖動，導致總tps上不去。檢視是否有fullgc（tail -f gc_mSrv1.log | grep full）。

2、pacing設定太小也會導致tps上不去，對抖動大的交易多增加點使用者即可。

3、tps抖動，單壓抖動大的交易，發現很平穩，這時懷疑是不是壓力太大導致，所以發容量的時候把壓力最大的那隻交易分到其他壓力機，然後發現tps不抖動了。注意：多臺壓力機隻影響tps抖動，不會影響伺服器的cpu。

4、看響應時間有沒有超時，看使用者數夠不夠。

七、伺服器壓力不均衡（相差1%-2%是正常的）

1、跑最優容量的時候，四臺AP只有一臺cpu超過60%，其他三臺都在60%以下。

2、檢視伺服器是否有定時任務。

3、檢視是否存在壓力機瓶頸。

4、是否存在頻寬瓶頸（區域網不存在此問題）。

5、檢視部署的版本，配置是否一樣。

6、可能別人也在用這些AP，因為同一臺物理機上有很多虛擬機器，因為別人先用，資源被別人先佔了。

八、fullgc時間太長

1、跑容量和穩定性的時候，出現報請求超時錯誤，檢視後臺日誌是fullgc了，看幾點報的錯和日誌裡fullgc的時間是否對應，fullgc會暫停整個應用程式，導致LR前端沒響應，所以報錯，這時可以減少old代記憶體，從而減少fullgc時間，減少fullgc時間就不會報錯，讓使用者幾乎感覺不到應用程式暫停。

2、四臺AP輪流著full gc（部分server fullgc，其他server也會fullgc），這時可以制定策略讓不同的server不同時fullgc，或者等夜間交易量少時寫定時任務重啟服務。

效能壓測過程中遇到的效能問題及解決辦法

一、測試過程中cpu過高 1、用vmstat實時監控cpu使用情況。很小的壓力AP cpu卻到了80%多，指標是不能超過60%。

效能測試：Jmeter壓測過程中的簡訊驗證碼讀取

效能測試：Jmeter壓測過程中的簡訊驗證碼讀取 01問題背景現如今國內的大部分軟體或者網站應用，普遍流行使用簡訊業務，比如登入、註冊以及特定的業務通知等。

loadrunner壓測過程中出現"Error -27796: Failed to connect to server "172.20.162.51:20081": 鏃犳硶鎸囧畾琚 奼傜殑鍦板潃"等報錯

前幾天，我工作的專案遇到要進行壓力測試，在進行壓力測試時出現了loadrunner壓測過程中出現\"Error -27796: Failed to connect to server \"172.20.162.51:20081\": 鏃犳硶鎸囧畾琚 奼傜殑鍦板潃\"等報錯，在排查

manjaro + kde 使用過程中問題記錄及解決方法

前言：使用manjaro的經歷：2020/11月中旬時，我被自己很差的電腦搞得心態爆炸，開機要5分鐘，只是開個pycharm編輯器+網頁電腦就開始卡屏，於是就決定購買新電腦。在新電腦還沒到貨的情況下，想給舊電腦做做好玩的事情

雙十一壓測&Java應用效能問題排查總結

連續參加了兩年公司的雙十一大促壓測專案，遇到了很多問題，也成長了很多，於是在這裡對大促壓測做一份總結。以及記錄一下大促壓測過程中出現的一些常見的Java應用效能問題。

效能壓測工具 wrk 使用

名詞解釋：　　QPS（Query per second 每秒處理完的請求數）什麼是wrk 看下他GitHub上的介紹：https://github.com/wg/wrk

Grpc效能壓測方法：用ghz進行壓測

內容簡介：現在grpc的壓測工具很少，比http的壓測工具少太多了，好像還沒有一個“公認”的壓測工具，在github中搜索“grpc benchmark”，

jmeter+grafana+prometheus的docker效能壓測體系

好記性不如爛筆頭，記下來便人便己： 1、搭建Prometheus的容器： docker run -d --name prometheus -p 9090:9090 --network grafana -v $PWD/prometheus.yml:/etc/prometheus/prometheus.yml prom/prometheus

JMeter效能測試教程基於Jmeter的效能壓測平臺實現

很早就想要一套屬於自己的效能壓測平臺，原因是使用了阿里雲的效能測試PTS，就挺羨慕能有一個這樣的效能測試平臺，但畢竟人家的東西我們高攀不起（要錢的），而且阿里雲的效能測試平臺是不支援多種協議的（比如我有一

【效能壓測】壓測k8s的slb時，發現報錯502/504問題追蹤

問題描述對SLB例項進行壓測，出現504狀態碼、請求超時的現象。壓測的URL配置了HTTPS監聽的URL轉發策略，且該轉發策略並沒有啟用健康檢查。

聊聊 Jmeter效能壓測時常見的一些報錯

引子：收到產品的需求：當前對於供應鏈系統中的訂單一次大批量5000單分頁稽核時系統比較緩慢，請在穩定測試環境中對這個稽核功能做一次效能壓測。

python的自帶效能壓測工具locust

Locust 的特徵用 Python 編寫測試方案不需要在 UI 介面上傻乎乎的點選，只需正常的寫寫程式碼就可以了。

SpringBoot中RedisTemplate的MGET效能測試及解決辦法

專案中遇到了MGET獲取10000+資料時超時的問題，然後找到網友的測試結果如下（這裡就不再重發測試程式碼，測試結果一致）

實戰 | JMeter 典型電商場景(下單/支付)的效能壓測

本文為霍格沃茲測試學院優秀學員課程學習系列筆記，想一起系統進階的同學文末加群交流。

monkey的效能壓測

app穩定性測試 1、穩定性測試就是指軟體長時間的持續執行，系統版本是否穩定，是否能夠持續的為使用者提供服務

雲原生時代如何用 Prometheus 實現效能壓測可觀測-Metrics 篇

作者：拂衣什麼是效能壓測可觀測可觀測性包括 Metrics、Traces、Logs3 個維度。可觀測能力幫助我們在複雜的分散式系統中快速排查、定位問題，是分散式系統中必不可少的運維工具。

JDBC 連線 Mysql 過程中注意事項及各類問題解決方案

在JAVA連線mysql的過程中注意問題如下：　　java連線資料庫的程式碼： package javaDateBaseConnection;

LiveGBS國標GB/T28181服務平臺調測過程中如何配置某一裝置關閉註冊認證下級平臺註冊

同時相容內網收流外網收流多網段裝置收流 1、搭建GB28181流媒體平臺2、白名單功能2.1、功能說明2.2、新增白名單裝置

pyhon + requests 進行介面測試過程中遇到的問題及解決辦法

【python + request傳送簡單的請求】說明：這是面向物件的程式設計，目的僅是實現功能，無擴充套件和面向物件可言，一步一步來，提升程式設計的規範

s1sh（struts1+spring+hibernate)整合過程中遇一些的問題

技術標籤：javaspringhibernatemavenmysql 1. 使用hql語句時的報錯: org.hibernate.hql.internal.ast.QuerySyntaxException: USER is not mapped 報錯解決原因: 這個錯誤的原因在於from後面接的應該是類名(User

效能壓測過程中遇到的效能問題及解決辦法

一、測試過程中cpu過高

二、記憶體溢位（堆溢位、棧溢位、持久代溢位）

1、堆記憶體溢位

2、棧記憶體溢位

3、持久代溢位

三、執行緒死鎖

四、資料庫死鎖

五、資料庫連線池不釋放

六、TPS上不去

七、伺服器壓力不均衡（相差1%-2%是正常的）

八、fullgc時間太長

相關推薦