用pt-stalk定位MySQL短暫的效能問題

阿新 • • 發佈：2018-11-07

【背景】

MySQL出現短暫的3-30秒的效能問題，一般的監控工具較難抓到現場，很難準確定位問題原因。

對於這類需求，我們日常的MySQL分析工具都有些不足的地方：

1、效能監控工具，目前粒度是分鐘級，無法反應秒級的效能波動；

2、 MySQL Performance_schema工具採集是3秒落地10000行記錄，對於QPS大於3000以上的伺服器採集會丟失資料；

Performance_schema資料通常用來分析語句級的效能問題，比如CPU高消耗，掃描行數等語句問題，對於系統內部mutex，lock，thread等資源競爭的問題無法定位。

3、 Table DML工具（5分鐘粒度）

4、 Slow Log記錄大於1秒的慢查詢，反應的可能是果，而不是因

5、 MySQL Guard工具實現是依賴報警系統觸發，一般對於持續在1分鐘以上的問題可以抓取到現場

前面擴充套件過一個功能，對高CPU的監控，粒度可以到10秒左右

pt-stalk工具可以解決更細粒度的故障現場採集，守護程序的方式試用了一下，可以幫助我們解決一些問題。

【pt-stalk工具的使用】

嘗試用pt-stalk工具做故障現場的快照採集

1、自定義指令碼，定義CPU作為觸發條件

function trg_plugin(){

a=$(sar 1 1 | grep -i "Average:"| awk '{print $8}');echo 100 - $a |bc

}

2、用pt-stalk開啟守護程序，下面命令實現了用自定義的pt_cpu.sh指令碼做為判斷條件，當CPU的值（100-%idle）大於50，判斷的間隔時間為1秒，連續3次滿足條件時觸發快照採集，觸發後會sleep 60秒

pt-stalk --daemonize --dest=/tmp/log/pt-stalk --user= --password= --port= --function=/tmp/pt_cpu.sh --variable highcpu --cycles=3 --interval=1 --threshold 50 --sleep=60 --log=/var/log/pt-stalk.log

具體的引數可參考man pt-stalk。

【案例分析】

有臺伺服器出現短暫的執行緒和CPU告警的問題，現在每天在9點多都有CPU的告警，但持續時間較短，MySQL Guard工具很難採集到現場。

按照之前效能計數器反應的指標，猜測是由於binlog備份導致的IO上升，又導致了執行緒積壓，但實際不是這個原因，binlog備份時間重合只是巧合。

在這臺伺服器開啟pt-stalk守護程序後，今天早上CPU告警時觸發了採集

抓取的快照資訊如下：

依據故障快照資訊，再結合slow log和performance_schema語句明細，有足夠的資訊可以定位出問題原因。

1、在9:01分CPU出現上升

2、pt-stalk採集的CPU資訊記錄了更細粒度，連續30秒的資訊，其中連續30秒CPU sys佔比都在80%以上，通常是併發執行緒較高，context switch過高導致的sys消耗

3、連續30秒的Threads_running確實比較高

4、進一步分析，容易找到問題原因是由於每天9:00定時job執行，有一句高併發的慢查詢SQL導致了執行緒積壓

6、慢查詢SQL是由於缺失索引導致，補建索引後再觀察

【pt-stalk的效能】

正常情況下守護程序的效能開銷並不大，建議可以在有需要排障時再定製開啟。下面是它的處理邏輯

用pt-stalk定位MySQL短暫的效能問題

【背景】 MySQL出現短暫的3-30秒的效能問題，一般的監控工具較難抓到現場，很難準確定位問題原因。對於這類需求，我們日常的MySQL分析工具都有些不足的地方： 1、效能監控工具，目前粒度是分鐘級，無法反應秒級的效能波動； 2、 MySQL Performance_schema工具採集是3秒落地

關聯與下鑽：快速定位MySQL效能瓶頸的制勝手段

本文根據DBAplus社群〖2018年1月6日北京開源與架構技術沙龍〗現場演講內容整理而成。講師介紹李季鵬新炬網路資料庫專家專注於MySQL資料庫效能管理及相關解決方案，目前主要從事

初識視覺SLAM：用相機解決定位和建圖問題

視覺slam引言：視覺SLAM 是指用相機解決定位和建圖問題。本文以一個小機器人為例形象地介紹了視覺SLAM的功能及特點。本文選自《視覺SLAM十四講：從理論到實踐》。　　SLAM 是Simultaneous Localization and Mapping 的縮寫，中文譯作“同時定位與地圖構建”。它是指搭載

巧用pt-ioprofile 工具

巧用pt-ioprofile 工具一、描述生產系統數據庫性能壓力比較大，cpu iowait 40%~50% ，數據庫系統登錄難。需要查出來是什麽進程導致的，最好是找到是什麽文件引起的。二、操作過程1.因為是數據庫系統，很容易知道是mysqld引起的，使用glances系統工具。2. pt-iopr

學習總結------用JDBC連接MySQL

-type 驅動 () 壓縮字段 jdbc連接學習新建信息 1.下載MySQL的JDBC驅動地址：https://dev.mysql.com/downloads/connector/ 為了方便，直接就選擇合適自己的壓縮包跳過登錄，選擇

百度地圖api之----根據用戶ip定位城市

服務利用 bsp result 城市 blog 經緯度 name 定位 LocalCity 這個類是利用用戶IP地址去百度數據庫裏查詢得到IP所在的城市，用法如下： var objCity = new BMap.LocalCity(); objCity.get(func

將linux系統用戶導入mysql表

charset all unix set mysql var nsh user not 下面這個程序實現的一個很簡單的功能，讀取passwd文件，將裏面的用戶信息寫入到mysql裏面，具體代碼如下： 1 #!/usr/bin/python 2 3 impor

linux下采用binary方式安裝mysql步驟

glibc zxvf sql 創建用戶啟動服務 star 安裝mysql mysql目錄初始化 1、下載binary文件　　在http://dev.mysql.com/downloads/mysql/官網上下載 mysql-5.6.36-linux-glibc2.5-

root用戶登錄mysql後新建用戶提示1045錯誤

show user 使用沒有 root用戶登錄 mysql ide 現在但是執行以下命令查看root權限 show grants for ‘root‘@‘localhost‘; 如果沒有顯示with grant option,說明是root沒有擁有新建授權用戶的權限（

用concat批量生成MySQL查詢語句

and mem local from rsh prop sql select lec select concat(‘grant all on ‘, table_schema,".",table_name," to ‘ gxsnerp‘@‘localhost ‘;") fr

用swoole簡單實現MySQL連接池

nmp 當前 async 技術 .com 增加關閉失敗長連接 MySQL連接池在傳統的網站開發中，比如LNMP模式，由Nginx的master進程接收請求然後分給多個worker進程，每個worker進程再鏈接php-fpm的master進程，php-fpm再根據當

用 pymysql 打印 MySQL/MariaDB 的所有庫名、表名和字段名

har odi perf oca passwd select *** inpu all 【環境】Python 版本：3.6.5 (v3.6.5:f59c0932b4, Mar 28 2018, 17:00:18) [MSC v.1900 64 bit (AMD64)]PyM

巧用機器學習定位雲服務器故障

str tps 避免 www eve devel details 社區異常歡迎大家前往騰訊雲+社區，獲取更多騰訊海量技術實踐幹貨哦~ 本文由roganhuang發表於雲+社區專欄導語隨著騰訊雲業務的擴大，母機數量越來越多。為減少人力並實現母機故障的自動化定位，本

用XPath精確定位節點元素&selenium使用Xpath定位之完整篇

http 查找 posit ext 編程語言 hive 目的式表其它在利用XSL進行轉換的過程中，匹配的概念非常重要。在模板聲明語句 xsl:template match = ""和模板應用語句xsl:apply-templates select = "" 中，用引號

用Navicat連接MySQL數據庫出現1251錯誤：密碼方式錯誤

flush cat oca mysql數據庫方式 with 數據庫 nat l數據庫原因：因為MySQL8.0是最新版密碼保存方式，而圖形化數據庫管理工具還是原先的密碼保存方式。解決方式：用CMD命令號方式進入MySQL use mysql； ALTER USER

Mysql資料庫效能優化之查詢效能優化

一、前言：為啥查詢速度會變慢？通常來說，查詢的生命週期大致分為從客戶端、到伺服器，然後在伺服器上進行解析，生成執行計劃，執行，並返回結果給客戶端。其中執行可以說是最重要的階段，這其中包括了大量為了檢索資料到儲存引擎的呼叫以及呼叫後的資料處理，包括排序和分組等。在每一個消耗大量時間的查

用python指令碼匯出mysql資料庫查詢結果到Excel表

最近需要導資料的情況太多，總用跳板機上的navicat工具有點效率低，也覺得挺麻煩的(由於跳板機無法連通外網所以匯出資料檔案還得通過sftp傳到本機)anyway 還是寫個指令碼好了。之前寫過一個shell指令碼做的定時匯出任務，現在試試用python寫下主要用到的庫有: pymysql -- 連資料庫

【Mac系統 + Python + Django】之開發一個釋出會系統【Django模型（二）】【Mac系統 + Mysql】之安裝Mysql資料庫【Python + Mysql】之用pymysql庫連線Mysql資料庫並進行增刪改查操作

上一部分給大家介紹Django的檢視。接下來繼續來了解Django框架，來看第二部分，此部分是對資料庫的操作。目錄：一、設計系統表二、admin後臺管理三、基本資料訪問(SQLite資料庫) 四、Django配置MySQL &

高效能Mysql------------查詢效能優化

查詢優化，索引優化，庫表結構優化需要齊頭並進。查詢效能低下最基本的原因是訪問的資料太多了。可以通過下面兩個步驟來分析： 1.是否檢索大量超過需要的資料 2.是否在分析大量超過需要的資料行請求了不需要的資料 1）查詢不需要的記錄最簡單的解決方法是在查詢後面加limit 2)多

用sql語句操作mysql資料庫的增刪改查（命令提示符和引入mysql模組兩種方式）

1:命令提示符方法：我的：mysql.sql檔案。當然首先得開啟本地伺服器（我的是xampp）; 少了一步了：首先要在進入mysql -h127.0.0.1 -u root -p;後引入我的mysql.sql 檔案；我用的是 source方法： source

用pt-stalk定位MySQL短暫的效能問題

相關推薦