監控和剖析數據庫操作 -- P6Spy、SQL Profiler、IronTrack SQL 使用簡介
在我們 Java 開發應用程序的過程中,難免會碰到系統的性能問題,特別在企業應用的開發過程中,都會與數據庫進行打交道。當我們碰到數據庫性能時,最有效的就是直接跟蹤每一個 SQL 語句的執行情況,SQL 語句的優化、索引的優化往往也是最容易取得最直接的效果的。
下面,我們首先開始介紹 P6Spy 這個剖析工具,看它是如何無侵入性地進行數據庫操作的監控與剖析。
P6Spy
P6Spy 是一個可以用來在應用程序中攔截和修改數據操作語句的開源框架。通過 P6Spy 我們可以對 SQL 語句進行攔截,相當於一個 SQL 語句的記錄器,這樣我們可以用它來作相關的分析,比如性能分析。P6Spy 用 Log4J 來記錄 JDBC 調用的日記信息。
自從 2003 年 11 月 30 日 P6Spy 版本 1.3 發布後,已經被下載超過 19,000 次了。P6Spy 支持 WebSphere、WebLogic、JBoss、Resin 和 Tomcat 等絕大多數的應用服務器。
使用步驟
首先,你的應用系統應當是基於數據庫的,然後你需要去獲取 P6Spy 相關的文件(在 參考資源 中可以找到下載鏈接,您可以直接下載軟件包)。下面介紹 P6Spy 的安裝與使用的詳細操作過程:
- 下載 P6Spy 的文件包,也可以下載它的源文件包來研究;
- 把 P6Spy 的 jar 包 p6spy.jar 放到
CLASSPATH
中,如果是 Web 應用程序則放在YourWebApp/WEB-INF/lib/
- 把 spy.properties 放到
CLASSPATH
目錄下,如果是 Web 應用程序放在YourWebApp/WEB-INF/classess/
目錄下,註意不是lib/
目錄 - 修改你應用系統中的數據庫驅動名稱為 P6Spy 的驅動程序名稱
com.p6spy.engine.spy.P6SpyDriver
其它的全部使用默認值,暫時先都不用修改; - 打開配置文件 spy.properties 文件,找到
realdriver
,把它的值改為你的應用系統的真正的數據庫驅動名稱; - 運行你的應用程序或 Web 應用程序,可以在 spy.log 裏看到 P6Spy 監測到的 SQL 詳細的執行與操作的記錄信息了,包含有完整的 SQL 執行參數。
P6Log 與 P6Outage
在 P6Spy 發布包中,它包含 P6Log 和 P6Outage 兩個模塊:
- P6Log
P6Log 是用來攔截和記錄任務應用程序的 JDBC 語句的。這個功能對於開發者監控 EJB 服務器上的 SQL 語句執行情況尤其有用,可以讓開發者完成盡可能高效的代碼。同時 P6Spy 的部署是極其簡單的,而且根本不需要更改任何一行代碼,即對現有的應用是無侵入性的。
1 2 realdriver= (your driver) (你的實際 JDBC 驅動程序名稱)
executionthreshold=整數時間 (以毫秒為單位)
- P6Outage
P6Outage 專門用來檢測和記錄執行時間比較長的 SQL 語句,P6Outage 只記錄超過配置條件裏時間的那些信息,並對可能影響到數據庫的運行效率減小到最低。
1 2 #outagedetection=true|false (是否記錄較長時間運行的語句)
#outagedetectioninterval=整數時間 (以秒為單位)
架構原理
簡單地講,我們可以認為 P6Spy 就是一個代理(Proxy),它只做了一層對 JDBC 驅動的攔截,然後轉發出去,這樣的設計與實際的應用程序沒有任何的耦合性,除了在配置中將驅動程序改成 P6Spy 的攔截驅動外,程序其他地方並不需要做任何的改變。這層攔截器除了可能會給系統帶來略微的性能下降外,對程序其他方面沒有任何的影響。而相對於這一點點的性能下降,在開發環境中對於開發人員來說是無法感覺到,相比它所帶來的好處,完全可以忽略不計。
圖 1. P6Spy 對數據庫進行攔截監控的處理過程
問題與解決
如果在你的應用程序啟動後,卻在 spy.log 文件中發現了如下的提示信息,那就是驅動程序加載先後的問題了。
1 2 3 4 |
<你的程序的數據庫驅動名稱> is a real driver in spy.properties, but it has
been loaded before p6spy. p6spy will not wrap these connections. Either
prevent the driver from loading, or try setting‘deregisterdrivers‘ to true in
spy.properties
|
請把 spy.properties 配置文件裏的 deregisterdrivers=false
改為 deregisterdrivers=true
,重新運行即可。
這是因為有些應用系統中會先於 P6Spy 加載了真正的數據庫的驅動程序,導致 P6Spy 無法監控到,設置 deregisterdrivers
為 true
,是顯式地把真正的數據庫的驅動程序進行反註冊掉,而采用 P6Spy 的驅動程序。
配置參數及相關意義
下表列出了 spy.properties 配置文件中的各配置項的名稱、默認值及其意義和相關註意事項:
配置項名稱 | 默認值 |
---|---|
module.log | com.p6spy.engine.logging. P6LogFactory |
module.outage | com.p6spy.engine.outage. P6OutageFactory |
realdriver | |
realdriver2 | |
realdriver3 | |
deregisterdrivers | false |
executionthreshold | |
outagedetection | false |
outagedetectioninterval | |
filter | false |
include | |
exclude | |
sqlexpression | |
autoflush | true |
dateformat | |
includecategories | |
excludecategories | |
stringmatcher | |
stacktrace | false |
stacktraceclass | |
reloadproperties | false |
reloadpropertiesinterval | 60 |
useprefix | false |
appender | com.p6spy.engine.logging. appender.FileLogger |
logfile | spy.log |
append | true |
log4j.appender.STDOUT | org.apache.log4j.ConsoleAppender |
log4j.appender.STDOUT.layout | org.apache.log4j.PatternLayout |
log4j.appender.STDOUT. layout.ConversionPattern | p6spy - %m%n |
log4j.logger.p6spy | INFO,STDOUT |
realdatasource | |
realdatasourceclass | |
realdatasourceproperties | |
jndicontextfactory | |
jndicontextproviderurl | |
jndicontextcustom |
SQL Profiler
SQL Profiler 是一個由 Jahia.org 提供的基於 P6Spy 引擎的快速剖析工具,用來統計 SQL 查詢語句以便了解哪裏是性能瓶頸,在哪裏創建索引或者采取相應的辦法才能提高效率,並且能根據 SQL 查詢語句的情況幫你生成合適的索引腳本。
這個小工具可以實時地顯示數據庫查詢的情況,通過集成的 SQL 解析器,在訪問大多數表與列上面建立統計分析,並生成索引腳本。當然,其它的信息也會進行收集和顯示,比如:單個數據庫請求的時間、一類請求的時間以及所有請求的時間。因此,可以有效地通過視圖的排序來檢測數據的性能問題所在。這個工具對於大量的需要進行分析的請求是非常有用的,而不是人工一個個地去做分析。當你需要知道比如對相同的表和列進行訪問但是采用不同的查詢值時,這種分組的查詢可以用建立在 ANTLR 上的 SQL 解析器進行分析。
使用步驟
首先,你的應用系統同樣也應當是基於數據庫的,然後你需要去獲取 SQL Profiler 相關的文件(在 參考資源 中可以找到下載鏈接,您可以直接下載軟件包)。下面介紹 SQL Profiler 的安裝與使用的詳細操作過程:
- 下載 SQL Profiler 的文件包進行安裝;
- 把 p6spy.jar 及 sqlprofiler.jar 放到
CLASSPATH
中,如果是 Web 應用程序則放在YourWebApp/WEB-INF/lib/
目錄下; - 把 spy.properties 放到
CLASSPATH
目錄下,如果是 Web 應用程序就放在YourWebApp/WEB-INF/classess/
目錄下,註意不是lib/
目錄; - 修改你應用系統中的數據庫驅動名稱為 P6Spy 的驅動程序名稱
com.p6spy.engine.spy.P6SpyDriver
其它的全部使用默認值,暫時不用修改; - 打開 spy.properties 文件,把
realdriver
的值改為你的程序的數據庫驅動名稱; - 註意要先運行
java -jar sqlprofiler.jar
來啟動 SQL Profiler,並成功看到啟動界面; - 然後再啟動你的應用程序或服務器,並開始進行正常的系統請求處理操作;
- 這樣就可以在 SQL Profiler 圖形化的界面上看到結果並進行分析了。
分析結果
經過一段時間的系統運行後,點擊 Pause 按鈕停止攔截,可以得到分析結果如下圖:
圖 2. SQL Profiler 的分析結果 Profiler 視圖
接著,可以切換到 Loggers 視圖,這是 Lgger 視圖的信息:
圖 3. SQL Profiler 的分析結果 Logger 視圖
當然,也可以切換到 Analysis 視圖,這是 Analysis 視圖的分析結果信息:
圖 4. SQL Profiler 的分析結果 Analysis 視圖
在經過分析後,我們可以直接通過 SQLProfiler 提交的保存按鈕,直接導出應當進行數據庫優化的建議的索引腳本,通過查看索引腳本,我們可以看到創建索引的詳細 SQL 腳本,這樣,我們就可以非常方便地進行數據庫調優了。
問題與解決
最後一個需要註意的問題就是需要先啟動 SQLProfiler,然後再啟動應用程序或者 Tomcat 等應用服務器。這是因為 SQLProfiler 默認使用的是 Log4j 的 SocketAppender,所以要先啟動。否則,會因你的應用程序或應用服務器中的 Web 應用之類的因連接不到 Socket 的服務器(SQLProfiler 相當於 Socket 的服務器)而發生錯誤,可以通過 SQL Profiler 控制界面最下面的連接狀態就可以知道是否有程序連接上來。
圖 5. SQL Profiler 處於非連接狀態
圖 6. SQL Profiler 處於連接狀態
IronTrack SQL
IronEye,一個專註於 JDBC 性能的監控和測試的開源項目,它包含有三個工具:IronEye SQL,IronEye Cache,IronTrack SQL。其中,IronEye SQL 用於監測 Java 應用和數據庫服務器之間查詢開銷的時間,診斷在性能方面是否存在著相關問題,讓開發人員在測試之前就能發現問題。IronEye 於 2003 年 10 月 1 日開始基於 Apache Software License 發布。
IronEye SQL 這個輕量級的 Java 工具提供所有流動在數據庫與應用程序之間的 SQL 統計信息並用多張圖表展現,可以快速優化程序的性能。
IronGrid 相對於 Continuous Integration 提出了 Continuous Performance 的概念,即在項目開發過程中隨時關註性能問題,而不是傳統的出了問題再解決的方案。
IronGrid 在應用程序對數據庫的操作上的 Continuous Performance 是通過 IronTrack SQL 進行體現的。IronTrack SQL 能通過對 JDBC 的包裝來攔截應用程序對數據庫的請求,完成性能監控。IronTrack SQL 的好處在於不需要修改任何代碼或者在數據庫端安裝任何程序,只需要在測試時把依賴的 JDBC 替換就可以了。
使用步驟
首先,你的應用系統同樣也應當是基於數據庫的,然後你需要去獲取 IronTrack SQL 相關的文件(在 參考資源 中可以找到下載鏈接,您可以直接下載軟件包)。下面介紹 IronTrack SQL 的安裝與使用的詳細操作過程:
- 下載 IronTrack SQL 的文件包進行安裝;
- 把 irontracksql.jar, p6spy.jar 和 log4j-1.2.8.jar 放到
CLASSPATH
中,如果是 Web 應用程序則放在YourWebApp/WEB-INF/lib/
目錄下; - 把 spy.properties 放到
CLASSPATH
目錄下,如果是 Web 應用程序就放在YourWebApp/WEB-INF/classess/
目錄下,註意不是lib/
目錄; - 修改你程序的數據庫驅動名稱為 P6Spy 的驅動程序名稱
com.p6spy.engine.spy.P6SpyDriver
其它的都不用更改; - 打開配置文件 spy.properties 文件,找到
realdriver
,把它的值改為你的應用系統的真正的數據庫驅動名稱; - 設置監聽端口號
monitorport=2000
; - 先運行
java -jar irontracksql.jar
來啟動 IronTrack SQL; - 再啟動你的應用程序或服務器;
- 可以在 IronTrack SQL 圖形化的界面上看到結果並進行分析了。
連接設置
點擊“Config”按鈕就可以設置主機名、端口與刷新的時間(毫秒為單位)。根據你的服務器與端口的不同而進行相應地改變,下面以本地和 2000 端口,刷新時間為 500 毫秒為示例。設置完成後,確定,點擊“Connect”就可以連接應用系統並進行監測與分析了,當要停止分析時,只要點擊“Disconnect”按扭即可立刻停止分析了。
在分析的過程中,我們可以根據需要點擊“Purge”按鈕,它可以清除目前所監測到的內容,然後重新進行記錄監測信息,很方便地進行重新開始。
圖 7. IronTrack SQL 連接示例
分析結果
經過一段時間的系統運行後,我們可以直接得到分析的結果與相應的圖形分析示例。相關的信息顯示如下:
圖 8. IronTrack SQL 分析結果
- Count 列顯示 SQL 語句的調用次數;
- Avg Time 列顯示 SQL 語句的執行平均時間;
- Max Time 列顯示 SQL 語句花費的最高時間;
- SQL 列顯示真正執行的 SQL 語句內容。
同時也可以通過設置過濾條件來顯示指定條件的結果,比如:只關註平均調用次數大於 100 次 的結果。點擊“Filtering”左邊的小三角圖標,可以顯示如下的過濾條件設置欄目:
圖 9. IronTrack SQL 設置相關的過濾條件
設置完成後,點擊“Apply Filter”按鈕即可以獲取所需要的相關結果了。這樣可以更加方便地集中精力進行所需要的內容分析,可以更加方便快速地定位到問題的所在之處,然後進行解決。
總結
通過使用 P6Spy、SQL Profiler、IronTrack SQL 工具,我們可以無侵入已有的應用系統而有效地進行數據庫操作的監控與剖析,為發現系統的性能瓶頸,尋找系統的性能調優提供了相當便利的方法。
監控和剖析數據庫操作 -- P6Spy、SQL Profiler、IronTrack SQL 使用簡介