通過手動建立統計資訊優化sql查詢效能案例

阿新 • • 發佈：2018-12-31

本質原因在於：SQL Server 統計資訊只包含複合索引的第一個列的資訊，而不包含複合索引資料組合的資訊

來源於工作中的一個實際問題，

這裡是組合列資料不均勻導致查詢無法預估資料行數，從而導致無法選擇合理的執行計劃導致效能低下的情況

我這裡把問題簡單化，主要是為了說明問題

如下一張業務表，主要看兩個“狀態”欄位，BusinessStatus1 和 BusinessStatus2

create table BusinessTable
(
    Id int identity(1,1),
    Col2 varchar(50),
    Col3 varchar(50 
),
    Col4 varchar(50),
    BusinessStatus1 tinyint,
    BusinessStatus2 tinyint,
    CreateDate Datetime
)
GO

--向測試表中寫入資料：

begin tran
    declare @i int
    set @i=0
    while @i<500000
    begin
        insert into BusinessTable values (NEWID(),NEWID(),NEWID(),1,10,GETDATE()-RAND()*1000)
         
insert into BusinessTable values (NEWID(),NEWID(),NEWID(),1,20,GETDATE()-RAND()*1000)
        insert into BusinessTable values (NEWID(),NEWID(),NEWID(),1,30,GETDATE()-RAND()*1000)
        
        insert into BusinessTable values (NEWID(),NEWID(),NEWID(),2,20,GETDATE()-RAND()*1000)
        insert into BusinessTable values 
 (NEWID(),NEWID(),NEWID(),2,30,GETDATE()-RAND()*1000)
        insert into BusinessTable values (NEWID(),NEWID(),NEWID(),2,40,GETDATE()-RAND()*1000)

        insert into BusinessTable values (NEWID(),NEWID(),NEWID(),3,30,GETDATE()-RAND()*1000)
        insert into BusinessTable values (NEWID(),NEWID(),NEWID(),3,40,GETDATE()-RAND()*1000)
        insert into BusinessTable values (NEWID(),NEWID(),NEWID(),3,50,GETDATE()-RAND()*1000)


        set @i=@i+1
    end
commit

--插入一條特殊資料，也就是實際業務場景中：
insert into BusinessTable values (NEWID(),NEWID(),NEWID(),3,10,GETDATE()-RAND()*1000)

--測試資料的特點是：

--BusinessStatus1 的分佈位：1，2,3,
--BusinessStatus2 的分佈位：10，20,30,40,50

--目前資料的對應關係，

--但是注意插入的一條特殊資料：
--BusinessStatus1 和 BusinessStatus2 的組合為：BusinessStatus1=3 and BusinessStatus2=10，在451W條資料中是唯一的一個組合

--建立如下索引：
Create Clustered index idx_createDate on BusinessTable(CreateDate)

Create Index idx_status on BusinessTable(BusinessStatus1,BusinessStatus2)

進行如下查詢，就是查詢那條所謂的特殊資料

select * 
from BusinessTable 
where BusinessStatus1=3 and BusinessStatus2=10

發現執行計劃如下:走的是全表掃描，IO代價也不小，

這種情況下，明明只有一條資料，卻要走全表掃描

（實際業務中類似資料也不僅只有一條這麼巧，但是在千萬級的表中，符合類似條件的資料很少，

打個比方好理解一點，就像訂單表一樣，訂單是退訂狀態，且尚未退款，這種資料的分佈是少之又少吧

只是舉例，不要較真）

上面查詢的IO資訊

再通過強制索引提示的情況下，發現同樣的查詢，IO有一個非常大的下降

分析上述sql為什麼不走索引？因為畢竟符合條件的資料只有一條，走全表掃描代價也過於大了，尤其是實際情況中，業務表更大，邏輯也沒有這麼直白

這個還要從索引統計資訊說起，在符合索引中，索引統計資訊只是統計前導列的，對於組合列的分佈，sqlserver是無法預估到的，這一點可以通過第一個查詢的執行計劃發現

sqlserver只是能夠預估到 BusinessStatus1 =3 的情況下的資料分佈，但是無法預估到 BusinessStatus1=3 and BusinessStatus2=10這個組合情況下的資料分佈情況

當然通過統計資訊也可以看到，統計資訊只記錄了BusinessStatus1的列的資料分佈情況，但是實際執行的過程中，無法預估BusinessStatus1=3 and BusinessStatus2=10的準確分佈

找到了問題的原因，就容易解決了，既然sqlserver無法預估到BusinessStatus1=3 and BusinessStatus2=10這個組合條件的資料分佈請，

那麼就建立一個過濾統計資訊，讓sqlserver準確地知道這個條件下資料的分佈請，就容易做出相對準確的執行計劃了

通過如下語句，建立一個該條件的統計資訊

create statistics BusinessTableFilterStatistics 
on BusinessTable(BusinessStatus1,BusinessStatus2)
where BusinessStatus1=3 and BusinessStatus2=10


--建立完統計資訊之後注意要做個更新
UPDATE STATISTICS BusinessTable BusinessTableFilterStatistics with fullscan

建立完統計資訊之後，發現表上會增加一個剛剛建立的統計資訊

現在再來看這個查詢的執行計劃情況，發現其按照預期的走了索引

同時觀察起IO情況，也有一個大幅度的下降

總結：

以上通過手動建立統計資訊，來促使sqlserver在生成執行計劃的時候，準確地知道資料的分佈情況，做出較為優化的執行計劃，在某些特殊的情況下，可以作為優化的一個考慮方向

後記：

或許有人認為這個問題該歸結於parameter sniff的問題，其實這個問題跟parameter sniff還不太一樣（當然也有一點像）

通常情況下，所說的parameter sniff問題是單列資料分佈不均勻的情況下，因為執行計劃重用導致效能地下的一個現象，重點是執行計劃的不合理重用

這裡的問題在於，由於統計資訊的資料計算方式，sqlserver 壓根無法預估到符合條件資料的準確分佈，從而無法做出合理的執行計劃的情況

當然這種情況也比較特殊，在強制索引提示以外，可以通過手動建立統計資訊來達到優化的目的

通過手動建立統計資訊優化sql查詢效能案例

本質原因在於：SQL Server 統計資訊只包含複合索引的第一個列的資訊，而不包含複合索引資料組合的資訊來源於工作中的一個實際問題，這裡是組合列資料不均勻導致查詢無法預估資料行數，從而導致無法選擇合理的執行計劃導致效能低下的情況我這裡把問題簡單化，主要是為了說明問題如下一張業務表，主

優化SQL查詢：怎樣寫出高效能SQL語句

1、首先要搞明白什麼叫執行計劃？執行計劃是資料庫根據SQL語句和相關表的統計資訊作出的一個查詢方案，這個方案是由查詢優化器自動分析產生的，比如一條SQL語句如果用來從一個 10萬條記錄的表中查1條記錄，那查詢優化器會選擇“索引查詢”方式，如果該表進行了歸檔，當前只剩下5000條記錄了

sql查詢效能優化

1.部分UPDATE、SELECT 語句寫得很複雜（經常巢狀多級子查詢）——可以考慮適當拆成幾步，先生成一些臨時資料表，再進行關聯操作; 生成臨時表create temporary table tmp_table() 生成的臨時表將在你連線MySQL期間存在。當你斷開時， MySQ

結合innodb的B+樹索引來優化sql查詢一例

先上表結構： CREATE TABLE `quote_xxxxx` ( `instrument_id` varchar(20) NOT NULL, `time_type` varchar(20)

ORACLE analyse table方式收集表統計資訊導致SQL執行計劃不準確而效能下降

最近，遇到一客戶，反饋業務響應慢，經過分析後最後鎖定到平時執行不到1秒的SQL語句，今天突然執行時間變成半分鐘。處理過程如下：取問題時段的AWR，檢視資料庫負載，發現數據庫負載不高：檢視資料庫頂級等待事件，發現是檔案離散讀，基本可以鎖定是

Oracle 手動蒐集統計資訊

--禁用自動收集 exec DBMS_AUTO_TASK_ADMIN.DISABLE(client_name => 'auto optimizer stats collection',operation => NULL,window_name => NUL

ArcSDE for Oracle在大資料量執行建立統計資訊（Analyze)耗時長的問題

Article ID:42983Software: ArcSDE 10.1, 10.2, 10.2.1, 10.2.2 ArcGIS for Desktop Advanced 10.1, 10.2, 10.2.1, 10.2.2, 10.1 SP1, 10.3 ArcGIS

優化SQL查詢：如何寫出高效能SQL語句

1、首先要搞明白什麼叫執行計劃？執行計劃是資料庫根據SQL語句和相關表的統計資訊作出的一個查詢方案，這個方案是由查詢優化器自動分析產生的，比如一條SQL語句如果用來從一個 10萬條記錄的表中查1條記錄，那查詢優化器會選擇“索引查詢”方式，如果該表進行了歸檔，當前只剩

如何優化sql查詢

優化 rdquo 查詢 -s lec family ssr 建立索引語句借鑒https://www.cnblogs.com/ssrstm/p/5753068.html和https://www.cnblogs.com/exe19/p/5786806.html 1.　　對

Mysql資料庫效能優化之查詢效能優化

一、前言：為啥查詢速度會變慢？通常來說，查詢的生命週期大致分為從客戶端、到伺服器，然後在伺服器上進行解析，生成執行計劃，執行，並返回結果給客戶端。其中執行可以說是最重要的階段，這其中包括了大量為了檢索資料到儲存引擎的呼叫以及呼叫後的資料處理，包括排序和分組等。在每一個消耗大量時間的查

優化Elasticsearch查詢效能

給檔案系統快取提供記憶體 Elasticsearch嚴重依賴於檔案系統快取，以便快速進行搜尋。通常應該確保至少有一半的可用記憶體進入檔案系統快取，以便Elasticsearch可以將索引的熱區域保留在實體記憶體中。使用更快的硬體如果搜尋受I / O限制，應該調查為檔案系統快

Mysql SQL查詢效能調優（一）

MYSQL效能調優 varchar型別的欄位在編寫SQL時，一定要加單引號，否則如果該欄位是索引的話，則不起作用，在大數量查詢時，效能很差 PS：大坑建立必要的索引提高SQL查詢效能主鍵（聚集）索引、非聚集索引（普通索引，唯一索引，全

加速SQL查詢效能的七大祕訣

　　任何平臺的SQL開發者都有自身的困惑，似乎他們一直糾纏在DO WHILE迴圈裡，這個迴圈讓他們不斷地重複同樣的錯誤。這是因為資料庫的發展依然不夠成熟。當然，供應商們也在不斷進步，但是他們還是需要處理更嚴重的問題。併發性，資源管理，空間管理和速度依然制約著SQL開發者對開發

sql查詢效能除錯，用SET STATISTICS IO和SET STATISTICS TIME---解釋比較詳細

如果調節查詢效能的目的是讓它使用盡可能少的伺服器資源，而不是查詢執行的時間最短，那麼就更容易測試你採取的措施是提高了查詢的效能還是降低了查詢的效能。尤其是在資源利用不斷變化的伺服器上更是如此。首先，需要搞清楚在對查詢進行調節時，如何測試我們的伺服器的資源使用情況。在開始我們的例子前，先執行下面

Presto與Spark SQL查詢效能比較

1. 數倉環境指標名稱指標值資料總量 24T 分割槽數量 24 儲存型別 Text Spark SQL版本 2.2.0-218 Pres同版本 Presto CLI 04fb3c3-dirty 2. 分頁查詢所有的計算

SQL優化：基本概念（索引調優、統計資訊、查詢調整、資源調控）

1、索引碎片 /*======================================================= 注意：所有的引數都是以當前資料庫來計算的，所以必須指定完全限定。模式影響如何收集碎片資料： LIMITED:掃描堆所有的頁，對於索引，

SQL調優--記一次表統計資訊未及時更新導致查詢超級慢

原文出處：https://www.cnblogs.com/zzry/p/5857751.html 延伸閱讀：Sql Server優化---統計資訊維護策略　某日同事丟給我一個看上去

SQL Server 查詢效能優化——建立索引原則（一）

索引是什麼？索引是提高查詢效能的一個重要工具，索引就是把查詢語句所需要的少量資料新增到索引分頁中，這樣訪問資料時只要訪問少數索引的分頁就可以。但是索引對於提高查詢效能也不是萬能的，也不是建立越多的索引就越好。索引建少了，用WHERE子句找資料效率低，不利於查詢資料。索引建多

Sql Server優化---統計資訊維護策略

首先解釋一個概念，統計資訊是什麼：　　簡單說就是對某些欄位資料分佈的一種描述，讓SQL Server大概知道預期的資料大小，從而指導生成合理執行計劃的一種資料庫物件預設情況下統計資訊的更新策略：　　1，表資料從0行變為1行　　2，少於500行的表增加500行或者更多　　3，當表中行多於500

通過建立索引優化MySQL查詢速度

公司使用的業務資料庫是MySQL，隨著公司業務的發展，某些表中的資料變得越來越大，當單表資料量超過幾十萬後，查詢速度明顯變慢，導致使用者體驗下降。因此，提升資料庫查詢速度迫在眉睫，下面我們來看下如何通過建立索引提升MySQL的查詢速度。一，什麼是索引索引

通過手動建立統計資訊優化sql查詢效能案例

相關推薦