MySQL效能管理及架構設計（三）：SQL查詢優化、分庫分表 - 完結篇

阿新 • • 發佈：2018-11-25

一、SQL查詢優化（`重要`）

1.1 獲取有效能問題SQL的三種方式

通過使用者反饋獲取存在效能問題的SQL；
通過慢查日誌獲取存在效能問題的SQL；
實時獲取存在效能問題的SQL；

1.1.2 慢查日誌分析工具

相關配置引數：

slow_query_log # 啟動停止記錄慢查日誌，慢查詢日誌預設是沒有開啟的可以在配置檔案中開啟(on)
slow_query_log_file # 指定慢查日誌的儲存路徑及檔案，日誌儲存和資料從儲存應該分開儲存

long_query_time # 指定記錄慢查詢日誌SQL執行時間的閥值預設值為10秒通常,對於一個繁忙的系統來說,改為0.001秒(1毫秒)比較合適
log_queries_not_using_indexes #是否記錄未使用索引的SQL

常用工具：mysqldumpslow和pt-query-digest

pt-query-digest --explain h=127.0.0.1,u=root,[email protected]  slow-mysql.log

1.1.3 實時獲取有效能問題的SQL（推薦）

SELECT id,user,host,DB,command,time,state,info
FROM information_schema.processlist
WHERE TIME>=60

查詢當前伺服器執行超過60s的SQL

，可以通過腳本週期性的來執行這條SQL，就能查出有問題的SQL。

1.2 SQL的解析預處理及生成執行計劃（`重要`）

1.2.1 查詢過程描述（`重點！！！`）

上圖原文連線

通過上圖可以清晰的瞭解到MySql查詢執行的大致過程：

傳送SQL語句。
查詢快取，如果命中快取直接返回結果。
SQL解析，預處理，再由優化器生成對應的查詢執行計劃。
執行查詢，呼叫儲存引擎API獲取資料。
返回結果。

1.2.2 查詢快取對效能的影響（建議關閉快取）

第一階段：
相關配置引數：

query_cache_type # 設定查詢快取是否可用
query_cache_size # 設定查詢快取的記憶體大小
query_cache_limit # 設定查詢快取可用的儲存最大值（加上sql_no_cache可以提高效率）
query_cache_wlock_invalidate # 設定資料表被鎖後是否返回快取中的資料
query_cache_min_res_unit # 設定查詢快取分配的記憶體塊的最小單

快取查詢是利用對大小寫敏感的雜湊查詢來實現的，Hash查詢只能進行全值查詢（sql完全一致），如果快取命中，檢查使用者許可權，如果許可權允許，直接返回，查詢不被解析，也不會生成查詢計劃。

`在一個讀寫比較頻繁的系統中，建議關閉快取，因為快取更新會加鎖`。將`query_cache_type`設定為`off`,`query_cache_size`設定為`0`。

1.2.3 第二階段：MySQL依照執行計劃和儲存引擎進行互動

這個階段包括了多個子過程：

`一條查詢可以有多種查詢方式`，查詢優化器會對每一種查詢方式的（儲存引擎）統計資訊進行比較，找到成本最低的查詢方式，`這也就是索引不能太多的原因`。

1.3 會造成MySQL生成錯誤的執行計劃的原因

1、統計資訊不準確
2、成本估算與實際的執行計劃成本不同

3、給出的最優執行計劃與估計的不同

    4、MySQL不考慮併發查詢
    5、會基於固定規則生成執行計劃
    6、MySQL不考慮不受其控制的成本，如儲存過程，使用者自定義函式

1.4 MySQL優化器可優化的SQL型別

查詢優化器：對查詢進行優化並查詢mysql認為的成本最低的執行計劃。為了生成最優的執行計劃，查詢優化器會對一些查詢進行改寫

可以優化的sql型別

1、重新定義表的關聯順序；

2、將外連線轉換為內連線；

3、使用等價變換規則；

4、優化count(),min(),max()；

5、將一個表示式轉換為常數；
6、子查詢優化；

7、提前終止查詢，如發現一個不成立條件(如where id = -1)，立即返回一個空結果；

8、對in()條件進行優化；

1.5 查詢處理各個階段所需要的時間

1.5.1 使用profile(目前已經不推薦使用了)

set profiling = 1; #啟動profile,這是一個session級的配製執行查詢

show profiles; # 查詢每一個查詢所消耗的總時間的資訊

show profiles for query N; # 查詢的每個階段所消耗的時間

1.5.2 performance_schema是5.5引入的一個性能分析引擎（5.5版本時期開銷比較大）

啟動監控和歷史記錄表：use performance_schema

update setup_instruments set enabled='YES',TIME = 'YES' WHERE NAME LIKE 'stage%';

update set_consumbers set enabled='YES',TIME = 'YES' WHERE NAME LIKE 'event%';

1.6 特定SQL的查詢優化

1.6.1 大表的資料修改

1.6.2 大表的結構修改

利用主從複製，先對從伺服器進入修改，然後主從切換
（推薦）

新增一個新表（修改後的結構），老表資料匯入新表，老表建立觸發器，修改資料同步到新表，老表加一個排它鎖（重新命名），新表重新命名，刪除老表。

修改語句這個樣子：

alter table sbtest4 modify c varchar(150) not null default ''

利用工具修改：

1.6.3 優化not in 和 <> 查詢

子查詢改寫為關聯查詢：

二、分庫分表

2.1 分庫分表的幾種方式

分擔讀負載可通過一主多從，升級硬體來解決。

2.1.1 把一個例項中的多個數據庫拆分到不同例項（叢集）

拆分簡單,不允許跨庫。但並不能減少寫負載。

2.1.2 把一個庫中的表分離到不同的資料庫中

該方式只能在一定時間內減少寫壓力。

以上兩種方式只能暫時解決讀寫效能問題。

2.1.3 資料庫分片

對一個庫中的相關表進行水平拆分到不同例項的資料庫中

2.1.3.1 如何選擇分割槽鍵

分割槽鍵要能儘可能避免跨分割槽查詢的發生
分割槽鍵要儘可能使各個分割槽中的資料平均

2.1.3.2 分片中如何生成全域性唯一ID

擴充套件：表的垂直拆分和水平拆分

完！

MySQL效能管理及架構設計（三）：SQL查詢優化、分庫分表 - 完結篇

一、SQL查詢優化（重要） 1.1 獲取有效能問題SQL的三種方式通過使用者反饋獲取存在效能問題的SQL；通過慢查日誌獲取存在效能問題的SQL；實時獲取存在效能問題的SQL； 1.1.2 慢查日誌分析工具相關配置引數： slow

MySQL效能管理及架構設計（二）：資料庫結構優化、高可用架構設計、資料庫索引優化

一、資料庫結構優化（非常重要）1.1 資料庫結構優化目的 1、減少資料冗餘：（資料冗餘是指在資料庫中存在相同的資料，或者某些資料可以由其他資料計算得到），注意，儘量減少不代表完全避免資料冗餘； 2、儘量避免資料維護中出現更新，插入和刪除異常：

MySQL效能管理及架構設計（一）：什麼影響了資料庫查詢速度、什麼影響了MySQL效能

一、什麼影響了資料庫查詢速度 1.1 影響資料庫查詢速度的四個因素 1.2 風險分析 QPS： Queries Per Second意思是“每秒查詢率”，是一臺伺服器每秒能夠相應的查詢次數，是對一個特定的查詢伺服

MySQL效能管理及架構設計：SQL查詢優化、分庫分表

1.1 獲取有效能問題SQL的三種方式通過使用者反饋獲取存在效能問題的SQL；通過慢查日誌獲取存在效能問題的SQL；實時獲取存在效能問題的SQL； 1.1.2 慢查日誌分析工具相關配置引數： slow_query_log # 啟動停止記錄

作業系統課程設計（三）：Linux程序管理

一、設計內容實現一個模擬shell：編寫三個不同的程式:cmd1.c, cmd2.c, cmd3.c,每個程式輸出一句話，分別編譯成可執行檔案cmd1, cmd2, cmd3。然後再編寫一個程式，模擬shell程式的功能，能根據使用者輸入的字串(表示相應的命

C#.架構設計（三）MVVM架構模式（用在WPF或Silverlight）、MVC架構模式（用在java開發）、MVP架構模式（用在安卓開發）的原理與區別

轉發https://blog.csdn.net/victoryzn/article/details/78392128 本文將詳細闡述以下MVC、MVP、MVVM三種理念的定義及區別還有他們的適用場合。 MVC MVC模式最初生根於伺服器端的Web開發，後來漸漸能夠勝任客戶端Web開發，能

架構漫談（三）：如何做好架構之識別問題

答案跟著發生做了解決長時間一閃而過開發問題解決按照之前架構的定義，做好架構首先需要做的就是識別出需要解決的問題。一般來說，如果把真正的問題找到，那麽問題就已經解決了80%了。這個能力基本上就決定了架構師的水平。那麽面對問題有哪些困難呢? 我們先看一

ArcGIS Engine 系統開發設計（三）：屬性表的訪問與顯示

這裡主要是訪問並顯示shapefile的屬性表~ 大致思路如下：新建一個Form用來獲取選中要素的屬性表，而在初始介面右鍵點選對應的向量要素後，便開啟新form將要素屬性表展示出來。下面就開始咯~ 首先要新增ESRI.ArcGIS.Controls、Geodatabase的引

基於中臺思想的物流系統設計（三）：構建物流地址能力

一、引言在電商物流領域我們會涉及到地址，其中包括了基礎的四級地址和使用者填寫的地址。四級地址在整個從下單到收貨的業務流程中都會用到，因此設計的時候要考慮如何最大限度地提高QPS。使用者地址在下單的時候讓使用者填寫或者選擇，然後存在交易訂單和物流訂單上，後續的流程一般不會變，如果使用者需要修改地址，直接變

MySQL語句執行優化及分頁查詢優化，分庫分表（一）

下面是關於在使用SQL時，我們儘量應該遵守的規則，這樣可以避免寫出執行效率低的SQL 1、當只需要一條資料時，使用limit 1 在我們執行查詢時，如果添加了 Limit 1,那麼在查詢的時候，在篩選到一條資料時就會停止繼續查詢，但是如果沒有新增limit 1即

SpringBoot學習筆記（三）：SpringBoot整合Mybatis、SpringBoot事務管理、SpringBoot多資料來源

SpringBoot整合Mybatis 第一步我們需要在pom.xml裡面引入mybatis相關的jar包 <dependency> <groupId>org.mybatis.spring.boot</groupId> <artif

大資料架構簡述（三）：流處理、批處理、互動式查詢

我們將大資料處理按處理時間的跨度要求分為以下幾類基於實時資料流的處理，通常的時間跨度在數百毫秒到數秒之間基於歷史資料的互動式查詢，通常時間跨度在數十秒到數分鐘之間複雜的批

ZStack雲端計算架構探祕（三）：超強靈活性和可擴充套件性

在前面探祕一和探祕二中，我們已經分享了ZStack的拓撲結構和如何實現超高可伸縮性的能力。還記得我們在Why ZStack中說的，穩定性和靈活性是IaaS需要解決的兩大問題。今天我們就來揭開ZStack超強靈活性的奧祕。今天的內容非常的豐富，我們先來看一下什麼是靈活性。所

學生資訊管理系統之增（三）：新增成績資訊流程

一、新增學生成績資訊的一般流程二、根據已知資訊新增未知資訊的流程三、ExecuteSQL的查詢流程流程簡單概括：首先，對文字框進行判斷：是否為空，是否為數字；其次，對文字框內容進行判斷，連線資料庫看是否

FPGA綜合系統設計（三）：貪吃蛇遊戲（鍵盤+VGA）

“FPGA綜合系統設計”是博主新開的一個系列，主要講述在設計一個完整的系統時採用的方法。博主計劃在後面有時間的時候再開一個“FPGA基礎設計”的系列，專門講述FPGA設計一些單獨模組的方法，如IIC協議、SPI協議、DDR讀寫等。本文是綜合系統設計的第一

解構領域驅動設計（三）：領域驅動設計

ddd 引擎 .get states 成員變量 float 類的屬性 table custom 在上一部分，分層架構的目的是為了將業務規則剝離出來在單獨的領域層中進行實現。再回顧一下領域驅動設計的分層中應用層代碼的實現。 @Override public void

人工智慧中小樣本問題相關的系列模型演變及學習筆記（三）：遷移學習、深度遷移學習

【說在前面】本人部落格新手一枚，象牙塔的老白，職業場的小白。以下內容僅為個人見解，歡迎批評指正，不喜勿噴！[握手][握手] 【再囉嗦一下】本文銜接上兩個隨筆：人工智慧中小樣本問題相關的系列模型演變及學習筆記（一）：元學習、小樣本學習【再囉嗦一下】本文銜接上兩個隨筆：人工智慧中小樣本問題相關的系列模型演變及學

mysql實用優化筆記（一）：like查詢優化

like查詢優化方案 like模糊查詢形如'%AAA%'和'%AAA'將不會使用索引，但是業務上不可避免可能又需要使用到這種形式查詢方式：優化方案一：使用覆蓋索引，即查詢出的列只是用索引就可以獲取，而無須查詢表記錄，這樣也走了索引；優化方案二：使用locate函式或

pyspark學習系列（三）利用SQL查詢

對於spark 中存在dataframe，我們可以用 .creatOrReplaceTempView方法建立臨時表。臨時表建立之後我們就可以用SQL語句對這個臨時表進行查詢統計：from pyspark

flask學習筆記（三）：URL傳參、URL反轉、重定向

1、URL傳參對一個固定頁面下傳入url引數。需要給定一個id，並且使用<id>傳參，這樣才能返回一個值。 #-*- coding:utf-8 -*- from flask import Flask app = Flask(__name__) @app.

MySQL效能管理及架構設計（三）：SQL查詢優化、分庫分表 - 完結篇

一、SQL查詢優化（重要）

1.1 獲取有效能問題SQL的三種方式

1.1.2 慢查日誌分析工具

1.1.3 實時獲取有效能問題的SQL（推薦）

1.2 SQL的解析預處理及生成執行計劃（重要）

1.2.1 查詢過程描述（重點！！！）

通過上圖可以清晰的瞭解到MySql查詢執行的大致過程：

1.2.2 查詢快取對效能的影響（建議關閉快取）

在一個讀寫比較頻繁的系統中，建議關閉快取，因為快取更新會加鎖。將query_cache_type設定為off,query_cache_size設定為0。

1.2.3 第二階段：MySQL依照執行計劃和儲存引擎進行互動

一條查詢可以有多種查詢方式，查詢優化器會對每一種查詢方式的（儲存引擎）統計資訊進行比較，找到成本最低的查詢方式，這也就是索引不能太多的原因。

1.3 會造成MySQL生成錯誤的執行計劃的原因

1.4 MySQL優化器可優化的SQL型別

1.5 查詢處理各個階段所需要的時間

1.5.1 使用profile(目前已經不推薦使用了)

1.5.2 performance_schema是5.5引入的一個性能分析引擎（5.5版本時期開銷比較大）

1.6 特定SQL的查詢優化

1.6.1 大表的資料修改

1.6.2 大表的結構修改

1.6.3 優化not in 和 <> 查詢

二、分庫分表

2.1 分庫分表的幾種方式

2.1.1 把一個例項中的多個數據庫拆分到不同例項（叢集）

2.1.2 把一個庫中的表分離到不同的資料庫中

2.1.3 資料庫分片

2.1.3.1 如何選擇分割槽鍵

2.1.3.2 分片中如何生成全域性唯一ID

相關推薦

一、SQL查詢優化（`重要`）

1.2 SQL的解析預處理及生成執行計劃（`重要`）

1.2.1 查詢過程描述（`重點！！！`）

`在一個讀寫比較頻繁的系統中，建議關閉快取，因為快取更新會加鎖`。將`query_cache_type`設定為`off`,`query_cache_size`設定為`0`。

`一條查詢可以有多種查詢方式`，查詢優化器會對每一種查詢方式的（儲存引擎）統計資訊進行比較，找到成本最低的查詢方式，`這也就是索引不能太多的原因`。