如何優化MYSQL查詢
轉載自:https://segmentfault.com/a/1190000016592261
1. 在所有用於where
,order by
和group by
的列上新增索引
索引除了能夠確保唯一的標記一條記錄,還能是MySQL伺服器更快的從資料庫中獲取結果。索引在排序中的作用也非常大。
Mysql的索引可能會佔據額外的空間,並且會一定程度上降低插入,刪除和更新的效能。但是,如果你的表格有超過10行資料,那麼索引就能極大的降低查詢的執行時間。
強烈建議使用“最壞情況的資料樣本”來測試MySql查詢,從而更清晰的瞭解查詢在生產中的行為方式。
假設你正在一個超過500行的資料庫表中執行如下的查詢語句:
mysql>select customer_id, customer_name from customers where customer_id='345546'
上述查詢會迫使Mysql伺服器執行一個全表掃描來獲得所查詢的資料。
型號,Mysql提供了一個特別的Explain
語句,用來分析你的查詢語句的效能。當你將查詢語句新增到該關鍵詞後面時,MySql會顯示優化器對該語句的所有資訊。
如果我們用explain語句分析一下上面的查詢,會得到如下的分析結果:
mysql> explain select customer_id, customer_name from customers where customer_id='140385'; +----+-------------+-----------+------------+------+---------------+------+---------+------+------+----------+-------------+ | id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra | +----+-------------+-----------+------------+------+---------------+------+---------+------+------+----------+-------------+ | 1 | SIMPLE | customers | NULL | ALL | NULL | NULL | NULL | NULL | 500 | 10.00 | Using where | +----+-------------+-----------+------------+------+---------------+------+---------+------+------+----------+-------------+
可以看到,優化器展示出了非常重要的資訊,這些資訊可以幫助我們微調資料庫表。首先,MySql會執行一個全表掃描,因為key列為Null。其次,MySql伺服器已經明確表示它將要掃描500行的資料來完成這次查詢。
為了優化上述查詢,我們只需要在customer_id
這一列上新增一個索引m即可:
mysql> Create index customer_id ON customers (customer_Id);
Query OK, 0 rows affected (0.02 sec)
Records: 0 Duplicates: 0 Warnings: 0
如果我們再次執行explain語句,會得到如下結果:
mysql> Explain select customer_id, customer_name from customers where customer_id='140385';
+----+-------------+-----------+------------+------+---------------+-------------+---------+-------+------+----------+-------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-----------+------------+------+---------------+-------------+---------+-------+------+----------+-------+
| 1 | SIMPLE | customers | NULL | ref | customer_id | customer_id | 13 | const | 1 | 100.00 | NULL |
+----+-------------+-----------+------------+------+---------------+-------------+---------+-------+------+----------+-------+
從上述的輸出結果,顯然MySQL伺服器會使用索引customer_id來查詢表格。可以看需要掃描的行數為1。雖然我只是在一個行數為500的表格中執行這條查詢語句,索引在檢索一個更大的資料集的時候優化程度更加明顯。
2. 用Union優化Like語句
有時候,你可能需要在查詢中使用or操作符進行比較。當or關鍵字在where子句中使用頻率過高的時候,它可能會使MySQL優化器錯誤的選擇全表掃描來檢索記錄。union子句可以是查詢執行的更快,尤其是當其中一個查詢有一個優化索引,而另一個查詢也有一個優化索引的時候。
比如,在first_name
和last_name
上分別存在索引的情況下,執行如下查詢語句:
mysql> select * from students where first_name like 'Ade%' or last_name like 'Ade%'
上述查詢和下面使用union合併兩條充分利用查詢語句的查詢相比,速度慢了許多。
mysql> select * from students where first_name like 'Ade%' union all select * from students where last_name like 'Ade%'
3. 避免使用帶有前導萬用字元的表示式
當查詢中存在前導萬用字元時,Mysql無法使用索引。以上面的student表為例,如下的查詢會導致MySQL執行全表掃描,及時first_name
欄位上加了索引。
mysql> select * from students where first_name like '%Ade'
使用explain分析得到如下結果:
mysql> explain select * from students where first_name like '%Ade' ;
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
| 1 | SIMPLE | students | NULL | ALL | NULL | NULL | NULL | NULL | 500 | 11.11 | Using where |
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
如上所示,Mysql將掃描全部500行資料,這將使得查詢極其緩慢。
4. 充分利用MySQL的全文檢索
如果你正面臨著使用萬用字元查詢資料,但是並不想降低資料庫的效能,你應當考慮使用MySQL的全文檢索(FTS),因為它比萬用字元查詢快得多。除此以外,FTS還能夠返回質量更好的相關結果。
新增一個全文檢索索引到student樣表上的語句如下:
mysql> alter table students add fulltext(first_name, last_name)';
mysql> select * from students where match(first_name, last_name) against ('Ade');
在上面的例子中,我們針對搜尋關鍵字Ade
指定了想要匹配的列(first_name, last_name)。如果查詢優化器如上語句的執行情況,將得到下面的結果:
mysql> explain Select * from students where match(first_name, last_name) AGAINST ('Ade');
+----+-------------+----------+------------+----------+---------------+------------+---------+-------+------+----------+-------------------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+----------+------------+----------+---------------+------------+---------+-------+------+----------+-------------------------------+
| 1 | SIMPLE | students | NULL | fulltext | first_name | first_name | 0 | const | 1 | 100.00 | Using where; Ft_hints: sorted |
+----+-------------+----------+------------+----------+---------------+------------+---------+-------+------+----------+-------------------------------+
5. 優化資料庫架構
規範化
首先,規範化所有資料庫表,即使可能會有些損失。比如,如果你需要建立兩張表分別用來記錄customers和orders資料,你應當在order表上用顧客id引用顧客,而不是反過來。下圖顯示了沒有任何資料冗餘而設計的資料庫架構。
除此以外,對相似的值使用同一種資料型別類儲存。
使用最佳資料型別
MySQL支援各種資料型別,包括integer,float,double,date,datetime,varchar,text等。當設計資料庫表時,應當儘可能使用能夠滿足特性的最短的資料型別。
比如,如果你在設計一個系統使用者表,而該使用者數量不會超過100個人,你就應該對user_ud使用'TINYINT'型別,該型別的取值範圍為-128至128。如果一個欄位需要儲存date型值,使用datetime型別比較好,因為在查詢的時候無需進行復雜的型別轉換。
當值全為數字型別時,使用Integer。在進行計算時,Integer型別的值比文字型別的值速度更快。
避免NULL
NULL指該列沒有任何值。你應當儘可能的避免這型別的值因為他們會損害資料庫結果。比如你需要獲得資料庫中所有訂單金額的和,但是某個訂單記錄中金額為null,如果不注意空指標,很有可能導致計算結果出現異常。在某些情況下,你可能需要為列定義一個預設值。