1. 程式人生 > >如何優化MYSQL查詢

如何優化MYSQL查詢

轉載自:https://segmentfault.com/a/1190000016592261

 

1. 在所有用於where,order bygroup by的列上新增索引

索引除了能夠確保唯一的標記一條記錄,還能是MySQL伺服器更快的從資料庫中獲取結果。索引在排序中的作用也非常大。

Mysql的索引可能會佔據額外的空間,並且會一定程度上降低插入,刪除和更新的效能。但是,如果你的表格有超過10行資料,那麼索引就能極大的降低查詢的執行時間。

強烈建議使用“最壞情況的資料樣本”來測試MySql查詢,從而更清晰的瞭解查詢在生產中的行為方式。

假設你正在一個超過500行的資料庫表中執行如下的查詢語句:

mysql>select customer_id, customer_name from customers where customer_id='345546'

上述查詢會迫使Mysql伺服器執行一個全表掃描來獲得所查詢的資料。

型號,Mysql提供了一個特別的Explain語句,用來分析你的查詢語句的效能。當你將查詢語句新增到該關鍵詞後面時,MySql會顯示優化器對該語句的所有資訊。

如果我們用explain語句分析一下上面的查詢,會得到如下的分析結果:

mysql> explain select customer_id, customer_name from customers where customer_id='140385';
+----+-------------+-----------+------------+------+---------------+------+---------+------+------+----------+-------------+
| id | select_type | table     | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra       |
+----+-------------+-----------+------------+------+---------------+------+---------+------+------+----------+-------------+
|  1 | SIMPLE      | customers | NULL       | ALL  | NULL          | NULL | NULL    | NULL |  500 |    10.00 | Using where |
+----+-------------+-----------+------------+------+---------------+------+---------+------+------+----------+-------------+

可以看到,優化器展示出了非常重要的資訊,這些資訊可以幫助我們微調資料庫表。首先,MySql會執行一個全表掃描,因為key列為Null。其次,MySql伺服器已經明確表示它將要掃描500行的資料來完成這次查詢。

為了優化上述查詢,我們只需要在customer_id這一列上新增一個索引m即可:

mysql> Create index customer_id ON customers (customer_Id);
Query OK, 0 rows affected (0.02 sec)
Records: 0  Duplicates: 0  Warnings: 0

如果我們再次執行explain語句,會得到如下結果:

mysql> Explain select customer_id, customer_name from customers where customer_id='140385';
+----+-------------+-----------+------------+------+---------------+-------------+---------+-------+------+----------+-------+
| id | select_type | table     | partitions | type | possible_keys | key         | key_len | ref   | rows | filtered | Extra |
+----+-------------+-----------+------------+------+---------------+-------------+---------+-------+------+----------+-------+
|  1 | SIMPLE      | customers | NULL       | ref  | customer_id   | customer_id | 13      | const |    1 |   100.00 | NULL  |
+----+-------------+-----------+------------+------+---------------+-------------+---------+-------+------+----------+-------+

從上述的輸出結果,顯然MySQL伺服器會使用索引customer_id來查詢表格。可以看需要掃描的行數為1。雖然我只是在一個行數為500的表格中執行這條查詢語句,索引在檢索一個更大的資料集的時候優化程度更加明顯。

2. 用Union優化Like語句

有時候,你可能需要在查詢中使用or操作符進行比較。當or關鍵字在where子句中使用頻率過高的時候,它可能會使MySQL優化器錯誤的選擇全表掃描來檢索記錄。union子句可以是查詢執行的更快,尤其是當其中一個查詢有一個優化索引,而另一個查詢也有一個優化索引的時候。

比如,在first_namelast_name上分別存在索引的情況下,執行如下查詢語句:

mysql> select * from students where first_name like 'Ade%' or last_name like 'Ade%'

上述查詢和下面使用union合併兩條充分利用查詢語句的查詢相比,速度慢了許多。

mysql> select * from students where first_name like 'Ade%' union all select * from students where last_name like 'Ade%' 

3. 避免使用帶有前導萬用字元的表示式

當查詢中存在前導萬用字元時,Mysql無法使用索引。以上面的student表為例,如下的查詢會導致MySQL執行全表掃描,及時first_name欄位上加了索引。

mysql> select * from students where first_name like '%Ade'

使用explain分析得到如下結果:

mysql> explain select * from students where first_name like  '%Ade'  ;
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
| id | select_type | table    | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra       |
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
|  1 | SIMPLE      | students | NULL       | ALL  | NULL          | NULL | NULL    | NULL |  500 |    11.11 | Using where |
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+

如上所示,Mysql將掃描全部500行資料,這將使得查詢極其緩慢。

4. 充分利用MySQL的全文檢索

如果你正面臨著使用萬用字元查詢資料,但是並不想降低資料庫的效能,你應當考慮使用MySQL的全文檢索(FTS),因為它比萬用字元查詢快得多。除此以外,FTS還能夠返回質量更好的相關結果。

新增一個全文檢索索引到student樣表上的語句如下:

mysql> alter table students add fulltext(first_name, last_name)';
mysql> select * from students where match(first_name, last_name) against ('Ade');

在上面的例子中,我們針對搜尋關鍵字Ade指定了想要匹配的列(first_name, last_name)。如果查詢優化器如上語句的執行情況,將得到下面的結果:

mysql> explain Select * from students where match(first_name, last_name) AGAINST ('Ade');
+----+-------------+----------+------------+----------+---------------+------------+---------+-------+------+----------+-------------------------------+
| id | select_type | table    | partitions | type     | possible_keys | key        | key_len | ref   | rows | filtered | Extra                         |
+----+-------------+----------+------------+----------+---------------+------------+---------+-------+------+----------+-------------------------------+
|  1 | SIMPLE      | students | NULL       | fulltext | first_name    | first_name | 0       | const |    1 |   100.00 | Using where; Ft_hints: sorted |
+----+-------------+----------+------------+----------+---------------+------------+---------+-------+------+----------+-------------------------------+

5. 優化資料庫架構

規範化

首先,規範化所有資料庫表,即使可能會有些損失。比如,如果你需要建立兩張表分別用來記錄customers和orders資料,你應當在order表上用顧客id引用顧客,而不是反過來。下圖顯示了沒有任何資料冗餘而設計的資料庫架構。

clipboard.png

除此以外,對相似的值使用同一種資料型別類儲存。

使用最佳資料型別

MySQL支援各種資料型別,包括integer,float,double,date,datetime,varchar,text等。當設計資料庫表時,應當儘可能使用能夠滿足特性的最短的資料型別。

比如,如果你在設計一個系統使用者表,而該使用者數量不會超過100個人,你就應該對user_ud使用'TINYINT'型別,該型別的取值範圍為-128至128。如果一個欄位需要儲存date型值,使用datetime型別比較好,因為在查詢的時候無需進行復雜的型別轉換。

當值全為數字型別時,使用Integer。在進行計算時,Integer型別的值比文字型別的值速度更快。

避免NULL

NULL指該列沒有任何值。你應當儘可能的避免這型別的值因為他們會損害資料庫結果。比如你需要獲得資料庫中所有訂單金額的和,但是某個訂單記錄中金額為null,如果不注意空指標,很有可能導致計算結果出現異常。在某些情況下,你可能需要為列定義一個預設值。