SQL優化案例(1)：隱式轉換

阿新 • • 發佈：2020-10-22

MySQL是當下最流行的關係型資料庫之一，網際網路高速發展的今天，MySQL資料庫在電商、金融等諸多行業的生產系統中被廣泛使用。

在實際的開發運維過程中，想必大家也常常會碰到慢SQL的困擾。一條效能不好的SQL，往往會帶來過大的效能開銷，進而引起整個作業系統資源的過度使用，甚至造成會話堆積，引發線上故障。
而在SQL調優的場景中，一類比較常見的問題，就是隱式型別轉換。那什麼是隱式轉換呢？

在MySQL中，當操作符與不同型別的運算元一起使用時，會發生型別轉換以使運算元相容，此時則會發生隱式轉換。出現隱式轉換，往往意味著SQL的執行效率將大幅降低。
接下來筆者將結合幾大常見場景，讓大家實際體會什麼是隱式轉換，以及如何去應對出現隱式轉換的情況，請閱讀以下案例。

傳遞資料型別和欄位型別不一致造成隱式轉換

一類比較經典的場景就是傳遞資料型別和欄位型別不一致造成的隱式轉換，這種場景也是我們平時最常遇到的。具體可以看下下面這個例子：

1)待優化場景

SQL及執行計劃如下：

select * from dt_t1 where emp_no = 41680;

該表索引如下：

key idx_empno (`emp_no`)

2）場景解析

從執行計劃中Type部分：ALL，全表掃描，而沒有走idx_empno索引, 一般這種情況可能傳遞的資料型別和實際的欄位型別不一致，那麼我們來看下具體的表結構。

root@localhost mysql.sock 5.7.28-log :[employees] 14:48:10>desc employees;
+------------+---------------+------+-----+---------+-------+
| Field      | Type          | Null | Key | Default | Extra |
+------------+---------------+------+-----+---------+-------+
| emp_no     | varchar(14)   | NO   | MUL | NULL    |       |
| birth_date | date          | NO   |     | NULL    |       |
| first_name | varchar(14)   | NO   |     | NULL    |       |
| last_name  | varchar(16)   | NO   |     | NULL    |       |
| gender     | enum('M','F') | NO   |     | NULL    |       |
| hire_date  | date          | NO   |     | NULL    |       |
+------------+---------------+------+-----+---------+-------+
6 rows in set (0.00 sec)

表結構中看到該欄位型別為varchar 型別，傳遞欄位為整型，造成隱式轉換不能走索引。

3）場景優化

該SQL可通過簡單改寫來避免出現隱式轉換，如下：

select * from dt_t1 where emp_no='41680';

當傳入資料是與匹配欄位一致的varchar型別時，便可以正常使用到索引了，優化效果如下：

關聯欄位型別不一致造成隱式轉換

除了常量匹配的查詢場景，關聯查詢在關聯欄位不一致的情況下，也會出現隱式轉換。

1)待優化場景

SELECT  count(*) from t1  as a
JOIN  `t2`  b on a.`id` = b.`alipay_order_no` ;

2）場景解析

從執行計劃中可以看出被驅動表 b, Extra:Range checked for each record (index map: 0x8)

一般在當我們看到Range checked for each record (index map: 0x8) 的時候，可能就是發生了隱式轉換，我們來看下官方文件是怎麼解釋的

Range checked for each record (index map: N) (JSON property: message)
MySQL found no good index to use, but found that some of indexes might be used after column values from preceding tables are known. For each row combination in the preceding tables, MySQL checks whether it is possible to use a range or index_merge access method to retrieve rows. This is not very fast, but is faster than performing a join with no index at all. The applicability criteria are as described in Section 8.2.1.2, “Range Optimization”, and Section 8.2.1.3, “Index Merge Optimization”, with the exception that all column values for the preceding table are known and considered to be constants.
Indexes are numbered beginning with 1, in the same order as shown by SHOW INDEX for the table. The index map value N is a bitmask value that indicates which indexes are candidates. For example, a value of 0x19 (binary 11001) means that indexes 1, 4, and 5 will be considered.

查看下錶結構：

CREATE TABLE `t2` (
 `id` int(11) NOT NULL AUTO_INCREMENT,
 `alipay_order_no` varchar(45) DEFAULT NULL,
 xxxx
 PRIMARY KEY (`id`),
 KEY `idx_alipay_order_no_temp` (`alipay_order_no`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=2539968 DEFAULT CHARSET=utf8
共返回 1 行記錄,花費 5 ms.
 CREATE TABLE `t1` (
 `id` bigint(20) NOT NULL,
 xxxxxx
 PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8
共返回 1 行記錄,花費 5 ms.

我們從表結構上面進行觀察到該關聯欄位資料一個是int 型別，一個是varchar 型別。

當發生這種場景的時候我們應該如何優化呢？

我們還回來看看下具體的執行計劃，該驅動表為a,被驅動表b; 關聯條件：a.id = b.alipay_order_no ; 當a 表的欄位id 當為常數傳遞給b.alipay_order_no 的時候，發生column_type 不一致，無法使用索引，那麼我們讓a.id 傳遞的欄位型別和b.alipay_order_no 保持一致，就可以使用索引了？

3）場景優化

我們可以對驅動表的關聯欄位進行顯式的型別轉換，讓其與被驅動表關聯欄位型別一致。改寫後SQL如下：

SELECT  count(*)
from `t1`a
 JOIN `t2` b on CAST( a.`id` AS CHAR ) = b.`alipay_order_no`

進行改寫後就可以正常利用索引進行關聯了，執行計劃如下：

字符集不一致造成隱式轉換

前面的兩種場景都是操作符兩側資料型別不同的情況，事實上，資料型別相同也可能會出現隱式轉換，比如下面這個字符集不一致導致隱式轉換的例子：

1)待優化場景

SQL及執行計劃如下：

SELECT COUNT(*)
FROM `t1`  o
join `t2`  og  ON `o`.`def8`= `og`.`group_id`
WHERE  o.`def1`= 'DG21424956'

2）場景解析

從這個執行計劃中我們可以看出第二列表og 中含有using join buffer (Block Nested Loop) ，TYpe=ALL .

一般這種情況下：using join buffer (Block Nested Loop) ，發生的情況是 a. 關聯欄位沒有索引 b.發生隱式轉換等

看下具體表結構：

create table t1(
 ..... 
 `group_id` varchar(20) NOT NULL,
 PRIMARY KEY (`id`),
 KEY `group_id` (`group_id`)
 ) ENGINE=InnoDB DEFAULT CHARSET=utf8
create table t2(
 ..... 
 `def8` varchar(20) DEFAULT NULL,
 PRIMARY KEY (`id`),
 KEY `idx_tr_def1` (`def8`)
 ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4

我們從表結構中可以看出關聯欄位都存在索引，但字符集是不一樣的，t1 utf8，t2 utf8mb4.

3）場景優化

SQL改寫思路和上例類似，我們對驅動表的關聯欄位進行字符集轉換，如下：

SELECT COUNT(*)   FROM `t1`  o
left join `t2` og  ON CONVERT(  o.`def8`  USING utf8 ) = `og`.`group_id`
WHERE  o.`def1`= 'DG21424956

轉換成一致的字符集之後，便可以通過索引進行關聯了

校驗規則不一致造成隱式轉換

那麼，只要保證操作符兩側資料型別以及字符集一致，就不會出現隱式轉換嗎？

答案是否定的，因為字符集還有一個很重要的屬性，就是校驗規則，當校驗規則不一致的時候，也是會出現隱式轉換行為的。具體看下面這個例子：

1)待優化場景

SELECT *
FROM `t1`
WHERE `uuid` in (SELECT uuid  FROM t2 WHERE project_create_at!= "0000-00-00 00:00:00")

該SQL執行計劃如下：

2）場景解析

兩張表的表結構如下：

CREATE TABLE `t1` (
 `id` int(11) NOT NULL AUTO_INCREMENT,  `
 uuid` varchar(128) COLLATE utf8_unicode_ci NOT NULL DEFAULT '' COMMENT 'UUID',
 xxxxxx
 PRIMARY KEY (`id`),
UNIQUE KEY `uuid_idx` (`uuid`)
) ENGINE=InnoDB AUTO_INCREMENT=2343994 DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci
CREATE TABLE `t2` (
 `id` int(11) NOT NULL AUTO_INCREMENT,
 `uuid` varchar(128) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NOT NULL DEFAULT '' COMMENT '專案uuid',
PRIMARY KEY (`id`),
) ENGINE=InnoDB AUTO_INCREMENT=5408 DEFAULT CHARSET=utf8

我們從表結構看出，t1表作為被驅動表uuid是存在唯一索引的，並且關聯欄位資料型別以及字符集也都是一致的，但是校驗規則的不同導致了這個場景無法使用到索引。

3）場景優化

我們可以通過如下改寫，對驅動表關聯欄位的校驗規則進行顯示定義，讓其與被驅動表一致

explain extended
select b.*
from (select  uuid COLLATE utf8_unicode_ci as uuid
from t1 where project_create_at != "0000-00-00 00:00:00") a, t2 b
where a.uuid = b.uuid
+--------------+-----------------------+--------------------+----------------+-----------------------+-------------------+---------------+----------------+-----------------------+
| id           | select_type           | table              | type           | key                   | key_len           | ref           | rows           | Extra                 |
+--------------+-----------------------+--------------------+----------------+-----------------------+-------------------+---------------+----------------+-----------------------+
| 1            | PRIMARY               | <derived2>         | ALL            |                       |                   |               | 51             |                       |
| 1            | PRIMARY               | b                  | eq_ref         | uuid_idx              | 386               | a.uuid        | 1              |                       |
| 2            | DERIVED               | volunteer_patients | range          | idx-project-create-at | 6                 |               | 51             | Using index condition |
+--------------+-----------------------+--------------------+----------------+-----------------------+-------------------+---------------+----------------+-----------------------+
共返回 3 行記錄,花費 4 ms.

可以看到，改寫後的SQL，正常使用到索引進行欄位關聯，這樣就達到了我們預期的效果。

總結

隱式轉換出現的場景主要有欄位型別不一致、關聯欄位型別不一致、字符集型別不一致或校對規則不一致等。當出現隱式轉換帶來的SQL效能問題時，分析相應場景對症下藥即可。

除此之外，隱式轉換還可能會帶來查詢結果集不準，字符集不一致也會造成主從同步報錯等，因此在實際使用時我們應當儘量避免。

更多技術型文章可關注公眾號“雲掣YUNCHE”
也可到官網作進一步瞭解：https://www.dtstack.com/dtsmart/

SQL優化案例(1)：隱式轉換

MySQL是當下最流行的關係型資料庫之一，網際網路高速發展的今天，MySQL資料庫在電商、金融等諸多行業的生產系統中被廣泛使用。

MySQL效能優化：MySQL中的隱式轉換造成的索引失效

資料庫優化是一個任重而道遠的任務，想要做優化必須深入理解資料庫的各種特性。在開發過程中我們經常會遇到一些原因很簡單但造成的後果卻很嚴重的疑難雜症，這類問題往往還不容易定位，排查費時費力最後發現是一個很

SQL Server 中的資料型別隱式轉換問題

寫這篇文章的時候，還真不知道如何取名，也不知道這個該如何將其歸類。這個是同事遇到的一個案例，案例比較複雜，這裡抽絲剝繭，僅僅構造一個簡單的案例來展現一下這個問題。我們先構造測試資料，如下所示：

隱式轉換引起的sql慢查詢實戰記錄

引言實在很無語呀，遇到一個mysql隱式轉換問題，問了周邊的dba大拿該問題，他們居然反問我，你連這個也不知道？白白跟他們混了那麼長尼瑪，我還真不知道。罪過罪過….

【詳解】JavaScript面試題大坑：隱式型別轉換！

黑馬程式設計師視訊庫播妞微訊號：heiniu526 傳智播客旗下網際網路資訊、學習資源免費分享平臺

SQL優化案例（2）：OR條件優化

接下來上一篇文章《 SQL優化案例（1）：隱式轉換》的介紹，此處內容圍繞OR的優化展開。

雜記四：scala 柯理化和隱式轉換

技術標籤：雜記scala大資料 1、柯理化柯里化(Currying)指的是將原來接受兩個引數的函式變成新的接受一個引數的函式的過程。新的函式返回一個以原有第二個引數為引數的函式。

1.21 null、undefined運算時進行的隱式轉換

當進行-（減）、*（乘）、/（除）、取餘（%）操作時，如果有不是數值的運算元，則先在後臺使用Number()函式將其轉換為數值。

淺析SQL資料型別的隱式轉換與顯式轉換以及隱式轉換可能導致的問題

一、隱式型別轉換問題 1、隱式型別轉換：　　比如：SELECT 1 + \'1\'; 2、隱式型別轉換的問題：

Scala 隱式轉換報錯：not enough arguments for method sorted: (implicit ord: scala.math.Ordering[U])List[U]. Unspecified value parameter ord.

原始碼如下： def bubbleSortStrategy[U](dataset: List[U]) : List[U] ={ println(\"sort in bubble\")

SQL優化案例(1)：隱式轉換

傳遞資料型別和欄位型別不一致造成隱式轉換

關聯欄位型別不一致造成隱式轉換

字符集不一致造成隱式轉換

校驗規則不一致造成隱式轉換

總結

SQL優化案例(1)：隱式轉換

MySQL效能優化：MySQL中的隱式轉換造成的索引失效

SQL Server 中的資料型別隱式轉換問題

隱式轉換引起的sql慢查詢實戰記錄

【詳解】JavaScript面試題大坑：隱式型別轉換！

SQL優化案例（2）：OR條件優化

雜記四：scala 柯理化和隱式轉換

1.21 null、undefined運算時進行的隱式轉換

淺析SQL資料型別的隱式轉換與顯式轉換以及隱式轉換可能導致的問題

Scala 隱式轉換報錯：not enough arguments for method sorted: (implicit ord: scala.math.Ordering[U])List[U]. Unspecified value parameter ord.

一次弄懂Javascript隱式轉換

Scala 系列（十三）—— 隱式轉換和隱式引數

Scala implicit 隱式轉換安全駕駛指南

scala 隱式轉換與隱式引數的使用方法

解析MySQL隱式轉換問題

C++隱式轉換問題分析及解決辦法

入門大資料---Scala隱式轉換和隱式引數

SQL優化案例（分割槽表問題）

JS進階（一）資料型別與隱式轉換

sql優化案例（filter）

SQL優化案例(1)：隱式轉換

傳遞資料型別和欄位型別不一致造成隱式轉換

關聯欄位型別不一致造成隱式轉換

字符集不一致造成隱式轉換

校驗規則不一致造成隱式轉換

總結

相關推薦