一千個不用 Null 的理由

阿新 • • 發佈：2019-01-01

全世界有3.14 %的人已經關注了

資料與演算法之美

港真，Null 貌似在哪裡都是個頭疼的問題，比如 Java 裡讓人頭疼的 NullPointerException，為了避免猝不及防的空指標異常，千百年來程式猿們不得不在程式碼裡小心翼翼的各種 if 判斷，麻煩而又臃腫，為此 java8 引入了 Optional 來避免這一問題。

下面咱們要聊的是 MySQL 裡的 null，在大量的 MySQL 優化文章和書籍裡都提到了欄位儘可能用NOT NULL，而不是NULL，除非特殊情況。但卻都只給結論不說明原因，猶如雞湯不給勺子一樣，讓不少初學者對這個結論半信半疑或者雲裡霧裡。本文今天就詳細的剖析下使用 Null 的原因，並給出一些不用 Null 的理由。

1、NULL 為什麼這麼多人用？

NULL是建立資料表時預設的，初級或不知情的或怕麻煩的程式設計師不會注意這點。
很多人員都以為not null 需要更多空間，其實這不是重點。

重點是很多程式設計師覺得NULL在開發中不用去判斷插入資料，寫sql語句的時候更方便快捷。

2、是不是以訛傳訛？

MySQL 官網文件：

NULL columns require additional space in the rowto record whether their values are NULL. For MyISAM tables, each NULL columntakes one bit extra, rounded up to the nearest byte.

Mysql難以優化引用可空列查詢，它會使索引、索引統計和值更加複雜。可空列需要更多的儲存空間，還需要mysql內部進行特殊處理。可空列被索引後，每條記錄都需要一個額外的位元組，還能導致MYisam 中固定大小的索引變成可變大小的索引。

—— 出自《高效能mysql第二版》

照此分析，還真不是以訛傳訛，這是有理論依據和出處的。

3、給我一個不用 Null 的理由？

所有使用NULL值的情況，都可以通過一個有意義的值的表示，這樣有利於程式碼的可讀性和可維護性，並能從約束上增強業務資料的規範性。
NULL值到非NULL的更新無法做到原地更新，更容易發生索引分裂，從而影響效能。

注意：但把NULL列改為NOT NULL帶來的效能提示很小，除非確定它帶來了問題，否則不要把它當成優先的優化措施，最重要的是使用的列的型別的適當性。

NULL值在timestamp型別下容易出問題，特別是沒有啟用引數explicit_defaults_for_timestamp
NOT IN、!= 等負向條件查詢在有 NULL 值的情況下返回永遠為空結果，查詢容易出錯

舉例：

create table table_2 (
     `id` INT (11) NOT NULL,
    user_name varchar(20) NOT NULL
)


create table table_3 (
     `id` INT (11) NOT NULL,
    user_name varchar(20)
)

insert into table_2 values (4,"zhaoliu_2_1"),(2,"lisi_2_1"),(3,"wangmazi_2_1"),(1,"zhangsan_2"),(2,"lisi_2_2"),(4,"zhaoliu_2_2"),(3,"wangmazi_2_2")

insert into table_3 values (1,"zhaoliu_2_1"),(2, null)

-- 1、NOT IN子查詢在有NULL值的情況下返回永遠為空結果，查詢容易出錯
select user_name from table_2 where user_name not in (select user_name from table_3 where id!=1)

mysql [email protected]:t_test_zz5431> select user_name from table_2 where user_name not
                                    -> in (select user_name from table_3 where id!=1);
+-------------+
| user_name   |
|-------------|
+-------------+
0 rows in set
Time: 0.008s
mysql [email protected]10.48.186.32:t_test_zz5431>

-- 2、單列索引不存null值，複合索引不存全為null的值，如果列允許為null，可能會得到“不符合預期”的結果集
-- 如果name允許為null，索引不儲存null值，結果集中不會包含這些記錄。所以，請使用not null約束以及預設值。
select * from table_3 where name != 'zhaoliu_2_1'

-- 3、如果在兩個欄位進行拼接：比如題號+分數，首先要各欄位進行非null判斷，否則只要任意一個欄位為空都會造成拼接的結果為null。
select CONCAT("1",null) from dual; -- 執行結果為null。

-- 4、如果有 Null column 存在的情況下，count(Null column)需要格外注意，null 值不會參與統計。
mysql [email protected]10.48.186.32:t_test_zz5431> select * from table_3;
+------+-------------+
|   id | user_name   |
|------+-------------|
|    1 | zhaoliu_2_1 |
|    2 | <null>      |
|   21 | zhaoliu_2_1 |
|   22 | <null>      |
+------+-------------+
4 rows in set
Time: 0.007s
mysql [email protected]10.48.186.32:t_test_zz5431> select count(user_name) from table_3;
+--------------------+
|   count(user_name) |
|--------------------|
|                  2 |
+--------------------+
1 row in set
Time: 0.007s

-- 5、注意 Null 欄位的判斷方式， = null 將會得到錯誤的結果。
mysql [email protected]:cygwin> create index IDX_test on table_3 (user_name);
Query OK, 0 rows affected
Time: 0.040s
mysql [email protected]:cygwin>  select * from table_3 where user_name is null\G
***************************[ 1. row ]***************************
id        | 2
user_name | None

1 row in set
Time: 0.002s
mysql [email protected]:cygwin> select * from table_3 where user_name = null\G

0 rows in set
Time: 0.002s
mysql [email protected]:cygwin> desc select * from table_3 where user_name = 'zhaoliu_2_1'\G
***************************[ 1. row ]***************************
id            | 1
select_type   | SIMPLE
table         | table_3
type          | ref
possible_keys | IDX_test
key           | IDX_test
key_len       | 23
ref           | const
rows          | 1
Extra         | Using where

1 row in set
Time: 0.006s
mysql [email protected]:cygwin> desc select * from table_3 where user_name = null\G
***************************[ 1. row ]***************************
id            | 1
select_type   | SIMPLE
table         | None
type          | None
possible_keys | None
key           | None
key_len       | None
ref           | None
rows          | None
Extra         | Impossible WHERE noticed after reading const tables

1 row in set
Time: 0.002s
mysql [email protected]:cygwin> desc select * from table_3 where user_name is null\G
***************************[ 1. row ]***************************
id            | 1
select_type   | SIMPLE
table         | table_3
type          | ref
possible_keys | IDX_test
key           | IDX_test
key_len       | 23
ref           | const
rows          | 1
Extra         | Using where

1 row in set
Time: 0.002s
mysql [email protected]:cygwin>

Null 列需要更多的儲存空間：需要一個額外位元組作為判斷是否為 NULL 的標誌位

舉例：

alter table table_3 add index idx_user_name (user_name);
alter table table_2 add index idx_user_name (user_name);
explain select * from table_2 where user_name='zhaoliu_2_1';
explain select * from table_3 where user_name='zhaoliu_2_1';

640?wx_fmt=png

可以看到同樣的 varchar(20) 長度，table_2 要比 table_3 索引長度大，這是因為：

兩張表的字符集不一樣，且欄位一個為 NULL 一個非 NULL。

640?wx_fmt=png

key_len 的計算規則和三個因素有關：資料型別、字元編碼、是否為 NULL

key_len 62 == 20*3（utf8 3位元組） + 2 （儲存 varchar 變長字元長度 2位元組，定長欄位無需額外的位元組）
key_len 83 == 20*4（utf8mb4 4位元組） + 1 (是否為 Null 的標識) + 2 （儲存 varchar 變長字元長度 2位元組，定長欄位無需額外的位元組）

所以說索引欄位最好不要為NULL，因為NULL會使索引、索引統計和值更加複雜，並且需要額外一個位元組的儲存空間。基於以上這些理由和原因，我想咱們不用 Null 的理由應該是夠了 :)推薦閱讀《演算法之美》

來自：Java知音

作者：leejun2005

連結：

https://my.oschina.net/leejun2005

版權歸原作者所有，轉載僅供學習使用，不用於任何商業用途，如有侵權請留言聯絡刪除，感謝合作。

精品課程推薦：

選購數學科普正版讀物

資料與演算法之美

用資料解決不可能

長按掃碼關注

一千個不用 Null 的理由

1、NULL 為什麼這麼多人用？

2、是不是以訛傳訛？

3、給我一個不用 Null 的理由？

一千個不用 Null 的理由

選擇消失，僅僅因一千個傷心的理由

爬蟲實例——爬取python百度百科相關一千個詞條

求一個有一千個元素的整數數組的最大子數組的和

中國最美的一千個漢字 : 千字文3

中國最美的一千個漢字 : 千字文4

中國最美的一千個漢字 : 千字文

中國最美的一千個漢字 : 千字文2

中國最美的一千個漢字 : 千字文5

Python幹貨大派送！一千個Python庫，只有你想不到，沒有查不到！

爬蟲很簡單麽？直到我抓取了一千億個網頁後我懂！爬蟲真不簡單！

敏捷開發一千零一問系列之三十八：計劃撲克就是打不出個結果怎麼辦？

敏捷開發一千零一問：怎樣處理重要但不明白的任務？

linux一天一個腳印：進程的管理

qt的應用層主要是大型3d，vr，管理軟件和器械嵌入軟件（有上千個下一代軟件黑科技項目是qt的，美國宇航局，歐洲宇航局，超級戰艦DDG1000）

如何像好萊塢黑客一樣裝個B？

為什麽Goroutine能有上百萬個，Java線程卻只能有上千個？

一天一個設計模式(五) - 適配器模式(Adapter)

一天一個設計模式(四) - 原型模式(Prototype)

一天一個設計模式(一) - 總體概述

一千個不用 Null 的理由

1、NULL 為什麼這麼多人用？

2、是不是以訛傳訛？

3、給我一個不用 Null 的理由？

相關推薦