1. 程式人生 > >SQL這樣幹,你就是給自己刨坑……

SQL這樣幹,你就是給自己刨坑……

SQL是作為一個程式設計師接觸得非常多的一種語言,但是,很多時候,我們會發現,有些SQL的執行效率異常的差,造成了資料庫的負擔。我們通過分析這些有問題的SQL,就可以發現很多我們平時在寫SQL的時候忽略的問題。

今天,我們就來講一下這些需要改掉的壞習慣。

儘量少用負向條件查詢

假設我們有一個Order表,表中有一個欄位是Status,這個欄位有4個值,分別是0=待支付、1=待發貨、2=待收貨、3=已完成。

這時,我們要查詢所有已經支付的訂單,很多人就會寫這樣的SQL:

  select * from Order where Status != 0

這就是一個不好的習慣了。負向條件查詢(例如:!=、not in、not exists)都是不能使用索引的,當Order表中的資料到達一定量級時,這個查詢的效率會急劇的下降。

在這裡插入圖片描述
所以,正確的寫法應該是:

select * from Order where Status in (1,2,3)

儘量少用前導模糊查詢

假設我們現在要根據使用者的訂單號(OrderNo)查詢使用者的訂單,如果是直接通過SQL查詢的話,儘量不要使用前導模糊查詢,也就是:

select * from Order where OrderNo like '%param'

或者

select * from Order where OrderNo like '%param%'

因為,前導模糊查詢是無法命中索引的,所以,會整個資料庫去檢索,效率相當的差,而非前導模糊查詢則是可以使用索引的。

在這裡插入圖片描述
因此,我們儘量不要把萬用字元放在前面,改成下面這樣:

select * from Order where OrderNo like 'param%'

在這裡插入圖片描述

儘量不要在條件欄位上進行運算

假設,現在有一個需求,是要查詢2018年全年的訂單資料,我們就需要通過建立時間(CreateTime)來進行檢索,但是,有些程式設計師就喜歡這樣寫SQL:

select * from Order where Year(CreateTime)=2018

然後,每次執行時就會發現,查詢的速度異常的慢,導致了大量的請求掛起甚至超時。這是因為,我們即使在CreateTime上建立了索引,但是,如果使用了運算函式,查詢一樣會進行全表的檢索。

在這裡插入圖片描述
所以,我們可以改成這樣:

select * from Order where CreateTime > '2018-1-1 00:00:00'

當查詢允許Null值的列時,需要特別注意

我們在建立表的欄位時,如果這個欄位需要作為索引時,儘量不要允許Null。因為,單列索引不會存Null值,複合索引不存所有索引列都為Null的值,所以如果列允許為Null,可能會得到“不符合預期”的結果集。

例如:我們有一個User表,其中有UserName欄位記錄了使用者的名字,並且添加了索引。
在這裡插入圖片描述
在這裡插入圖片描述
現在我們執行了這樣一個查詢:

select * from User where UserName != '小倩'

但結果是這樣的

在這裡插入圖片描述
那位UserName為Null的資料並沒有能包括進來。因此,如果我們想要包含這個使用者的話,最好能夠設定一個預設值。

複合索引,使用時要注意順序

登入,肯定是我們使用得最多的一個查詢了,為了保證效率,我們為LoginID和Password加上了複合索引。

當我們使用

select * from User where LoginID = '{LoginID}' and Password = '{Password}'
select * from User where Password = '{Password}' and LoginID = '{LoginID}'

查詢時,都是能夠準備的命中索引。當我們使用:

select * from User where LoginID = '{LoginID}'

查詢時,也是能夠命中索引的。但是,當我們使用

select * from User where Password = '{Password}'

查詢時,確無法命中索引,這是什麼原因呢?

這是由於,複合索引對於查詢的順序是非常的銘感的,所以,符合索引中包含了幾種規則,其中就有全列匹配和最左字首匹配。

當所有列都能夠匹配時,雖然查詢的順序上有不同,但是查詢優化器會將順序進行調整,以滿足適合索引的順序,所以,順序的顛倒是沒有問題的。
在這裡插入圖片描述
但是,如果所有列不能匹配時,就必須滿足最左字首匹配了,也就是,必須按照從左到右的順序進行排列。因此,當我們建立是索引是<LoginID, Password>時,where Password = ‘{Password}’ 就不滿足最左字首規則,無法命中索引了。

結果唯一時,別悶著

通常,我們設計User表時,並不會把LoginID作為主鍵,但是,LoginID確會在業務邏輯中驗證唯一性,因此,如果使用

select * from User where LoginID = '{LoginID}'

查詢時,結果一定只有一條。但是,資料庫是不知道的,即使找到了這唯一的一條結果,他也會一直繼續,直到掃描完所有的資料。

因此,在執行這樣的查詢時,我們可以優化一下,改成:

select * from User where LoginID = '{LoginID}' limit 1

這樣,當查詢到結果時,就不會再繼續了。

最後,上面所有的例子都是坑

儘量少用或別用Select *,我們的查詢其實都是有目的的,就好像登入一樣,我們其實只需要知道有結果返回就行了,使用select count(0)就可以了,但是我們使用select * 的話,就會消耗大量無效的資料庫記憶體。
在這裡插入圖片描述