1. 程式人生 > >SQL條件放在on、where、having的區別和關係

SQL條件放在on、where、having的區別和關係

參考文章:

SQL中ON和WHERE的區別


在寫SQL語句的時候,我們經常會用到各種表連線(left join, right join, inner join, full join),還有各種分組聚合函式(sum, min, max, avg, count),那麼我們在寫SQL的時候,對於不同的過濾條件具體是應該放在連線操作中的 ON 後面,還是分組操作的 having 後面,還是 where條件中呢。

在看了很多前輩的知識帖子之後,總結出的三種條件關鍵字的執行順序如下:

 

簡單的來講,就是:

on > where > 聚合函式 > having

 

詳細的來講,就是:

表關聯生生成臨時表, on 條件生效(此時的臨時表會因為left join或right join的特性而一定帶有主表的記錄,也就是主表的記錄不會被 on 條件過濾掉) ---》 臨時表生成完畢,where條件過濾臨時表(where條件過濾時因為臨時表已經生成完畢,因此不會再具有left join或right join的特性,也就是主表記錄也會被where條件過濾掉) ---》 臨時表過濾完畢,聚合函式進行運算 ---》 聚合函式運算完畢,having生效對運算完畢的臨時表進行過濾 ---》最終的結果表

 

那麼我們選擇的標準也很簡單:

1. 如果我們的過濾條件需要在聚合函式運算完畢之後才能確定,比如我們想要找出平均分數大於60分的班級,那麼就必須等待分組聚合函式執行完畢才能進行過濾,那這個條件肯定就是放在having中了,因為where生效的時候聚合函式還沒有進行運算呢。

2. 如果我們的過濾條件不需要依賴聚合函式,只是想要表關聯之後的結果表中符合條件的部分,而沒有要求保留主表的全部記錄,那麼我們就應該放在where條件中,當然,如果表關聯是採用inner join的話,因為沒有主從表的關係,所以放在 where 和 on 中是一樣的。

3. 如果我們的過濾條件不需要依賴聚合函式,並且在表關聯後需要保留主表的所有記錄,不論有沒有相匹配的從表記錄,那麼我們就應該將過濾條件放在 on 中。

 

就效能來看:

因為on生效最早,所以放在on中應該最快,其次是where,最後是having。



SQL中ON和WHERE的區別

資料庫在通過連線兩張或多張表來返回記錄時,都會生成一張中間的臨時表,然後再將這張臨時表返回給使用者。

在使用left jion時,on和where條件的區別如下:

1、 on條件是在生成臨時表時使用的條件,它不管on中的條件是否為真,都會返回左邊表中的記錄。

2、where條件是在臨時表生成好後,再對臨時表進行過濾的條件。這時已經沒有left join的含義(必須返回左邊表的記錄)了,條件不為真的就全部過濾掉。

 

假設有兩張表:

表1:tab2

id size

1 10

2 20

3 30

表2:tab2 

size name

10 AAA

20 BBB

20 CCC

兩條SQL:

1、select * form tab1 left join tab2 on (tab1.size = tab2.size) where tab2.name=’AAA’

2、select * form tab1 left join tab2 on (tab1.size = tab2.size and tab2.name=’AAA’)

第一條SQL的過程:1、中間表on條件: tab1.size = tab2.size tab1.id tab1.size tab2.size tab2.name

1 10 10 AAA

2 20 20 BBB

2 20 20 CCC

3 30 (null) (null)

 

2、再對中間表過濾where 條件:tab2.name=’AAA’ tab1.id tab1.size tab2.size tab2.name

1 10 10 AAA

 

第二條SQL的過程:1、中間表on條件: tab1.size = tab2.size and tab2.name=’AAA’(條件不為真也會返回左表中的記錄) tab1.id tab1.size tab2.size tab2.name

1 10 10 AAA

2 20 (null) (null)

3 30 (null) (null)

其實以上結果的關鍵原因就是left join,right join,full join的特殊性,不管on上的條件是否為真都會返回left或right表中的記錄,full則具有left和right的特性的並集。 而inner join沒這個特殊性,則條件放在on中和where中,返回的結果集是相同的。on為了反映外連線中一方的全連線,而where沒有這個功能,內連線配對是可以的。


on、where、having的區別

on、where、having這三個都可以加條件的子句中,on是最先執行,where次之,having最後。有時候如果這先後順序不影響中間結果的話,那最終結果是相同的。但因為on是先把不符合條件的記錄過濾後才進行統計,它就可以減少中間運算要處理的資料,按理說應該速度是最快的。

   根據上面的分析,可以知道where也應該比having快點的,因為它過濾資料後才進行sum,所以having是最慢的。但也不是說having沒用,因為有時在步驟3還沒出來都不知道那個記錄才符合要求時,就要用having了。

   在兩個表聯接時才用on的,所以在一個表的時候,就剩下where跟having比較了。在這單表查詢統計的情況下,如果要過濾的條件沒有涉及到要計算欄位,那它們的結果是一樣的,只是where可以使用rushmore技術,而having就不能,在速度上後者要慢。

   如果要涉及到計算的欄位,就表示在沒計算之前,這個欄位的值是不確定的,根據上篇寫的工作流程,where的作用時間是在計算之前就完成的,而having就是在計算後才起作用的,所以在這種情況下,兩者的結果會不同。

   在多表聯接查詢時,on比where更早起作用。系統首先根據各個表之間的聯接條件,把多個表合成一個臨時表後,再由where進行過濾,然後再計算,計算完後再由having進行過濾。由此可見,要想過濾條件起到正確的作用,首先要明白這個條件應該在什么時候起作用,然後再決定放在那裡


JOIN聯表中ON,WHERE後面跟條件的區別

對於JOIN的連表操作,這裡就不細述了,當我們在對錶進行JOIN關聯操作時,對於ON和WHERE後面的條件,不清楚大家有沒有注意過,有什么區別,可能有的朋友會認為跟在它們後面的條件是一樣的,你可以跟在ON後面,如果願意,也可以跟在WHERE後面。它們在ON和WHERE後面究竟有一個什么樣的區別呢?

在JOIN操作裡,有幾種情況。LEFT JOIN,RIGHT JOIN,INNER JOIN等。

為了清楚的表達主題所描述的問題,我簡要的對LEFT,RIGHT,INNER這幾種連線方式作一個說明。

下面就拿一個普通的部落格系統的日誌表(post)和分類表(category)來描述吧。

這裡我們規定有的日誌可能沒有分類,有的分類可能目前沒有屬於它的文章。

1.LEFT JOIN:(保證找出左聯表中的所有行)

查出所有文章,並顯示出他們的分類:

SELECT p.title,c.category_name 

FROM post p 

LEFT JOIN category c ON p.cid = c.cid2.

RIGHT JOIN:(保證找出右聯表中的所有行)

查詢所有的分類,並顯示出該分類所含有的文章數。

SELECT COUNT(p.id),c.category_name 

FROM post p 

RIGHT JOIN category c ON p.pid = c.cid3.   

INNER JOIN:(找出兩表中關聯相等的行)

查詢有所屬分類的日誌。(即那些沒有所性分類的日誌文章將不要我們的查詢範圍之內)。

SELECT p.title,c.category_name 

FROM post p 

INNER JOIN category c ON p.cid = c.cid.這種情況和直接兩表硬關聯等價。

現在我們回過頭來看上面的問題。對於第一種情況,如果我們所ON 的條件寫在WHERE 後面,將會出現什么情況呢?即:

SELECT p.title,c.category_name 

FROM post p 

LEFT JOIN category c 

WHERE p.cid = c.cid

對於第二種情況,我們同樣按照上面的書寫方式。

SELECT COUNT(p.id),c.category_name 

FROM post p 

RIGHT JOIN category c 

WHERE p.pid = c.cid

如果執行上面的SQL語句,就會發現,它們已經過濾掉了一些不滿足條件的記錄,可能在這裡,大家會產生疑問了,不是用了LEFT和RIGHT嗎?它們可以保證左邊或者右邊的所有行被全部查詢出來,為什么現在不管用了呢?對於出現這種的問題,呵呵!是不是覺得有些不可思議。出現這種的問題,原因就在WHERE和ON這兩個關鍵字後面跟條件。

好了,現在我也不調大家味口了,給大家提示答案吧。

對於JOIN參與的表的關聯操作,如果需要不滿足連線條件的行也在我們的查詢範圍內的話,我們就必需把連線條件放在ON後面,而不能放在WHERE後面,如果我們把連線條件放在了WHERE後面,那么所有的LEFT,RIGHT,等這些操作將不起任何作用,對於這種情況,它的效果就完全等同於INNER連線。對於那些不影響選擇行的條件,放在ON或者WHERE後面就可以。

記住:所有的連線條件都必需要放在ON後面,不然前面的所有LEFT,和RIGHT關聯將作為擺設,而不起任何作用。


sql where 1=1 0=1 的妙用

where 1=1有什麼用?在SQL語言中,寫這麼一句話就跟沒寫一樣。

select * from table1 where 1=1與select * from table1完全沒有區別,甚至還有其他許多寫法,1<>2,'a'='a','a'<>'b',其目的就只有一個,where的條件為永真,得到的結果就是未加約束條件的。

在SQL注入時會用到這個,例如select * from table1 where name='lala'給強行加上select * from table1 where name='lala' or 1=1這就又變成了無約束的查詢了。

最近發現的妙用在於,在不定數量查詢條件情況下,1=1可以很方便的規範語句。例如一個查詢可能有name,age,height,weight約束,也可能沒有,那該如何處理呢?

String sql=select * from table1 where 1=1

為什麼要寫多餘的1=1?馬上就知道了。

if(!name.equals("")){

sql=sql+"name='"+name+"'";

}

if(!age.equals("")){

sql=sql+"age'"+age+"'";

}

if(!height.equals("")){

sql=sql+"height='"+height+"'";

}

if(!weight.equals("")){

sql=sql+"weight='"+weight+"'";

}

如果不寫1=1呢,那麼在每一個不為空的查詢條件面前,都必須判斷有沒有where字句,否則要在第一個出現的地方加where

今天看到:"SELECT * FROM strName WHERE 1 = 0";

不理解為什麼有1=0?

查詢得出答案:

該select語句主要用於讀取表的結構而不考慮表中的資料,這樣節省了記憶體,因為可以不用儲存結果集。

另外,這個用在什麼地方呢?主要用於建立一個新表,而新表的結構與查詢的表的結構是一樣的。如下SQL語句:

create table newtableas select * from oldtablewhere 1=0;