1. 程式人生 > >in 和exist 的效率

in 和exist 的效率

轉載自:【http://lobert.iteye.com/blog/1676897

mysql中的in語句是把外表和內表作hash 連線,而exists語句是對外表作loop迴圈,每次loop迴圈再對內表進行查詢。

一直大家都認為exists比in語句的效率要高,這種說法其實是不準確的。這個是要區分環境的。 

【1】如果查詢的兩個表大小相當,那麼用in和exists差別不大。 


【2】如果兩個表中一個較小,一個是大表,則子查詢表大的用exists,子查詢表小的用in: 


例如:表A(小表),表B(大表)
1:

select * from A where cc in (select cc from B) 效率低,用到了A表上cc列的索引; 
select * from A where exists(select cc from B where cc=A.cc) 效率高,用到了B表上cc列的索引。

相反的 
2:

select * from B where cc in (select cc from A) 效率高,用到了B表上cc列的索引;
select * from B where exists(select cc from A where cc=B.cc) 效率低,用到了A表上cc列的索引。

not in 和not exists如果查詢語句使用了not in 那麼內外表都進行全表掃描,沒有用到索引;

而not extsts 的子查詢依然能用到表上的索引。

所以無論那個表大,用not exists都比not in要快。 

in 與 =的區別 

select name from student where name in ('zhang','wang','li','zhao'); 

與 

select name from student where name='zhang' or name='li' or name='wang' or name='zhao' 

的結果是相同的。

最後在自己理解 在前面已經說出  說先說面 where 前後區分內外標

當子查詢是大表的時候用 exist ,因為exist 是對外表loop迴圈 即每次外表的欄位所有結果集,在外表上加索引 查詢的快,如果用in 的 在前面已經說明 in 就是兩個hash 連線,當子查詢即外表很大時,hash 連線很消耗cost ,查詢慢。

反之,當 外表很小的時,直接hash 就會很快 .

也就是 所謂的 外表大用 exist 外表小用 in

自己的理解,如果有錯誤,請諒解!請指出!