1. 程式人生 > >mysql中in與exists的效能與效率對比

mysql中in與exists的效能與效率對比

有一種說法,說exists效能比in要好,其實不全然。哪個效能更好,需要看具體的需求場景。
1、如何選擇使用in 或者 exists?
1)子表資料量比外表資料量少,使用in。
2)子表資料量比外表資料量大,使用exists。
3)子表與外表資料量大小差不多,用in與exists的效率相差不大。
2、原因分析
1)in語句:使用hash將外表與內表連線。select * from A where id in (select id from B) 會用到A表的id索引
(轉)以上查詢使用了in語句,in()只執行一次,它查出B表中的所有id欄位並快取起來.之後,檢查A表的id是否與B表中的id相等,如果相等則將A表的記錄加入結果集中,直到遍歷完A表的所有記錄.如:A表有10000條記錄,B表有1000000條記錄,那麼最多有可能遍歷10000*1000000次,效率很差.
再如:A表有10000條記錄,B表有100條記錄,那麼最多有可能遍歷10000*100次,遍歷次數大大減少,效率大大提升.
2)exists是對外表做loop迴圈,每次loop迴圈再對子表進行訪問。select a.* from A a where exists(select 1 from B b where a.id=b.id)  會用B表的id索引
(轉)以上查詢使用了exists語句,exists()會執行A.length次,它並不快取exists()結果集,因為exists()結果集的內容並不重要,重要的是結果集中是否有記錄,如果有則返回true,沒有則返回false.當B表比A表資料大時適合使用exists(),因為它沒有那麼遍歷操作,只需要再執行一次查詢就行.
如:A表有10000條記錄,B表有1000000條記錄,那麼exists()會執行10000次去判斷A表中的id是否與B表中的id相等.
如:A表有10000條記錄,B表有100000000條記錄,那麼exists()還是執行10000次,因為它只執行A.length次,可見B表資料越多,越適合exists()發揮效果.
再如:A表有10000條記錄,B表有100條記錄,那麼exists()還是執行10000次,還不如使用in()遍歷10000*100次,因為in()是在記憶體裡遍歷比較,而exists()需要查詢資料庫,我們都知道查詢資料庫所消耗的效能更高,而記憶體比較很快.



3、not in 和 not exists
使用not in 會內外表都全表掃描;使用not exists還能用上內表(子表)的索引。所以,一定建議使用Not exists