SQL各種連線查詢詳解(左連線、右連線..)
一、交叉連線(cross join)
交叉連線(cross join):有兩種,顯式的和隱式的,不帶on子句,返回的是兩表的乘積,也叫笛卡爾積。
例如:下面的語句1和語句2的結果是相同的。
語句1:隱式的交叉連線,沒有cross join。
select o.id, o.order_number, c.id, c.name from orders o , customers c where o.id=1;
語句2:顯式的交叉連線,使用cross join。
select o.id,o.order_number,c.id,c.name from orders o cross join customers cwhere o.id=1;
語句1和語句2的結果是相同的,查詢結果如下:
二、內連線(inner join)
內連線(inner join):有兩種,顯式的和隱式的,返回連線表中符合連線條件和查詢條件的資料行。(所謂的連結表就是資料庫在做查詢形成的中間表)。
例如:下面的語句3和語句4的結果是相同的。
語句3:隱式的內連線,沒有inner join,形成的中間表為兩個表的笛卡爾積。
select o.id,o.order_number,c.id,c.name from customers c, orders o where c.id=o.customer_id;
語句4:顯示的內連線,一般稱為內連線,有inner join,形成的中間表為兩個表經過on條件過濾後的笛卡爾積。
select o.id,o.order_number,c.id,c.name from customers c inner join orders o on c.id=o.customer_id;
語句3和語句4的查詢結果:
三、外連線(outer join):
外連不但返回符合連線和查詢條件的資料行,還返回不符合條件的一些行。外連線分三類:左外連線(left outer join)、右外連線(right outer join)和全外連線(full outer join)。
三者的共同點是都返回符合連線條件和查詢條件(即:內連線)的資料行。不同點如下:
左外連線還返回左表中不符合連線條件單符合查詢條件的資料行。
右外連線還返回右表中不符合連線條件單符合查詢條件的資料行。
全外連線還返回左表中不符合連線條件單符合查詢條件的資料行,並且還返回右表中不符合連線條件單符合查詢條件的資料行。全外連線實際是上左外連線和右外連線的數學合集(去掉重複),即“全外=左外 union 右外”。
說明:左表就是在“(left outer join)”關鍵字左邊的表。右表當然就是右邊的了。在三種類型的外連線中,outer 關鍵字是可省略的。
下面舉例說明:
語句5:左外連線(left outer join)
select o.id,o.order_number,o.customer_id,c.id,c.name from orders o left outer join customers c on c.id=o.customer_id;
語句6:右外連線(right outer join)
select o.id,o.order_number,o.customer_id,c.id,c.name from orders o right outer join customers c on c.id=o.customer_id;
注意:where條件放在on後面查詢的結果是不一樣的。例如:
語句7:where條件獨立。
select o.id,o.order_number,o.customer_id,c.id,c.name from orders o left outer join customers c on c.id=o.customer_id where o.order_number<>'mike_order001';
語句8:將語句7中的where條件放到on後面。
select o.id,o.order_number,o.customer_id,c.id,c.name from orders o left outer join customers c on c.id=o.customer_id and o.order_number<>'mike_order001';
從語句7和語句8查詢的結果來看,顯然是不相同的,語句8顯示的結果是難以理解的。因此,推薦在寫連線查詢的時候,on後面只跟連線條件,而對中間表限制的條件都寫到where子句中。
語句9:全外連線(full outer join)。
select o.id,o.order_number,o.customer_id,c.id,c.name from orders o full outer join customers c on c.id=o.customer_id;
注意:mysql是不支援全外的連線的,這裡給出的寫法適合oracle和db2。但是可以通過左外和右外求合集來獲取全外連線的查詢結果。下圖是上面sql在oracle下執行的結果:
語句10:左外和右外的合集,實際上查詢結果和語句9是相同的。
select o.id,o.order_number,o.customer_id,c.id,c.name from orders o left outer join customers c on c.id=o.customer_id union select o.id,o.order_number,o.customer_id,c.id,c.name from orders o right outer join customers c on c.id=o.customer_id;
語句9和語句10的查詢結果是相同的,如下:
四、聯合連線(union join):
這是一種很少見的連線方式。oracle、mysql均不支援,其作用是:找出全外連線和內連線之間差異的所有行。這在資料分析中排錯中比較常用。也可以利用資料庫的集合操作來實現此功能。
語句11:聯合查詢(union join)例句,還沒有找到能執行的sql環境。
select o.id,o.order_number,o.customer_id,c.id,c.name from orders o union join customers c on c.id=o.customer_id
語句12:語句11在db2下的等價實現。還不知道db2是否支援語句11呢!
select o.id,o.order_number,o.customer_id,c.id,c.name from orders o full outer join customers c on c.id=o.customer_id except select o.id,o.order_number,o.customer_id,c.id,c.name from orders o inner join customers c on c.id=o.customer_id;
語句13:語句11在oracle下的等價實現。
select o.id,o.order_number,o.customer_id,c.id,c.name from orders o full outer join customers c on c.id=o.customer_id minus select o.id,o.order_number,o.customer_id,c.id,c.name from orders o inner join customers c on c.id=o.customer_id;
查詢結果如下:
五、自然連線(natural inner join):
說真的,這種連線查詢沒有存在的價值,既然是sql2標準中定義的,就給出個例子看看吧。自然連線無需指定連線列,sql會檢查兩個表中是否相同名稱的列,且假設他們在連線條件中使用,並且在連線條件中僅包含一個連線列。不允許使用on語句,不允許指定顯示列,顯示列只能用*表示(oracle環境下測 試的)。對於每種連線型別(除了交叉連線外),均可指定natural。下面給出幾個例子。
語句14:
select * from orders o natural inner join customers c;
語句15:
select * from orders o natural left outer join customers c;
語句16:
select * from orders o natural right outer join customers c;
語句17:
select * from orders o natural full outer join customers c;
六、sql查詢的基本原理:兩種情況介紹。
第一、 單表查詢:根據where條件過濾表中的記錄,形成中間表(這個中間表對使用者是不可見的);然後根據select的選擇列選擇相應的列進行返回最終結果。
第二、 兩表連線查詢:對兩表求積(笛卡爾積)並用on條件和連線型別進行過濾形成中間表;然後根據where條件過濾中間表的記錄,並根據select指定的列返回查詢結果。
第三、 多表連線查詢:先對第一個和第二個表按照兩表連線做查詢,然後用查詢結果和第三個表做連線查詢,以此類推,直到所有的表都連線上為止,最終形成一箇中間的結果表,然後根據where條件過濾中間表的記錄,並根據select指定的列返回查詢結果。
理解sql查詢的過程是進行sql優化的理論依據。
七、on後面的條件(on條件)和where條件的區別:
on條件:是過濾兩個連結表笛卡爾積形成中間表的約束條件。
where條件:在有on條件的select語句中是過濾中間表的約束條件。在沒有on的單表查詢中,是限制物理表或者中間查詢結果返回記錄的約束。在兩表或多表連線中是限制連線形成最終中間表的返回結果的約束。
從這裡可以看出,將where條件移入on後面是不恰當的。推薦的做法是:
on只進行連線操作,where只過濾中間表的記錄。
八、總結
連線查詢是sql查詢的核心,連線查詢的連線型別選擇依據實際需求。如果選擇不當,非但不能提高查詢效率,反而會帶來一些邏輯錯誤或者效能低下。下面總結一下兩表連線查詢選擇方式的依據:
1、 查兩表關聯列相等的資料用內連線。
2、 col_l是col_r的子集時用右外連線。
3、 col_r是col_l的子集時用左外連線。
4、 col_r和col_l彼此有交集但彼此互不為子集時候用全外。
5、 求差操作的時候用聯合查詢。
多個表查詢的時候,這些不同的連線型別可以寫到一塊。例如:
select t1.c1,t2.cx,t3.cy from tab1 t1 inner join tab2 t2 on (t1.c1=t2.c2) inner join tab3 t3 on (t1.c1=t2.c3) left outer join tab4 on(t2.c2=t3.c3); where t1.x >t3.y;
上面這個sql查詢是多表連線的一個示範。