Oracle 樹操作、遞迴查詢(select…start with…connect by…prior)
一、Oracle中start with…connect by prior子句用法
connect by 是結構化查詢中用到的,其基本語法是:
select … from tablename start with 條件1
connect by 條件2
where 條件3;
例:
select * from table
start with org_id = ‘HBHqfWGWPy’
connect by prior org_id = parent_id;
簡單說來是將一個樹狀結構儲存在一張表裡,比如一個表中存在兩個欄位:
org_id,parent_id那麼通過表示每一條記錄的parent是誰,就可以形成一個樹狀結構。 用上述語法的查詢可以取得這棵樹的所有記錄。
其中:
條件1
條件2 是連線條件,其中用 PRIOR表示上一條記錄,比如 CONNECT BY PRIOR org_id = parent_id;就是說 上一條記錄的org_id 是本條記錄的parent_id,即本記錄的父親是上一條記錄。
條件3 是過濾條件,用於對返回的所有記錄進行過濾。
簡單介紹如下:
在掃描樹結構表時,需要依此訪問樹結構的每個節點,一個節點只能訪問一次,其訪問的步驟如下:
第一步:從根節點開始;
第二步:訪問該節點;
第三步:判斷該節點有無未被訪問的子節點,若有,則轉向它最左側的未被訪問的子節,並執行第二步,否則執行第四步;
第四步:若該節點為根節點,則訪問完畢,否則執行第五步;
第五步:返回到該節點的父節點,並執行第三步驟。
總之:掃描整個樹結構的過程也即是 中序遍歷樹
1.樹結構的描述
樹結構的資料存放在表中,資料之間的層次關係即父子關係,通過表中的列與列間的關係來描述,如EMP表中的EMPNO和MGR。EMPNO表示該僱員的編號,MGR表示領導該僱員的人的編號,即子節點的MGR值等於父節點的EMPNO值。在表的每一行中都有一個表示父節點的MGR(除根節點外),通過每個節點的父節點,就可以確定整個樹結構。
在SELECT命令中使用CONNECT BY 和START WITH 子句可以查詢表中的樹型結構關係。其命令格式如下:
SELECT . . .
CONNECT BY {PRIOR 列名1=列名2|列名1=PRIOR 裂名2}
[START WITH];
其中:CONNECT BY子句說明每行資料將是按層次順序檢索,並規定將表中的資料連入樹型結構的關係中。PRIOR運算子必須放置在連線關係的兩列中某一個的前面。對於節點間的父子關係, PRIOR運算子在一側表示父節點,在另一側表示子節點,從而確定查詢樹結構是的順序是自頂向下還是自底向上。 在連線關係中,除了可以使用列名外,還允許使用列表達式。START WITH 子句為可選項,用來標識哪個節點作為查詢樹型結構的根節點。若該子句被省略,則表示所有滿足查詢條件的行作為根節點。
START WITH:不但可以指定一個根節點,還可以指定多個根節點。
2.關於PRIOR
運算子PRIOR被放置於等號前後的位置,決定著查詢時的檢索順序。
PRIOR被置於CONNECT BY子句中等號的前面時,則強制從根節點到葉節點的順序檢索,即由父節點向子節點方向通過樹結構,我們稱之為自頂向下的方式。如:
CONNECT BY PRIOR EMPNO=MGR
PIROR運算子被置於CONNECT BY 子句中等號的後面時,則強制從葉節點到根節點的順序檢索,即由子節點向父節點方向通過樹結構,我們稱之為自底向上的方式。例如:
CONNECT BY EMPNO=PRIOR MGR
在這種方式中也應指定一個開始的節點。
3.定義查詢起始節點
在自頂向下查詢樹結構時,不但可以從根節點開始,還可以定義任何節點為起始節點,以此開始向下查詢。這樣查詢的結果就是以該節點為開始的結構樹的一枝。
4.使用LEVEL
在具有樹結構的表中,每一行資料都是樹結構中的一個節點,由於節點所處的層次位置不同,所以每行記錄都可以有一個層號。層號根據節點與根節點的距離確定。不論從哪個節點開始,該起始根節點的層號始終為1,根節點的子節點為2, 依此類推。圖1.2就表示了樹結構的層次。
5.節點和分支的裁剪
在對樹結構進行查詢時,可以去掉表中的某些行,也可以剪掉樹中的一個分支,使用WHERE子句來限定樹型結構中的單個節點,以去掉樹中的單個節點,但它卻不影響其後代節點(自頂向下檢索時)或前輩節點(自底向頂檢索時)。
6.排序顯示
象在其它查詢中一樣,在樹結構查詢中也可以使用ORDER BY 子句,改變查詢結果的顯示順序,而不必按照遍歷樹結構的順序。 二、例子
1、準備測試表和測試資料
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 |
--選單目錄結構表
create
table
tb_menu(
id number(10)
not
null
,
--主鍵id
title varchar2(50),
--標題
parent number(10)
--parent id
)
--父選單
insert
into
tb_menu(id, title, parent)
values
(1,
'父選單1'
,
null
);
insert
into
tb_menu(id, title, parent)
values
(2,
'父選單2'
,
null
);
insert
into
tb_menu(id, title, parent)
values
(3,
'父選單3'
,
null
);
insert
into
tb_menu(id, title, parent)
values
(4,
'父選單4'
,
null
);
insert
into
tb_menu(id, title, parent)
values
(5,
'父選單5'
,
null
);
--一級選單
insert
into
tb_menu(id, title, parent)
values
(6,
'一級選單6'
,1);
insert
into
tb_menu(id, title, parent)
values
(7,
'一級選單7'
,1);
insert
into
tb_menu(id, title, parent)
values
(8,
'一級選單8'
,1);
insert
into
tb_menu(id, title, parent)
values
(9,
'一級選單9'
,2);
insert
into
tb_menu(id, title, parent)
values
(10,
'一級選單10'
,2);
insert
into
tb_menu(id, title, parent)
values
(11,
'一級選單11'
,2);
insert
into
tb_menu(id, title, parent)
values
(12,
'一級選單12'
,3);
insert
into
tb_menu(id, title, parent)
values
(13,
'一級選單13'
,3);
insert
into
tb_menu(id, title, parent)
values
(14,
'一級選單14'
,3);
insert
into
tb_menu(id, title, parent)
values
(15,
'一級選單15'
,4);
insert
into
tb_menu(id, title, parent)
values
(16,
'一級選單16'
,4);
insert
into
tb_menu(id, title, parent)
values
(17,
'一級選單17'
,4);
insert
into
tb_menu(id, title, parent)
values
(18,
'一級選單18'
,5);
insert
into
tb_menu(id, title, parent)
values
(19,
'一級選單19'
,5);
insert
into
tb_menu(id, title, parent)
values
(20,
'一級選單20'
,5);
--二級選單
insert
into
tb_menu(id, title, parent)
values
(21,
'二級選單21'
,6);
insert
into
tb_menu(id, title, parent)
values
(22,
'二級選單22'
,6);
insert
into
tb_menu(id, title, parent)
values
(23,
'二級選單23'
,7);
insert
into
tb_menu(id, title, parent)
values
(24,
'二級選單24'
,7);
insert
into
tb_menu(id, title, parent)
values
(25,
'二級選單25'
,8);
insert
into
tb_menu(id, title, parent)
values
(26,
'二級選單26'
,9);
insert
into
tb_menu(id, title, parent)
values
(27,
'二級選單27'
,10);
insert
into
tb_menu(id, title, parent)
values
(28,
'二級選單28'
,11);
insert
into
tb_menu(id, title, parent)
values
(29,
'二級選單29'
,12);
insert
into
tb_menu(id, title, parent)
values
(30,
'二級選單30'
,13);
insert
into
tb_menu(id, title, parent)
values
(31,
'二級選單31'
,14);
insert
into
tb_menu(id, title, parent)
values
(32,
'二級選單32'
,15);
insert
into
tb_menu(id, title, parent)
values
(33,
'二級選單33'
,16);
insert
into
tb_menu(id, title, parent)
values
(34,
'二級選單34'
,17);
insert
into
tb_menu(id, title, parent)
values
(35,
'二級選單35'
,18);
insert
into
tb_menu(id, title, parent)
values
(36,
'二級選單36'
,19);
insert
into
tb_menu(id, title, parent)
values
(37,
'二級選單37'
,20);
--三級選單
insert
into
tb_menu(id, title, parent)
values
(38,
'三級選單38'
,21);
insert
into
tb_menu(id, title, parent)
values
(39,
'三級選單39'
,22);
insert
into
tb_menu(id, title, parent)
values
(40,
'三級選單40'
,23);
insert
into
tb_menu(id, title, parent)
values
(41,
'三級選單41'
,24);
insert
into
tb_menu(id, title, parent)
values
(42,
'三級選單42'
,25);
insert
into
tb_menu(id, title, parent)
values
(43,
'三級選單43'
,26);
insert
into
tb_menu(id, title, parent)
values
(44,
'三級選單44'
,27);
insert
into
tb_menu(id, title, parent)
values
(45,
'三級選單45'
,28);
insert
into
tb_menu(id, title, parent)
values
(46,
'三級選單46'
,28);
insert
into
tb_menu(id, title, parent)
values
(47,
'三級選單47'
,29);
insert
into
tb_menu(id, title, parent)
values
(48,
'三級選單48'
,30);
insert
into
tb_menu(id, title, parent)
values
(49,
'三級選單49'
,31);
insert
into
tb_menu(id, title, parent)
values
(50,
'三級選單50'
,31);
commit
;
select
*
from
tb_menu;
|
parent欄位儲存的是上級id,如果是頂級父節點,該parent為null(得補充一句,當初的確是這樣設計的,不過現在知道,表中最好別有null記錄,這會引起全文掃描,建議改成0代替)。
2、樹操作
我們從最基本的操作,逐步列出樹查詢中常見的操作,所有查詢出來的節點以家族中的輩份作比方。
1)、查詢樹中的所有頂級父節點(輩份最長的人)。 假設這個樹是個目錄結構,那麼第一個操作總是找出所有的頂級節點,再根據該節點找到其下屬節點。
1 |
select * from tb_menu m where m.parent is
null
;
|
2)、查詢一個節點的直屬子節點(所有兒子)。 如果查詢的是直屬子類節點,也是不用用到樹型查詢的。
1 |
select * from tb_menu m where m.parent=
1
;
|
3)、查詢一個節點的所有直屬子節點(所有後代)。
1 |
select * from tb_menu m start with m.id=
1
connect by m.parent=prior m.id;
|
這個查詢的是id為1的節點下的所有直屬子類節點,包括子輩的和孫子輩的所有直屬節點。
4)、查詢一個節點的直屬父節點(父親)。 如果查詢的是節點的直屬父節點,也是不用用到樹型查詢的。
1 2 3 4 |
--c-->child, p->parent
select c.id, c.title, p.id parent_id, p.title parent_title
from tb_menu c, tb_menu p
where c.parent=p.id and c.id=
6
|
5)、查詢一個節點的所有直屬父節點(祖宗)。
1 |
select * from tb_menu m start with m.id=
38
connect by prior m.parent=m.id;
|
這裡查詢的就是id為1的所有直屬父節點,打個比方就是找到一個人的父親、祖父等。但是值得注意的是這個查詢出來的結果的順序是先列出子類節點再列出父類節點,姑且認為是個倒序吧。
上面列出兩個樹型查詢方式,第3條語句和第5條語句,這兩條語句之間的區別在於prior關鍵字的位置不同,所以決定了查詢的方式不同。 當parent = prior id時,資料庫會根據當前的id迭代出parent與該id相同的記錄,所以查詢的結果是迭代出了所有的子類記錄;而prior parent = id時,資料庫會跟據當前的parent來迭代出與當前的parent相同的id的記錄,所以查詢出來的結果就是所有的父類結果。
以下是一系列針對樹結構的更深層次的查詢,這裡的查詢不一定是最優的查詢方式,或許只是其中的一種實現而已。
6)、查詢一個節點的兄弟節點(親兄弟)。
1 2 3 |
--m.parent=m2.parent-->同一個父親
select * from tb_menu m
where exists (select * from tb_menu m2 where m.parent=m2.parent and m2.id=
6
)
|
7)、查詢與一個節點同級的節點(族兄弟)。 如果在表中設定了級別的欄位,那麼在做這類查詢時會很輕鬆,同一級別的就是與那個節點同級的,在這裡列出不使用該欄位時的實現!
1 2 3 4 5 6 7 8 |
with tmp as(
select a.*, level leaf
from tb_menu a
start with a.parent is
null
connect by a.parent = prior a.id)
select *
from tmp
where leaf = (select leaf from tmp where id =
50
);
|
這裡使用兩個技巧,一個是使用了level來標識每個節點在表中的級別,還有就是使用with語法模擬出了一張帶有級別的臨時表。
8)、查詢一個節點的父節點的的兄弟節點(伯父與叔父)。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 |
with tmp as(
select tb_menu.*, level lev
from tb_menu
start with parent is
null
connect by parent = prior id)
select b.*
from tmp b,(select *
from tmp
where id =
21
and lev =
2
) a
where b.lev =
1
union all
select *
from tmp
where parent = (select distinct x.id
from tmp x, --祖父
tmp y, --父親
(select *
from tmp
where id =
21
and lev >
2
) z --兒子
where y.id = z.parent and x.id = y.parent);
|
這裡查詢分成以下幾步。
首先,將第7個一樣,將全表都使用臨時表加上級別;
其次,根據級別來判斷有幾種型別,以上文中舉的例子來說,有三種情況:
(1)當前節點為頂級節點,即查詢出來的lev值為1,那麼它沒有上級節點,不予考慮。
(2)當前節點為2級節點,查詢出來的lev值為2,那麼就只要保證lev級別為1的就是其上級節點的兄弟節點。
(3)其它情況就是3以及以上級別,那麼就要選查詢出來其上級的上級節點(祖父),再來判斷祖父的下級節點都是屬於該節點的上級節點的兄弟節點。
最後,就是使用union將查詢出來的結果進行結合起來,形成結果集。
9)、查詢一個節點的父節點的同級節點(族叔)。
這個其實跟第7種情況是相同的。
1 2 3 4 5 6 7 8 |
with tmp as(
select a.*, level leaf
from tb_menu a
start with a.parent is
null
connect by a.parent = prior a.id)
select *
from tmp
where leaf = (select leaf from tmp where id =
6
) -
1
;
|
基本上,常見的查詢在裡面了,不常見的也有部分了。其中,查詢的內容都是節點的基本資訊,都是資料表中的基本欄位,但是在樹查詢中還有些特殊需求,是對查詢資料進行了處理的,常見的包括列出樹路徑等。
補充一個概念,對於資料庫來說,根節點並不一定是在資料庫中設計的頂級節點,對於資料庫來說,根節點就是start with開始的地方。
下面列出的是一些與樹相關的特殊需求。
10)、名稱要列出名稱全部路徑。
這裡常見的有兩種情況,一種是從頂級列出,直到當前節點的名稱(或者其它屬性);一種是從當前節點列出,直到頂級節點的名稱(或其它屬性)。舉地址為例:國內的習慣是從省開始、到市、到縣、到居委會的,而國外的習慣正好相反(老師說的,還沒接過國外的郵件,誰能寄個瞅瞅 )。
從頂部開始:
1 2 3 4 5 |
select sys_connect_by_path (title,
'/'
)
from tb_menu
where id =
50
start with parent is
null
connect by parent = prior id;
|
從當前節點開始:
1 2 3 4 |
select sys_connect_by_path (title,
'/'
)
from tb_menu
start with id =
50
connect by prior parent = id;
|
在這裡我又不得不放個牢騷了。oracle只提供了一個sys_connect_by_path函式,卻忘了字串的連線的順序。在上面的例子中,第一個sql是從根節點開始遍歷,而第二個sql是直接找到當前節點,從效率上來說已經是千差萬別,更關鍵的是第一個sql只能選擇一個節點,而第二個sql卻是遍歷出了一顆樹來。再次ps一下。
sys_connect_by_path函式就是從start with開始的地方開始遍歷,並記下其遍歷到的節點,start with開始的地方被視為根節點,將遍歷到的路徑根據函式中的分隔符,組成一個新的字串,這個功能還是很強大的。
11)、列出當前節點的根節點。
在前面說過,根節點就是start with開始的地方。
1 2 3 4 |
select connect_by_root title, tb_menu.*
from tb_menu
start with id =
50
connect by prior parent = id;
|
connect_by_root函式用來列的前面,記錄的是當前節點的根節點的內容。
12)、列出當前節點是否為葉子。
這個比較常見,尤其在動態目錄中,在查出的內容是否還有下級節點時,這個函式是很適用的。
1 2 3 4 |
select connect_by_isleaf, tb_menu.*
from tb_menu
start with parent is
null
connect by parent = prior id;
|
connect_by_isleaf函式用來判斷當前節點是否包含下級節點,如果包含的話,說明不是葉子節點,這裡返回0;反之,如果不包含下級節點,這裡返回1。
至此,oracle樹型查詢基本上講完了,以上的例子中的資料是使用到做過的專案中的資料,因為裡面的內容可能不好理解,所以就全部用一些新的例子來進行闡述。以上所有sql都在本機上測試通過,也都能實現相應的功能,但是並不能保證是解決這類問題的最優方案(如第8條明顯寫成儲存過程會更好).