SQL Server2005雜談(3):公用表表達式(CTE)的遞迴呼叫
本文為原創,如需轉載,請註明作者和出處,謝謝!
先看如下一個資料表(t_tree):
上圖顯示了一個表中的資料,這個表有三個欄位:id、node_name、parent_id。實際上,這個表中儲存了一個樹型結構,分三層:省、市、區。其中id表示當前省、市或區的id號、node_name表示名稱、parent_id表示節點的父節點的id。
現在有一個需求,要查詢出某個省下面的所有市和區(查詢結果包含省)。如果只使用SQL語句來實現,需要使用到遊標、臨時表等技術。但在SQL Server2005中還可以使用CTE來實現。
從這個需求來看屬於遞迴呼叫,也就是說先查出滿足調價的省的記錄,在本例子中的要查“遼寧省”的記錄,如下:
id node_name parent_id
1遼寧省 0
然後再查所有parent_id欄位值為1的記錄,如下:
id node_name parent_id
2瀋陽市 1
3大連市 1
最後再查parent_id欄位值為2或3的記錄,如下:
id node_name parent_id
4大東區 2
5瀋河區 2
6鐵西區 2
將上面三個結果集合並起來就是最終結果集。
上述的查詢過程也可以按遞迴的過程進行理解,即先查指定的省的記錄(遼寧省),得到這條記錄後,就有了相應的
從上面可以看出,遞迴的過程就是使用union all合併查詢結果集的過程,也就是相當於下面的遞迴公式:
resultset(n) = resultset(n-1) union all current_resultset
其中resultset(n)表示最終的結果集,resultset(n - 1)表示倒數第二個結果集,current_resultset表示當前查出來的結果集,而最開始查詢出“遼寧省”的記錄集相當於遞迴的初始條件。而遞迴的結束條件是current_resultset為空。下面是這個遞迴過程的虛擬碼:
public{
if(resultset is null)
{
current_resultset =第一個結果集(包含省的記錄集)
將結果集的id儲存在集合中
getResultSet(current_resultset)
}
current_resultset = 根據id集合中的id值查出當前結果集
if(current_result is null) return resultset
將當前結果集的id儲存在集合中
return getResultSet(resultset union all current_resultset)
}
// 獲得最終結果集
resultset = getResultSet(null)
從上面的過程可以看出,這一遞迴過程實現起來比較複雜,然而CTE為我們提供了簡單的語法來簡化這一過程。
實現遞迴的CTE語法如下:
<common_table_expression>::=
expression_name [ ( column_name [ ,n ] ) ]
AS (
CTE_query_definition1 -- 定位點成員(也就是初始值或第一個結果集) union all
CTE_query_definition2 -- 遞迴成員 )
下面是使用遞迴CTE來獲得“遼寧省”及下面所有市、區的資訊的SQL語句:
withdistrict as
(
-- 獲得第一個結果集,並更新最終結果集select * from t_tree where node_name= N'遼寧省'union all-- 下面的select語句首先會根據從上一個查詢結果集中獲得的id值來查詢parent_id -- 欄位的值,然後district就會變當前的查詢結果集,並繼續執行下面的select 語句-- 如果結果集不為null,則與最終的查詢結果合併,同時用合併的結果更新最終的查-- 詢結果;否則停止執行。最後district的結果集就是最終結果集。select a.* from t_tree a, district b
where a.parent_id = b.id
)
select * from district
查詢後的結果如下圖所示。
下面的CTE查詢了非葉子節點: withdistrict as
(
select * from t_tree where node_name= N'遼寧省'union allselect a.* from t_tree a, district b
where a.parent_id = b.id
),
district1 as
(
select a.* from district a where a.id in (select parent_id from district)
)
select * from district1
查詢結果如下圖所示。
注:只有“遼寧省”和“瀋陽市”有下子節點。
在定義和使用遞迴CTE時應注意如下幾點:
1. 遞迴 CTE 定義至少必須包含兩個 CTE 查詢定義,一個定位點成員和一個遞迴成員。可以定義多個定位點成員和遞迴成員;但必須將所有定位點成員查詢定義置於第一個遞迴成員定義之前。所有 CTE 查詢定義都是定位點成員,但它們引用 CTE 本身時除外。
2. 定位點成員必須與以下集合運算子之一結合使用:UNION ALL、UNION、INTERSECT 或 EXCEPT。在最後一個定位點成員和第一個遞迴成員之間,以及組合多個遞迴成員時,只能使用 UNION ALL 集合運算子。
3. 定位點成員和遞迴成員中的列數必須一致。
4. 遞迴成員中列的資料型別必須與定位點成員中相應列的資料型別一致。
5. 遞迴成員的 FROM 子句只能引用一次 CTE expression_name。
6. 在遞迴成員的 CTE_query_definition 中不允許出現下列項:
(1)SELECT DISTINCT
(2)GROUP BY
(3)HAVING
(4)標量聚合
(5)TOP
(6)LEFT、RIGHT、OUTER JOIN(允許出現 INNER JOIN)
(7)子查詢
(8)應用於對 CTE_query_definition 中的 CTE 的遞迴引用的提示。
7. 無論參與的 SELECT 語句返回的列的為空性如何,遞迴 CTE 返回的全部列都可以為空。
8. 如果遞迴 CTE 組合不正確,可能會導致無限迴圈。例如,如果遞迴成員查詢定義對父列和子列返回相同的值,則會造成無限迴圈。可以使用 MAXRECURSION 提示以及在 INSERT、UPDATE、DELETE 或 SELECT 語句的 OPTION 子句中的一個 0 到 32,767 之間的值,來限制特定語句所允許的遞迴級數,以防止出現無限迴圈。這樣就能夠在解決產生迴圈的程式碼問題之前控制語句的執行。伺服器範圍內的預設值是 100。如果指定 0,則沒有限制。每一個語句只能指定一個 MAXRECURSION 值。
9. 不能使用包含遞迴公用表表達式的檢視來更新資料。
10. 可以使用 CTE 在查詢上定義遊標。遞迴 CTE 只允許使用快速只進遊標和靜態(快照)遊標。如果在遞迴 CTE 中指定了其他遊標型別,則該型別將轉換為靜態遊標型別。
11. 可以在 CTE 中引用遠端伺服器中的表。如果在 CTE 的遞迴成員中引用了遠端伺服器,那麼將為每個遠端表建立一個假離線,這樣就可以在本地反覆訪問這些表。