coding life
介紹另一種平衡二叉樹:紅黑樹(Red Black Tree),紅黑樹由Rudolf Bayer於1972年發明,當時被稱為平衡二叉B樹(symmetric binary B-trees),1978年被Leonidas J. Guibas 和Robert Sedgewick改成一個比較摩登的名字:紅黑樹。
紅黑樹和之前所講的AVL樹類似,都是在進行插入和刪除操作時通過特定操作保持二叉查詢樹的平衡,從而獲得較高的查詢效能。自從紅黑樹出來後,AVL樹就被放到了博物館裡,據說是紅黑樹有更好的效率,更高的統計效能。不過在我瞭解了紅黑樹的實現原理後,並不相信這是真的,關於這一點我們會在後面進行討論。
紅黑樹和
首先來一個Silverlight做的紅黑樹的動畫,它有助於幫你理解什麼是紅黑樹。這裡需要注意,必須安裝Silverlight 2.0 RTW 才能正常運行遊戲,下載地址:
使用注意事項:
l結點只接收整數,如果在新增和刪除操作中輸入非法字串,則會隨機新增或刪除一個0~99之間的整數。
l可以不在編輯框中輸入數字,直接單擊新增和刪除按鈕進行新增和刪除操作。
l可以拖動拖動條控制動畫速度。
紅黑樹的平衡
紅黑樹首先是一棵二叉查詢樹,它每個結點都被標上了顏色(紅色或黑色),紅黑樹滿足以下5個性質:
1、 每個結點的顏色只能是紅色或黑色。
2、 根結點是黑色的。
3、 每個葉子結點都帶有兩個空的黑色結點(被稱為黑哨兵),如果一個結點n的只有一個左孩子,那麼n的右孩子是一個黑哨兵;如果結點n只有一個右孩子,那麼n的左孩子是一個黑哨兵。
4、 如果一個結點是紅的,則它的兩個兒子都是黑的。也就是說在一條路徑上不能出現相鄰的兩個紅色結點。
5、 對於每個結點來說,從該結點到其子孫葉結點的所有路徑上包含相同數目的黑結點。
紅黑樹的這5個性質中,第3點是比較難理解的,但它卻非常有必要。我們看圖
要看真正的紅黑樹請在以上動畫中新增幾個結點,看看是否滿足以上性質。
紅黑樹的旋轉操作
紅黑樹的旋轉操作和AVL樹一樣,分為LL、RR、LR、RL四種旋轉型別,差別在於旋轉完成後改變的是結點的顏色,而不是平衡因子。旋轉動畫演示請參考AVL這篇文章中的Flash動畫:
http://www.cnblogs.com/abatei/archive/2008/11/17/1335031.html
紅黑樹上結點的插入
在討論紅黑樹的插入操作之前必須要明白,任何一個即將插入的新結點的初始顏色都為紅色。這一點很容易理解,因為插入黑點會增加某條路徑上黑結點的數目,從而導致整棵樹黑高度的不平衡。但如果新結點父結點為紅色時(如圖2所示),將會違返紅黑樹性質:一條路徑上不能出現相鄰的兩個紅色結點。這時就需要通過一系列操作來使紅黑樹保持平衡。
為了清楚地表示插入操作以下在結點中使用“新”字表示一個新插入的結點;使用“父”字表示新插入點的父結點;使用“叔”字表示“父”結點的兄弟結點;使用“祖”字表示“父”結點的父結點。插入操作分為以下幾種情況:
1、黑父
如圖3所示,如果新點的父結點為黑色結點,那麼插入一個紅點將不會影響紅黑樹的平衡,此時插入操作完成。紅黑樹比AVL樹優秀的地方之一在於黑父的情況比較常見,從而使紅黑樹需要旋轉的機率相對AVL樹來說會少一些。
2.紅父
如果新點的父結點為紅色,這時就需要進行一系列操作以保證整棵樹紅黑性質。如圖3所示,由於父結點為紅色,此時可以判定,祖父結點必定為黑色。這時需要根據叔父結點的顏色來決定做什麼樣的操作。青色結點表示顏色未知。由於有可能需要根結點到新點的路徑上進行多次旋轉操作,而每次進行不平衡判斷的起始點(我們可將其視為新點)都不一樣。所以我們在此使用一個藍色箭頭指向這個起始點,並稱之為判定點。
2.1 紅叔
當叔父結點為紅色時,如圖4所示,無需進行旋轉操作,只要將父和叔結點變為黑色,將祖父結點變為紅色即可。但由於祖父結點的父結點有可能為紅色,從而違反紅黑樹性質。此時必須將祖父結點作為新的判定點繼續向上進行平衡操作。
需要注意,無論“父”在“叔”的左邊還是右邊,無論“新”是“父”的左孩子還是右孩子,它們的操作都完全一樣。
2.2 黑叔
當叔父結點為黑色時,需要進行旋轉,以下圖示了所有的旋轉可能
情形1:
情形2:
情形3:
情形4:
可以觀察到,當旋轉完成後,新的旋轉根全部為黑色,此時不需要再向上回溯進行平衡操作,插入操作完成。需要注意,上面四張圖的“叔”、“1”、“2”、“3”結點有可能為黑哨兵結點。
其實紅黑樹的插入操作不是很難,甚至比AVL樹的插入操作還更簡單些。但刪除操作就遠遠比AVL樹複雜得多,下面就介紹紅黑樹的刪除操作。
紅黑樹上結點的刪除
紅黑樹本身是一棵二叉查詢樹,它的刪除和二叉查詢樹的刪除類似。首先要找到真正的刪除點,當被刪除結點n存在左右孩子時,真正的刪除點應該是n的中序遍在前驅,關於這一點請複習二叉查詢樹的刪除。如圖9所示,當刪除結點20時,實際被刪除的結點應該為18,結點20的資料變為18。
所以可以推斷出,在進行刪除操作時,真正的刪除點必定是隻有一個孩子或沒有孩子的結點。而根據紅黑樹的性質可以得出以下兩個結論:
1、 刪除操作中真正被刪除的必定是隻有一個紅色孩子或沒有孩子的結點。
2、 如果真正的刪除點是一個紅色結點,那麼它必定是一個葉子結點。
理解這兩點非常重要,如圖10所示,除了情況(a)外,其他任一種況結點N都無法滿足紅黑樹性質。
在以下討論中,我們使用藍色箭頭表示真正的刪除點,它也是旋轉操作過程中的第一個判定點;真正的刪除點使用“舊”標註,舊點所在位置將被它的的孩子結點所取代(最多隻有一個孩子),我們使用“新”表示舊點的孩子結點。刪除操作可分為以下幾種情形:
1、舊點為紅色結點
若舊點為紅色結點,則它必定是葉子結點,直接刪除即可。如圖11所示
2、一紅一黑
當舊點為黑色結點,新點為紅色結點時,將新點取代舊點位置後,將新點染成黑色即可(如圖12所示)。這裡需要注意:舊點為紅色,新點為黑色的情況不可能存在。
3、雙黑
當舊點和新點都為黑色時(新點為空結點時,亦屬於這種情況),情況比較複雜,需要根據舊點兄弟結點的顏色來決定進行什麼樣的操作。我們使用“兄”來表示舊點的兄弟結點。這裡可分為紅兄和黑兄兩種情況:
3.1 紅兄
由於兄弟結點為紅色,所以父結點必定為黑色,而舊點被刪除後,新點取代了它的位置。下圖演示了兩種可能的情況:
紅兄的情況需要進行RR或LL型旋轉,然後將父結點染成紅色,兄結點染成黑色。然後重新以新點為判定點進行平衡操作。我們可以觀察到,旋轉操作完成後,判定點沒有向上回溯,而是降低了一層,此時變成了黑兄的情況。
3.2 黑兄
黑兄的情況最為複雜,需要根據黑兄孩子結點(這裡用“侄”表示)和父親結點的顏色來決定做什麼樣的操作。
3.2.1 黑兄二黑侄紅父
如圖14所示,這種情況比較簡單,只需將父結點變為黑色,兄結點變為黑色,新結點變為黑色即可,刪除操作到此結束。
3.2.2 黑兄二黑侄黑父
如圖15所示,此時將父結點染成新結點的顏色,新結點染成黑色,兄結點染成紅色即可。當新結點為紅色時,父結點被染成紅色,此時需要以父結點為判定點繼續向上進行平衡操作。
3.2.3 黑兄紅侄
黑兄紅侄有以下四種情形,下面分別進行圖示:
情形1:
情形2:
情形3:
情形4:
由以上圖例所示,看完以上四張圖的兄弟有可能會有一個疑問,如果情形1和情形2中的兩個侄子結點都為紅色時,是該進行LL旋轉還是進行LR旋轉呢?答案是進行LL旋轉。情形3和情形4則是優先進行RR旋轉的判定。
教你透徹瞭解紅黑樹
作者 July、saturnman 2010年12月29日
本文參考:Google、演算法導論、STL原始碼剖析、計算機程式設計藝術。
本人宣告:個人原創,轉載請註明出處。
推薦閱讀:Left-Leaning Red-Black Trees, Dagstuhl Workshop on Data Structures, Wadern, Germany, February, 2008.
------------------------------
紅黑樹系列,四篇文章於今日已經完成。[二零一一年一月九日]
------------------------------
一、紅黑樹的介紹
先來看下演算法導論對R-B Tree的介紹:
紅黑樹,一種二叉查詢樹,但在每個結點上增加一個儲存位表示結點的顏色,可以是Red或Black。
通過對任何一條從根到葉子的路徑上各個結點著色方式的限制,紅黑樹確保沒有一條路徑會比其
他路徑長出倆倍,因而是接近平衡的。
前面說了,紅黑樹,是一種二叉查詢樹,既然是二叉查詢樹,那麼它必滿足二叉查詢樹的一般性質。
下面,在具體介紹紅黑樹之前,咱們先來了解下 二叉查詢樹的一般性質:
1.在一棵二叉查詢樹上,執行查詢、插入、刪除等操作,的時間複雜度為O(lgn)。
因為,一棵由n個結點,隨機構造的二叉查詢樹的高度為lgn,所以順理成章,一般操作的執行時間為O(lgn)。
//至於n個結點的二叉樹高度為lgn的證明,可參考演算法導論 第12章 二叉查詢樹 第12.4節。
2.但若是一棵具有n個結點的線性鏈,則此些操作最壞情況執行時間為O(n)。
而紅黑樹,能保證在最壞情況下,基本的動態幾何操作的時間均為O(lgn)。
ok,我們知道,紅黑樹上每個結點內含五個域,color,key,left,right。如果相應的指標域沒有,則設為NIL。
一般的,紅黑樹,滿足以下性質,即只有滿足以下全部性質的樹,我們才稱之為紅黑樹:
1)每個結點要麼是紅的,要麼是黑的。
2)根結點是黑的。
3)每個葉結點,即空結點(NIL)是黑的。
4)如果一個結點是紅的,那麼它的倆個兒子都是黑的。
5)對每個結點,從該結點到其子孫結點的所有路徑上包含相同數目的黑結點。
下圖所示,即是一顆紅黑樹:
此圖忽略了葉子和根部的父結點。
二、樹的旋轉知識
當我們在對紅黑樹進行插入和刪除等操作時,對樹做了修改,那麼可能會違背紅黑樹的性質。
為了保持紅黑樹的性質,我們可以通過對樹進行旋轉,即修改樹種某些結點的顏色及指標結構,以達到對紅黑樹進行
插入、刪除結點等操作時,紅黑樹依然能保持它特有的性質(如上文所述的,五點性質)。
樹的旋轉,分為左旋和右旋,以下藉助圖來做形象的解釋和介紹:
1.左旋
如上圖所示:
當在某個結點pivot上,做左旋操作時,我們假設它的右孩子y不是NIL[T],pivot可以為樹內任意右孩子而不是NIL[T]的結點。
左旋以pivot到y之間的鏈為“支軸”進行,它使y成為該孩子樹新的根,而y的左孩子b則成為pivot的右孩子。
來看演算法導論對此操作的演算法實現(以x代替上述的pivot):
LEFT-ROTATE(T, x)
1 y ← right[x] ▹ Set y.
2 right[x] ← left[y] ▹ Turn y's left subtree into x's right subtree.
3 p[left[y]] ← x
4 p[y] ← p[x] ▹ Link x's parent to y.
5 if p[x] = nil[T]
6 then root[T] ← y
7 else if x = left[p[x]]
8 then left[p[x]] ← y
9 else right[p[x]] ← y
10 left[y] ← x ▹ Put x on y's left.
11 p[x] ← y
2.右旋
右旋與左旋差不多,再此不做詳細介紹。
對於樹的旋轉,能保持不變的只有原樹的搜尋性質,而原樹的紅黑性質則不能保持,
在紅黑樹的資料插入和刪除後可利用旋轉和顏色重塗來恢復樹的紅黑性質。
至於有些書如 STL原始碼剖析有對雙旋的描述,其實雙旋只是單旋的兩次應用,並無新的內容,
因此這裡就不再介紹了,而且左右旋也是相互對稱的,只要理解其中一種旋轉就可以了。
三、紅黑樹插入、刪除操作的具體實現
三、I、ok,接下來,咱們來具體瞭解紅黑樹的插入操作。
向一棵含有n個結點的紅黑樹插入一個新結點的操作可以在O(lgn)時間內完成。
演算法導論:
RB-INSERT(T, z)
1 y ← nil[T]
2 x ← root[T]
3 while x ≠ nil[T]
4 do y ← x
5 if key[z] < key[x]
6 then x ← left[x]
7 else x ← right[x]
8 p[z] ← y
9 if y = nil[T]
10 then root[T] ← z
11 else if key[z] < key[y]
12 then left[y] ← z
13 else right[y] ← z
14 left[z] ← nil[T]
15 right[z] ← nil[T]
16 color[z] ← RED
17 RB-INSERT-FIXUP(T, z)
咱們來具體分析下,此段程式碼:
RB-INSERT(T, z),將z插入紅黑樹T 之內。
為保證紅黑性質在插入操作後依然保持,上述程式碼呼叫了一個輔助程式RB-INSERT-FIXUP
來對結點進行重新著色,並旋轉。
14 left[z] ← nil[T]
15 right[z] ← nil[T] //保持正確的樹結構
第16行,將z著為紅色,由於將z著為紅色可能會違背某一條紅黑樹的性質,
所以,在第17行,呼叫RB-INSERT-FIXUP(T,z)來保持紅黑樹的性質。
RB-INSERT-FIXUP(T, z),如下所示:
1 while color[p[z]] = RED
2 do if p[z] = left[p[p[z]]]
3 then y ← right[p[p[z]]]
4 if color[y] = RED
5 then color[p[z]] ← BLACK ▹ Case 1
6 color[y] ← BLACK ▹ Case 1
7 color[p[p[z]]] ← RED ▹ Case 1
8 z ← p[p[z]] ▹ Case 1
9 else if z = right[p[z]]
10 then z ← p[z] ▹ Case 2
11 LEFT-ROTATE(T, z) ▹ Case 2
12 color[p[z]] ← BLACK ▹ Case 3
13 color[p[p[z]]] ← RED ▹ Case 3
14 RIGHT-ROTATE(T, p[p[z]]) ▹ Case 3
15 else (same as then clause
with "right" and "left" exchanged)
16 color[root[T]] ← BLACK
ok,參考一網友的言論,用自己的語言,再來具體解剖下上述倆段程式碼。
為了保證闡述清晰,我再寫下紅黑樹的5個性質:
1)每個結點要麼是紅的,要麼是黑的。
2)根結點是黑的。
3)每個葉結點,即空結點(NIL)是黑的。
4)如果一個結點是紅的,那麼它的倆個兒子都是黑的。
5)對每個結點,從該結點到其子孫結點的所有路徑上包含相同數目的黑結點。
在對紅黑樹進行插入操作時,我們一般總是插入紅色的結點,因為這樣可以在插入過程中儘量避免對樹的調整。
那麼,我們插入一個結點後,可能會使原樹的哪些性質改變列?
由於,我們是按照二叉樹的方式進行插入,因此元素的搜尋性質不會改變。
如果插入的結點是根結點,性質2會被破壞,如果插入結點的父結點是紅色,則會破壞性質4。
因此,總而言之,插入一個紅色結點只會破壞性質2或性質4。
我們的回覆策略很簡單,
其一、把出現違背紅黑樹性質的結點向上移,如果能移到根結點,那麼很容易就能通過直接修改根結點來恢復紅黑樹的性質。直接通過修改根結點來恢復紅黑樹應滿足的性質。
其二、窮舉所有的可能性,之後把能歸於同一類方法處理的歸為同一類,不能直接處理的化歸到下面的幾種情況,
//注:以下情況3、4、5與上述演算法導論上的程式碼RB-INSERT-FIXUP(T, z),相對應:
情況1:插入的是根結點。
原樹是空樹,此情況只會違反性質2。
對策:直接把此結點塗為黑色。
情況2:插入的結點的父結點是黑色。
此不會違反性質2和性質4,紅黑樹沒有被破壞。
對策:什麼也不做。
情況3:當前結點的父結點是紅色且祖父結點的另一個子結點(叔叔結點)是紅色。
此時父結點的父結點一定存在,否則插入前就已不是紅黑樹。
與此同時,又分為父結點是祖父結點的左子還是右子,對於對稱性,我們只要解開一個方向就可以了。
在此,我們只考慮父結點為祖父左子的情況。
同時,還可以分為當前結點是其父結點的左子還是右子,但是處理方式是一樣的。我們將此歸為同一類。
對策:將當前節點的父節點和叔叔節點塗黑,祖父結點塗紅,把當前結點指向祖父節點,從新的當前節點重新開始演算法。
針對情況3,變化前(圖片來源:saturnman)[插入4節點]:
變化後:
情況4:當前節點的父節點是紅色,叔叔節點是黑色,當前節點是其父節點的右子
對策:當前節點的父節點做為新的當前節點,以新當前節點為支點左旋。
如下圖所示,變化前[插入7節點]:
變化後:
情況5:當前節點的父節點是紅色,叔叔節點是黑色,當前節點是其父節點的左子
解法:父節點變為黑色,祖父節點變為紅色,在祖父節點為支點右旋
如下圖所示[插入2節點]
變化後:
==================
三、II、ok,接下來,咱們最後來了解,紅黑樹的刪除操作:
演算法導論一書,給的演算法實現:
RB-DELETE(T, z) 單純刪除結點的總操作
1 if left[z] = nil[T] or right[z] = nil[T]
2 then y ← z
3 else y ← TREE-SUCCESSOR(z)
4 if left[y] ≠ nil[T]
5 then x ← left[y]
6 else x ← right[y]
7 p[x] ← p[y]
8 if p[y] = nil[T]
9 then root[T] ← x
10 else if y = left[p[y]]
11 then left[p[y]] ← x
12 else right[p[y]] ← x
13 if y 3≠ z
14 then key[z] ← key[y]
15 copy y's satellite data into z
16 if color[y] = BLACK
17 then RB-DELETE-FIXUP(T, x)
18 return y
RB-DELETE-FIXUP(T, x) 恢復與保持紅黑性質的工作
1 while x ≠ root[T] and color[x] = BLACK
2 do if x = left[p[x]]
3 then w ← right[p[x]]
4 if color[w] = RED
5 then color[w] ← BLACK ▹ Case 1
6 color[p[x]] ← RED ▹ Case 1
7 LEFT-ROTATE(T, p[x]) ▹ Case 1
8 w ← right[p[x]] ▹ Case 1
9 if color[left[w]] = BLACK and color[right[w]] = BLACK
10 then color[w] ← RED ▹ Case 2
11 x p[x] ▹ Case 2
12 else if color[right[w]] = BLACK
13 then color[left[w]] ← BLACK ▹ Case 3
14 color[w] ← RED ▹ Case 3
15 RIGHT-ROTATE(T, w) ▹ Case 3
16 w ← right[p[x]] ▹ Case 3
17 color[w] ← color[p[x]] ▹ Case 4
18 color[p[x]] ← BLACK ▹ Case 4
19 color[right[w]] ← BLACK ▹ Case 4
20 LEFT-ROTATE(T, p[x]) ▹ Case 4
21 x ← root[T] ▹ Case 4
22 else (same as then clause with "right" and "left" exchanged)
23 color[x] ← BLACK
為了保證以下的介紹與闡述清晰,我第三次重寫下紅黑樹的5個性質
1)每個結點要麼是紅的,要麼是黑的。
2)根結點是黑的。
3)每個葉結點,即空結點(NIL)是黑的。
4)如果一個結點是紅的,那麼它的倆個兒子都是黑的。
5)對每個結點,從該結點到其子孫結點的所有路徑上包含相同數目的黑結點。
(相信,重述了3次,你應該有深刻記憶了。:D)
saturnman:
紅黑樹刪除的幾種情況:
-------------------------------------------------
博主提醒:
以下所有的操作,是針對紅黑樹已經刪除結點之後,
為了恢復和保持紅黑樹原有的5點性質,所做的恢復工作。
前面,我已經說了,因為插入、或刪除結點後,
可能會違背、或破壞紅黑樹的原有的性質,
所以為了使插入、或刪除結點後的樹依然維持為一棵新的紅黑樹,
那就要做倆方面的工作:
1、部分結點顏色,重新著色
2、調整部分指標的指向,即左旋、右旋。
而下面所有的文字,則是針對紅黑樹刪除結點後,所做的修復紅黑樹性質的工作。
二零一一年一月七日更新。
------------------------------------------------------------
(注:以下的情況3、4、5、6,與上述演算法導論之程式碼RB-DELETE-FIXUP(T, x) 恢復與保持
中case1,case2,case3,case4相對應。)
情況1:當前節點是紅色
解法,直接把當前節點染成黑色,結束。
此時紅黑樹性質全部恢復。
情況2:當前節點是黑色且是根節點
解法:什麼都不做,結束
情況3:當前節點是黑色,且兄弟節點為紅色(此時父節點和兄弟節點的子節點分為黑)。
解法:把父節點染成紅色,把兄弟結點染成黑色,之後重新進入演算法(我們只討論當前節點是其父節點左孩子時的情況)。
然後,針對父節點做一次左旋。此變換後原紅黑樹性質5不變,而把問題轉化為兄弟節點為黑色的情況。
3.變化前:
3.變化後:
情況4:當前節點是黑色,且兄弟是黑色,且兄弟節點的兩個子節點全為黑色。
解法:把當前節點和兄弟節點中抽取一重黑色追加到父節點上,把父節點當成新的當前節點,重新進入演算法。(此變換後性質5不變)
4.變化前
4.變化後
情況5:當前節點顏色是黑色,兄弟節點是黑色,兄弟的左子是紅色,右子是黑色。
解法:把兄弟結點染紅,兄弟左子節點染黑,之後再在兄弟節點為支點解右旋,
之後重新進入演算法。此是把當前的情況轉化為情況6,而性質5得以保持。
5.變化前:
5.變化後:
情況6:當前節點顏色是黑色,它的兄弟節點是黑色,但是兄弟節點的右子是紅色,兄弟節點左子的顏色任意。
解法:把兄弟節點染成當前節點父節點的顏色,把當前節點父節點染成黑色,兄弟節點右子染成黑色,
之後以當前節點的父節點為支點進行左旋,此時演算法結束,紅黑樹所有性質調整正確。
6.變化前:
6.變化後:
限於篇幅,不再過多贅述。更多,可參考演算法導論或下文我寫的第二篇文章。
完。
July、二零一零年十二月二十九日初稿。三十日凌晨修訂。行文3個小時以上。
----------------
今下午畫紅黑樹畫了好幾個鐘頭,貼倆張圖:
紅黑樹插入的3種情況:
紅黑樹刪除的4種情況:
ok,只貼倆張,更多,參考我寫的關於紅黑樹的第二篇文章:
這篇文章針對演算法實現原始碼分十層,層層、逐層剖析,相信,更清晰易懂。
//尤其文末針對紅黑樹的刪除情況,層次清晰。
July、二零一零年十二月三十一日、最後更新。