演算法詳解之最近公共祖先(LCA)
若圖片出鍋請轉至here
概念
首先是最近公共祖先的概念(什麼是最近公共祖先?):
在一棵沒有環的樹上,每個節點肯定有其父親節點和祖先節點,而最近公共祖先,就是兩個節點在這棵樹上深度最大的公共的祖先節點。
換句話說,就是兩個點在這棵樹上距離最近的公共祖先節點。
所以LCA主要是用來處理當兩個點僅有唯一一條確定的最短路徑時的路徑。
有人可能會問:那他本身或者其父親節點是否可以作為祖先節點呢?
答案是肯定的,很簡單,按照人的親戚觀念來說,你的父親也是你的祖先,而LCA還可以將自己視為祖先節點。
舉個例子吧,如下圖所示4和5的最近公共祖先是2,5和3的最近公共祖先是1,2和1的最近公共祖先是1。
這就是最近公共祖先的基本概念了,那麼我們該如何去求這個最近公共祖先呢?
通常初學者都會想到最簡單粗暴的一個辦法:對於每個詢問,遍歷所有的點,時間複雜度為\(O(n*q)\) ,很明顯,n和q一般不會很小。
怎麼辦辦?
LCA其實有很多種解法,這裡介紹幾一個
Tarjan大法好!
什麼是Tarjan(離線)演算法呢?顧名思義,就是在一次遍歷中把所有詢問一次性解決,所以其時間複雜度是\(O(n+q)\)。
Tarjan演算法的優點在於相對穩定,時間複雜度也比較居中,也很容易理解。
下面詳細介紹一下Tarjan演算法的基本思路:
任選一個點為根節點,從根節點開始。
遍歷該點u所有子節點v,並標記這些子節點v已被訪問過。
若是v還有子節點,返回2,否則下一步。
合併v到u上。
尋找與當前點u有詢問關係的點v。
若是v已經被訪問過了,則可以確認u和v的最近公共祖先為v被合併到的父親節點a。
遍歷的話需要用到dfs來遍歷(相信來看的人都懂吧...),至於合併,最優化的方式就是利用並查集來合併兩個節點。
- 虛擬碼
Tarjan(u)//marge和find為並查集合並函式和查詢函式 { for each(u,v) //訪問所有u子節點v { Tarjan(v); //繼續往下遍歷 marge(u,v); //合併v到u上 標記v被訪問過; } for each(u,e) //訪問所有和u有詢問關係的e { 如果e被訪問過; u,e的最近公共祖先為find(e); } }
個人感覺這樣還是有很多人不太理解,所以打算模擬一遍給大家看。
假設我們有一組資料 9個節點 8條邊 聯通情況如下:
1--2,1--3,2--4,2--5,3--6,5--7,5--8,7--9 即下圖所示的樹
設我們要查詢最近公共祖先的點為9--8,4--6,7--5,5--3;
設f[]
陣列為並查集的父親節點陣列,初始化f[i]=i
,vis[]
陣列為是否訪問過的陣列,初始為0;
下面開始模擬過程:
取1為根節點,往下搜尋發現有兩個兒子2和3;
先搜2,發現2有兩個兒子4和5,先搜尋4,發現4沒有子節點,則尋找與其有關係的點;
發現6與4有關係,但是vis[6]=0
,即6還沒被搜過,所以不操作;
發現沒有和4有詢問關係的點了,返回此前一次搜尋,更新vis[4]=1
;
表示4已經被搜完,更新f[4]=2
,繼續搜5,發現5有兩個兒子7和8;
先搜7,發現7有一個子節點9,搜尋9,發現沒有子節點,尋找與其有關係的點;
發現8和9有關係,但是vis[8]=0
,即8沒被搜到過,所以不操作;
發現沒有和9有詢問關係的點了,返回此前一次搜尋,更新vis[9]=1;
表示9已經被搜完,更新f[9]=7
,發現7沒有沒被搜過的子節點了,尋找與其有關係的點;
發現5和7有關係,但是vis[5]=0
,所以不操作;
發現沒有和7有關係的點了,返回此前一次搜尋,更新vis[7]=1
;
表示7已經被搜完,更新f[7]=5
,繼續搜8,發現8沒有子節點,則尋找與其有關係的點;
發現9與8有關係,此時vis[9]=1
,則他們的最近公共祖先為find(9)=5
;
(find(9)的順序為f[9]=7-->f[7]=5-->f[5]=5 return 5;)
發現沒有與8有關係的點了,返回此前一次搜尋,更新vis[8]=1
;
表示8已經被搜完,更新f[8]=5
,發現5沒有沒搜過的子節點了,尋找與其有關係的點;
發現7和5有關係,此時vis[7]=1
,所以他們的最近公共祖先為find(7)=5
;
(find(7)的順序為f[7]=5-->f[5]=5 return 5;)
又發現5和3有關係,但是vis[3]=0
,所以不操作,此時5的子節點全部搜完了;
返回此前一次搜尋,更新vis[5]=1
,表示5已經被搜完,更新f[5]=2
;
發現2沒有未被搜完的子節點,尋找與其有關係的點;
又發現沒有和2有關係的點,則此前一次搜尋,更新vis[2]=1
;
表示2已經被搜完,更新f[2]=1,繼續搜3,發現3有一個子節點6;
搜尋6,發現6沒有子節點,則尋找與6有關係的點,發現4和6有關係;
此時vis[4]=1
,所以它們的最近公共祖先為find(4)=1
;
(find(4)的順序為f[4]=2-->f[2]=2-->f[1]=1 return 1;)
發現沒有與6有關係的點了,返回此前一次搜尋,更新vis[6]=1
,表示6已經被搜完了;
更新f[6]=3
,發現3沒有沒被搜過的子節點了,則尋找與3有關係的點;
發現5和3有關係,此時vis[5]=1
,則它們的最近公共祖先為find(5)=1
;
(find(5)的順序為f[5]=2-->f[2]=1-->f[1]=1 return 1;)
發現沒有和3有關係的點了,返回此前一次搜尋,更新vis[3]=
;
更新f[3]=1
,發現1沒有被搜過的子節點也沒有有關係的點,此時可以退出整個dfs了。
經過這次dfs我們得出了所有的答案,有沒有覺得很神奇呢?是否對Tarjan演算法有更深層次的理解了呢?
參考博文:https://www.cnblogs.com/jvxie/p/4854719.h