【演算法】樹的編輯距離

阿新 • • 發佈：2019-01-16

字串編輯距離定義了一個從字串轉換到另一個字串最少需要的操作次數，操作次數越少，則從側面證明兩個字串較為相似，它從新的角度定義了兩個事物相似度的計算方法，這種事物並不僅限於字串，也可以是其他結構比如樹。

樹的編輯操作同樣有三種：

1.插入：向一顆樹中插入一個節點；

2.刪除：從一棵樹中刪除一個節點；

3.轉換：將一棵樹中的節點轉換為其他的節點。

計算樹的編輯距離就是求從一棵樹轉換為另一棵樹所需要樹的編輯操作的最少次數。

假設現在對兩棵樹T和T’求解編輯距離，首先要找到他們之間的對映，也就是相同的部分，然後再對不同的部分進行操作進行轉換。

上圖是T和T'之間的對映圖，T中沒有虛線連線的點是需要刪除的點，T'中沒有虛線連線的點是需要插入的點，虛線連線的若是不同的兩個點則進行轉換操作，若連線的是相同的點則不進行任何操作。虛線連線的部分稱為對映，它可以用一個三元組(M,T,T')來表示,M(i,j)表示T中節點i和T'中節點j的對映，i和j滿足以下關係：

1. 1<=i<=|T|,1<=j<=|T'|;

2.對於M(i1,j1)和M(i2,j2)：

i1=i2當且僅當j1=j2;

i1<i2當且僅當j1<j2;

T[i1]是T[i2]的祖先或後繼節點當且僅當T'[j1]是T'[j2]的祖先或後繼節點。

令M為T到T'的一個對映，I和J分別為T和T'中未連線的節點，則對映代價可以用如下公式表示：

上式的三個部分分別對應轉換、刪除、插入的編輯代價，T和T'的編輯距離可以通過計算cost(M)得到。

該演算法基於字串的編輯距離演算法的啟發，定義了從一棵樹轉換為另一棵樹的三種基本操作，並稱這些操作的最少次數為樹的編輯距離該演算法採用動態規劃的方法，從根節點出發，每次比較上一層已經配對的節點的兒子節點，確定本層節點的一個最佳的對應關係，也就是找到兩棵樹之間當前層最相似的兒子節點，而沒有參與到對應關係的節點則產生距離。由於該演算法只需對兩棵樹同一層節點的相似度進行考慮，極大地簡化了問題，所以有O(nr)的最壞時間複雜度，其中n代表書中節點個數，r代表樹中節點平均兒子數。

【演算法】樹的編輯距離

【演算法】樹的編輯距離

【Leetcode】72.編輯距離

【動態規劃】字串編輯距離（Levenshtein距離）演算法

【演算法】二叉樹前序、中序、後序遍歷相互求法（轉）

【演算法】二叉樹的遞迴和非遞迴遍歷（轉）

【演算法】二叉樹的廣度遍歷

【演算法】線段樹

【Leetcode_總結】72. 編輯距離 - python

【演算法】把字串轉換成整數,樹中兩個結點的最低公共祖先

【演算法】【python實現】二叉搜尋樹插入、刪除、查詢

【演算法】B+樹的研讀及實現（1）

【演算法】B+樹的研讀及實現（2）---java版核心程式碼

【演算法】b樹的實現（1）

【演算法】紅黑樹插入資料的情況與實現（三）

【演算法】紅黑樹插入資料（變色，左旋、右旋）（二）

【演算法】紅黑樹（二叉樹）概念與查詢（一）

【LeetCode】漢明距離的演算法及運用

【演算法】java版紅黑樹演算法的完整實現及swing介面演示程式

【演算法】決策樹,資訊熵,資訊增益,Gini

【演算法】紅黑樹的講解及插入刪除演算法實現原理

【演算法】樹的編輯距離

相關推薦