動態規劃-----編輯距離

阿新 • • 發佈：2021-11-14

　　編輯距離，計算從一個字串到另一個字串的最短編輯距離，其可以通過增、刪、替方式來實現。

　　例如:字串str1 = mitcmu，與字串str2=mtacnu，字串str1通過增、刪、替方式變成str2，最短編輯距離為3：

　　第一步：str1刪除字元i，變成str1=mtcmu；

　　第二步：str1在字元t後面增加字元a，變成str1=mtacmu；

　　第三步：str1中的字元m替換成n，變成str1=mtacnu = str2。

　　編輯距離，分為萊文斯坦距離與最長公共子串長度，兩者區別：萊文斯坦距離，從一個字串實現成為另一個字串的最少編輯距離，操作方式有增、刪、替方式；最長公共子串長度，則計算兩個字串之間的相同字串長度，操作方式有增、刪。

萊文斯坦距離

　　解題思路，回溯法：

　　(1).匹配str1[i]和str2[j]

　　a.匹配：

　　匹配str1[i+1]和str2[j+1]

　　b.不匹配：

　　 1).可以刪除str1[i]，然後遞迴考察str1[i+1]和str2[j]

　　 2).可以刪除str2[j]，然後遞迴考察str1[i]和str2[j+1]

　　 3).可以在str1[i]前面新增一個跟str2[j]相同字元，讓遞迴考察str1[i]和str2[j+1]

　　 4).可以在str2[j]前面新增一個跟str1[i]相同字元，讓遞迴考察str1[i+1]和str2[j]

　　 5).可以將str1[i]替換成str2[j]，或者將str2[j]替換成str1[i]，然後遞迴考察str1[i+1]和str2[j+1]

　　決策圖用函式f(i,j,dis)表示樹，其中i表示第一個字串裡面的字元，j表示第二個字串的zif，dis表示距離：

　　由圖可以得出：編輯距離通過增、刪、替方式來獲取每個步驟的最短距離，由此可以獲取如下規律

　　從中我們可以得出狀態轉移方程：

　　(1)如果str1[i] != str2[j]，那麼達到每一個步驟的最短距離

　　min_dis(i,j) = min(min_dis(i-1,j)+1,min_dis(i,j-1)+1,min_dis(i-1,j-1)+1)

　　(2)如果str1[i] == str2[j], 那麼達到每一個步驟的最短距離

min_dis(i,j) = min(min_dis(i-1,j),min_dis(i,j-1),min_dis(i-1,j-1))

　　由上，可得出動態規劃法：

　　(1)初始化表格

	""	m	t	a	c	n	u
""	0	1	2	3	4	5	6
m	1
i	2
t	3
c	4
m	5
u	6

　　(2)第一行計算：根據回溯法，j計算m變成m,mt，mta,mtac,mtacn,mtacnu所需要的距離

	""	m	t	a	c	n	u
""	0	1	2	3	4	5	6
m	1	0	1	2	3	4	5
i	2
t	3
c	4
m	5
u	6

　　(3)第二行計算：根據回溯法，j計算mi變成m,mt，mta,mtac,mtacn,mtacnu所需要的距離

	""	m	t	a	c	n	u
""	0	1	2	3	4	5	6
m	1	0	1	2	3	4	5
i	2	1	1	2	3	4	5
t	3
c	4
m	5
u	6

　　(6)依此類推第六行計算：根據回溯法，j計算m變成m,mt，mta,mtac,mtacn,mtacnu所需要的距離

	""	m	t	a	c	n	u
""	0	1	2	3	4	5	6
m	1	0	1	2	3	4	5
i	2	1	1	2	3	4	5
t	3	2	1	2	3	4	5
c	4	3	2	2	2	3	4
m	5	3	3	3	3	3	4
u	6	4	4	4	4	4	3

　　因此程式碼實現如下

import numpy as np


#編輯距離之萊溫斯坦距離，用於計算兩個字串之間的相似度

def LewinsteinDistance(strFirst,strSecond):
    #用於儲存每一步的最短距離的值
    editDis = np.zeros(shape=(len(strFirst) + 1, len(strSecond) + 1))
    for i in range(len(editDis)):
        for j in range(len(editDis[i])):
            #初始化i==0,即行為0時的值，為0，1，2......
            if i == 0:
                editDis[i][j] = j
            # 初始化j==0,即列為0時的值，為0，1，2......
            elif j == 0:
                editDis[i][j] = i
            else:
                #兩個字元不匹配
                if strFirst[i-1] != strSecond[j-1]:
                    editDis[i][j] = min(editDis[i-1][j-1]+1,editDis[i-1][j]+1, editDis[i][j-1]+1)
                else:
                    # 兩個字元匹配
                    editDis[i][j] = min(editDis[i - 1][j - 1] , editDis[i - 1][j] , editDis[i][j - 1] )

    for i in range(len(editDis)):
        for j in range(len(editDis[j])):
            print(editDis[i][j], end="    ")
        print()
strSecond= "mtacnu"
strFirst = "mitcmu"

#strSecond= "flaw"
#strFirst = "lawn"
LewinsteinDistance(strFirst,strSecond)

結果輸出：

0.0    1.0    2.0    3.0    4.0    5.0    6.0    
1.0    0.0    1.0    2.0    3.0    4.0    5.0    
2.0    1.0    1.0    2.0    3.0    4.0    5.0    
3.0    2.0    1.0    2.0    3.0    4.0    5.0    
4.0    3.0    2.0    2.0    2.0    3.0    4.0    
5.0    3.0    3.0    3.0    3.0    3.0    4.0    
6.0    4.0    4.0    4.0    4.0    4.0    3.0

　　　2.最長公共子串長度

　　　狀態轉移方程：

　　　(1)　str1[i]==str2[j]:

　　　　max_Long(i,j)=max(max_Long(i-1,j-1)+1,max_Long(i-1,j),max_Long(i,j-1))

　　　(2) str1[i] != str2[j]

　　　　max_long(i,j)=max(max_Long(i-1,j-1),max_Long(i-1,j),max_Long(i,j-1))

　　演算法實現：

import numpy as np
#最長公共子串
def LongestCommonCubstring(strFirst,strSecond):
    editDis = np.zeros(shape=(len(strFirst) + 1, len(strSecond) + 1))
    for i in range(1,len(editDis)):
        for j in range(1,len(editDis[i])):

            if strFirst[i - 1] != strSecond[j - 1]:
                editDis[i][j] = max(editDis[i - 1][j - 1] , editDis[i - 1][j] , editDis[i][j - 1] )
            else:
                editDis[i][j] = max(editDis[i - 1][j - 1] + 1, editDis[i - 1][j], editDis[i][j - 1])

    for i in range(len(editDis)):
        for j in range(len(editDis[j])):
            print(editDis[i][j], end="    ")
        print()
strSecond= "mtacnu"
strFirst = "mitcmu"
LongestCommonCubstring(strFirst,strSecond)

輸出

0.0    0.0    0.0    0.0    0.0    0.0    0.0    
0.0    1.0    1.0    1.0    1.0    1.0    1.0    
0.0    1.0    1.0    1.0    1.0    1.0    1.0    
0.0    1.0    2.0    2.0    2.0    2.0    2.0    
0.0    1.0    2.0    2.0    3.0    3.0    3.0    
0.0    1.0    2.0    2.0    3.0    3.0    3.0    
0.0    1.0    2.0    2.0    3.0    3.0    4.0

動態規劃——編輯距離

技術標籤：動態規劃演算法動態規劃問題來源：leetcode 72。編輯距離給你兩個單詞 word1 和 word2，請你計算出將 word1 轉換成 word2 所使用的最少運算元。

演算法：動態規劃編輯距離 Edit Distance / Levenshtein Distance

技術標籤：algorithms字串演算法編輯距離編輯距離是用來量化兩個字串差異程度的概念。將一個字串轉變成另外一個需要多少步操作（操作分為新增、替換和刪除單個字元）。編輯距離又被稱為Levenshtein距離，以前蘇

動態規劃-----編輯距離

　　編輯距離，計算從一個字串到另一個字串的最短編輯距離，其可以通過增、刪、替方式來實現。

動態規劃-最短編輯距離

package dynamic; public class EditDistance { // 最短編輯距離,動態規劃 static int minDistance(String s1, String s2) {

經典動態規劃：編輯距離

讀完本文，你可以去力扣拿下如下題目： 72.編輯距離 ----------- 前幾天看了一份鵝場的面試題，演算法部分大半是動態規劃，最後一題就是寫一個計算編輯距離的函式，今天就專門寫一篇文章來探討一下這個問題。

動態規劃：洛谷 P2758 編輯距離 —— 一題多解：遞迴和DP求解

洛谷 P2758 編輯距離這題是普及/提高－的，觀察發現可以用二維陣列DP做。

動態規劃求解子序列問題和編輯距離

動態規劃求解子序列問題思路這類題基本就三步：確定動態陣列含義寫出轉移方程

Leetcode72/583之動態規劃中的編輯距離

編輯距離涉及到字串的插入，刪除，替換注意ij和i-1 j-1以及i-1 j 或者i j-1之間的關係就行了

【LeetCode-動態規劃】編輯代價

題目描述給定兩個字串str1和str2，再給定三個整數ic，dc和rc，分別代表插入、刪除和替換一個字元的代價，請輸出將str1編輯成str2的最小代價。

[譯] 動態規劃演演算法的實際應用：接縫裁剪

原文地址：Real-world dynamic programming: seam carving 原文作者：Avik Das 譯文出自：掘金翻譯計劃

PHP實現 - 動態規劃之揹包問題

事情原由由於我司舉辦一個演演算法程式設計大賽，隨機抽籤下面圖片的演演算法題目，想了一段時間記起之前在書（演演算法圖解）上有一個演演算法比較符合，那就是動態規劃中的“揹包問題”。

動態規劃套路詳解

前言前一篇部落格總結了動態規劃，但是對於我這初學者，還是很多地方不能理解，所以我就在網上找到了一個大神的講解，確實很棒。轉載過來。

Java滾動陣列計算編輯距離操作示例

本文例項講述了Java滾動陣列計算編輯距離操作。分享給大家供大家參考，具體如下：

Python 剪繩子的多種思路實現(動態規劃和貪心)

劍指Offer(Python多種思路實現):剪繩子面試14題：題目：剪繩子題：給你一根長度為n的繩子，請把繩子剪成m段(m,n都是整數，且n>1,m>1),每段繩子的長度記為k[0],k[1],k[2],...,k[m]。請問k[0]*k[1]*...*k[m]

java動態規劃演算法——硬幣找零問題例項分析

本文例項講述了java動態規劃演算法——硬幣找零問題。分享給大家供大家參考，具體如下：

動態規劃-分蛋糕V2

分蛋糕:有一塊矩形大蛋糕，長和寬分別是整數w?、h。現要將其切成m塊小蛋糕，每個小蛋糕都必須是矩形、且長和寬均為整數。切蛋糕時，每次切一塊蛋糕，將其分成兩個矩形蛋糕。請計算：最後得到的m塊小蛋糕中，最大的那

PAT 1045 Favorite Color Stripe (30分) 動態規劃

題目 Eva is trying to make her own color stripe out of a given one. She would like to keep only her favorite colors in her favorite order by cutting off those unwanted pieces and sewing the remaining

11.編輯距離

時間複雜度1000 * 1000 * 100 1 #include <bits/stdc++.h> 2 using namespace std; 3 const int N = 15, M = 1010;

72. 編輯距離（Edit Distance）

題目描述：給你兩個單詞word1 和word2，請你計算出將word1轉換成word2 所使用的最少運算元。

32. 最長有效括號（動態規劃、棧）

給定一個只包含 \'(\'和 \')\'的字串，找出最長的包含有效括號的子串的長度。

	""	m	t	a	c	n	u
""	0	1	2	3	4	5	6
m	1	0	1	2	3	4	5
i	2	1	1	2	3	4	5
t	3	2	1	2	3	4	5
c	4	3	2	2	2	3	4
m	5	3	3	3	3	3	4
u	6	4	4	4	4	4	3

	""	m	t	a	c	n	u
""	0	1	2	3	4	5	6
m	1	0	1	2	3	4	5
i	2	1	1	2	3	4	5
t	3	2	1	2	3	4	5
c	4	3	2	2	2	3	4
m	5	3	3	3	3	3	4
u	6	4	4	4	4	4	3

動態規劃-----編輯距離

相關推薦

	""	m	t	a	c	n	u
""	0	1	2	3	4	5	6
m	1	0	1	2	3	4	5
i	2	1	1	2	3	4	5
t	3	2	1	2	3	4	5
c	4	3	2	2	2	3	4
m	5	3	3	3	3	3	4
u	6	4	4	4	4	4	3