1. 程式人生 > 實用技巧 >最長公共子序列&最長公共子串

最長公共子序列&最長公共子串

最長公共子序列

給定兩個字串 text1 和 text2,返回這兩個字串的最長公共子序列的長度。

一個字串的 子序列 是指這樣一個新的字串:它是由原字串在不改變字元的相對順序的情況下刪除某些字元(也可以不刪除任何字元)後組成的新字串。
例如,"ace" 是 "abcde" 的子序列,但 "aec" 不是 "abcde" 的子序列。兩個字串的「公共子序列」是這兩個字串所共同擁有的子序列。

若這兩個字串沒有公共子序列,則返回 0。

示例 1:

輸入:text1 = "abcde", text2 = "ace"
輸出:3
解釋:最長公共子序列是 "ace",它的長度為 3。

分析:首先要先區分子序列和子串(連在一起的)。記dp[i][j]為字串a的i號位和字串的b的j號位之前的LCS長度。當a[i]=b[j]時,dp[i][j]=dp[i-1][j-1]+1;當a[i]!=b[j]時,可能a的i號位之前有元素等於b[j](或b的j號位之前有元素等於a[i]),因此dp[i][j]=max(dp[i - 1][j], dp[i][j - 1])。

int longestCommonSubsequence(string text1, string text2) {
        int m = text1.size(), n = text2.size();
        int**dp = new int*[m];
        for (int i = 0; i < m; ++i)
            dp[i] = new int[n];
        //注意如何初始化
        dp[0][0]=(text1[0]==text2[0]);
        for (int i = 1; i < n; ++i) 
            dp[0][i] = (text1[0] == text2[i] ? 1 : dp[0][i-1]);
        for (int i = 1; i < m; ++i)
            dp[i][0] = (text1[i] == text2[0] ? 1 : dp[i-1][0]);
        for(int i=1;i<m;++i)
            for (int j = 1; j < n; ++j) {
                //由於i,j按順序遍歷,所以計算dp[i][j]時dp[i-1][j],dp[i][j-1]均已知
                dp[i][j] = (text1[i] == text2[j]) ? dp[i - 1][j - 1] + 1 : max(dp[i - 1][j], dp[i][j - 1]);
            }
        return dp[m - 1][n - 1];

    }

最長公共子串

分析:dp[i][j]表示a[i]對齊b[j]時,字串a的i號位和字串的b的j號位之前的公共子串長度。當a[i]=b[j]則dp[i][j]=dp[i-1][j-1]+1;當a[i]!=b[j]時dp[i][j]=0。

int longestCommonSubstring(string text1, string text2) {
	int m = text1.size(), n = text2.size(),res=0;
	int**dp = new int*[m];
	for (int i = 0; i < m; ++i)
		dp[i] = new int[n];
	//注意如何初始化
	int starti, startj;
	for (int i = 1; i < n; ++i)
		//與最長公共子序列區別1:text1[i]!=text2[j]時dp[i][j]=0。
		dp[0][i] = (text1[0] == text2[i] ? 1 : 0);
	for (int i = 1; i < m; ++i)
		dp[i][0] = (text1[i] == text2[0] ? 1 : 0);
	for (int i = 1; i < m; ++i)
		for (int j = 1; j < n; ++j) {
			//由於i,j按順序遍歷,所以計算dp[i][j]時dp[i-1][j],dp[i][j-1]均已知
			dp[i][j] = (text1[i] == text2[j]) ? dp[i - 1][j - 1] + 1 : 0;
			if (dp[i][j] > res) res = dp[i][j];
		}
	//與最長公共子序列區別2:由於text1[i]!=text2[j]時dp[i][j]=0,所以dp[m-1][n-1]不能代表最後結果,最後結果為最大的dp值。
	return res;

}