1. 程式人生 > >動態規劃——最長子序列

動態規劃——最長子序列

動態規劃法

經常會遇到複雜問題不能簡單地分解成幾個子問題,而會分解出一系列的子問題。簡單地採用把大問題分解成子問題,並綜合子問題的解匯出大問題的解的方法,問題求解耗時會按問題規模呈冪級數增加。

為了節約重複求相同子問題的時間,引入一個表(陣列)記錄所有已解決的子問題的答案,不管它們是否對最終解有用,把所有子問題的解存於該陣列中,這就是動態規劃法所採用的基本方法。

【問題】 求兩字元序列的最長公共字元子序列

問題描述:字元序列的子序列是指從給定字元序列中隨意地(不一定連續)去掉若干個字元(可能一個也不去掉)後所形成的字元序列。令給定的字元序列X=“x0,x1,…,xm-1,序列

Y=“y0,y1,…,yk-1X的子序列,存在X的一個嚴格遞增下標序列<i0,i1,…,ik-1>,使得對所有的j=0,1,…,k-1,有xij=yj。例如,X=“ABCBDAB”,Y=“BCDB”是X的一個子序列。

考慮最長公共子序列問題如何分解成子問題,設A=“a0,a1,…,am-1B=“b0,b1,…,bm-1,並Z=“z0,z1,…,zk-1為它們的最長公共子序列。不難證明有以下性質:

(1如果am-1=bn-1,則zk-1=am-1=bn-1,且“z0,z1,…,zk-2是“a0,a1,…,am-2和“b0,b1,…,bn-2的一個最長公共子序列;

(2

如果am-1!=bn-1,則若zk-1!=am-1,蘊涵“z0,z1,…,zk-1是“a0,a1,…,am-2和“b0,b1,…,bn-1的一個最長公共子序列;

(3如果am-1!=bn-1,則若zk-1!=bn-1,蘊涵“z0,z1,…,zk-1是“a0,a1,…,am-1和“b0,b1,…,bn-2的一個最長公共子序列。

這樣,在找A和B的公共子序列時,如有am-1=bn-1,則進一步解決一個子問題,找“a0,a1,…,am-2和“b0,b1,…,bm-2的一個最長公共子序列;如果am-1!=bn-1,則要解決兩個子問題,找出“a0,a1,…,am-2和“b0,b1,…,bn-1的一個最長公共子序列和找出“

a0,a1,…,am-1和“b0,b1,…,bn-2的一個最長公共子序列,再取兩者中較長者作為A和B的最長公共子序列。

 

 

求解:

引進一個二維陣列c[][],用c[i][j]記錄X[i]與Y[j] 的LCS 的長度,b[i][j]記錄c[i][j]是通過哪一個子問題的值求得的,以決定搜尋的方向。
我們是自底向上進行遞推計算,那麼在計算c[i,j]之前,c[i-1][j-1],c[i-1][j]與c[i][j-1]均已計算出來。此時我們根據X[i] = Y[j]還是X[i] != Y[j],就可以計算出c[i][j]。

問題的遞迴式寫成:


recursive formula

動態規劃的一個重要性質特點就是解決“子問題重疊”的場景,可以有效的避免重複計算,根據上面的公式其實可以發現C[i,j]一直儲存著當前(Xi,Yi)的最大子序列長度。

當遇到相等的元素時,長度加1;遇到不相等的時,C[i][j]依然記錄著最近相等時的那次記錄:因此C[i][j]記錄的是最新的最大子序列的長度。從下圖也可以看出這種記錄方式整體上是向右下方更新長度的,保證了序列長度是遞增的。

回溯輸出最長公共子序列過程:

flow


從圖中可以看出當上方和左邊的值不相等時,向斜上方移動;當上(左)值相等的時,向上(或左)移動,可以看出當上和左都相等時,有多條回溯路線

 

演算法分析:
由於每次呼叫至少向上或向左(或向上向左同時)移動一步,故最多呼叫(m + n)次就會遇到i = 0或j = 0的情況,此時開始返回。返回時與遞迴呼叫時方向相反,步數相同,故演算法時間複雜度為Θ(m + n)。

 

 

程式碼:

 

#include <stdio.h>
#include 
<string.h>
#define MAXLEN 100

void LCSLength(char *x, char *y, int m, int n, int c[][MAXLEN], int b[][MAXLEN])
{
    
int i, j;
    
    
for(i = 0; i <= m; i++)
        c[i][
0= 0;
    
for(j = 1; j <= n; j++)
        c[
0][j] = 0;
    
for(i = 1; i<= m; i++)
    
{
        
for(j = 1; j <= n; j++)
        
{
            
if(x[i-1== y[j-1])
            
{
                c[i][j] 
= c[i-1][j-1+ 1;
                b[i][j] 
= 0;
            }

            
else if(c[i-1][j] >= c[i][j-1])  //比較C中的左方和上方的值,記錄其中的大者
            
{
                c[i][j] 
= c[i-1][j];
                b[i][j] 
= 1;
            }

            
else
            
{
                c[i][j] 
= c[i][j-1];
                b[i][j] 
= -1;
            }

        }

    }

}


void PrintLCS(int b[][MAXLEN], char *x, int i, int j)
{
    
if(i == 0 || j == 0)
        
return;
    
if(b[i][j] == 0)
    
{
        PrintLCS(b, x, i
-1, j-1);
        printf(
"%c ", x[i-1]);
    }

    
else if(b[i][j] == 1)
        PrintLCS(b, x, i
-1, j);
    
else
        PrintLCS(b, x, i, j
-1);
}


int main(int argc, char **argv)
{
    
char x[MAXLEN] = {"ABCBDAB"};
    
char y[MAXLEN] = {"BDCABA"};
    
int b[MAXLEN][MAXLEN];
    
int c[MAXLEN][MAXLEN];
    
int m, n;
    
    m 
= strlen(x);
    n 
= strlen(y);
    
    LCSLength(x, y, m, n, c, b);
    PrintLCS(b, x, m, n);
    
    
return 0;
}


參考:http://blog.csdn.net/yysdsyl/article/details/4226630