1. 程式人生 > >騰訊編程題

騰訊編程題

tis 子字符串 結果 ret 效率 代碼 bre 常常 art

這是一個騰訊筆試的編程題:

技術分享圖片
我們經常會用到一個LCS的問題。本題的唯一的一個巧妙之處在於。最後求解的字符串變為的是原來的字符串與其reverse之後的字符串的最大LCS,這樣本題就得到了解決。

最長公共子序列求解:遞歸與動態規劃方法

  在做OJ題目的時候。常常會用到字符串的處理。比如。比較二個字符串相似度。

這篇文章介紹一下求兩個字符串的最長公共子序列。

  一個字符串的子序列。是指從該字符串中去掉隨意多個字符後剩下的字符在不改變順序的情況下組成的新字符串。

  最長公共子序列。是指多個字符串可具有的長度最大的公共的子序列。

  (1)遞歸方法求最長公共子序列的長度

    1)設有字符串a[0...n]。b[0...m],以下就是遞推公式。

當數組a和b相應位置字符同樣時。則直接求解下一個位置;當不同一時候取兩種情況中的較大數值。

    技術分享圖片

    2)代碼例如以下:

技術分享圖片
#include<stdio.h>
#include<string.h>
char a[30],b[30];
int lena,lenb;
int LCS(int,int);  ///兩個參數分別表示數組a的下標和數組b的下標

int main()
{
    strcpy(a,
"ABCBDAB"); strcpy(b,"BDCABA"); lena=strlen(a); lenb=strlen(b); printf("%d\n",LCS(0,0)); return 0; } int LCS(int i,int j) { if(i>=lena || j>=lenb) return 0; if(a[i]==b[j]) return 1+LCS(i+1,j+1); else return
LCS(i+1,j)>LCS(i,j+1)? LCS(i+1,j):LCS(i,j+1); }
技術分享圖片

    用遞歸的方法長處是編程簡單,easy理解。缺點是效率不高,有大量的反復運行遞歸調用,並且僅僅能求出最大公共子序列的長度,求不出詳細的最大公共子序列。

  (2)動態規劃求最長公共子序列的長度

    動態規劃採用二維數組來標識中間計算結果。避免反復的計算來提高效率。

    1)最長公共子序列的長度的動態規劃方程

    設有字符串a[0...n],b[0...m],以下就是遞推公式。字符串a相應的是二維數組num的行,字符串b相應的是二維數組num的列。

    技術分享圖片

    另外,採用二維數組flag來記錄下標ij的走向。數字"1"表示,斜向下;數字"2"表示。水平向右。數字"3"表示,豎直向下。這樣便於以後的求解最長公共子序列。

    (2)求解公共子序列代碼

技術分享圖片
#include<stdio.h>
#include<string.h>

char a[500],b[500];
char num[501][501]; ///記錄中間結果的數組
char flag[501][501];    ///標記數組,用於標識下標的走向。構造出公共子序列
void LCS(); ///動態規劃求解
void getLCS();    ///採用倒推方式求最長公共子序列

int main()
{
    int i;
    strcpy(a,"ABCBDAB");
    strcpy(b,"BDCABA");
    memset(num,0,sizeof(num));
    memset(flag,0,sizeof(flag));
    LCS();
    printf("%d\n",num[strlen(a)][strlen(b)]);
    getLCS();
    return 0;
}

void LCS()
{
    int i,j;
    for(i=1;i<=strlen(a);i++)
    {
        for(j=1;j<=strlen(b);j++)
        {
            if(a[i-1]==b[j-1])   ///註意這裏的下標是i-1與j-1
            {
                num[i][j]=num[i-1][j-1]+1;
                flag[i][j]=1;  ///斜向下標記
            }
            else if(num[i][j-1]>num[i-1][j])
            {
                num[i][j]=num[i][j-1];
                flag[i][j]=2;  ///向右標記
            }
            else
            {
                num[i][j]=num[i-1][j];
                flag[i][j]=3;  ///向下標記
            }
        }
    }
}

void getLCS()
{

    char res[500];
    int i=strlen(a);
    int j=strlen(b);
    int k=0;    ///用於保存結果的數組標誌位
    while(i>0 && j>0)
    {
        if(flag[i][j]==1)   ///假設是斜向下標記
        {
            res[k]=a[i-1];
            k++;
            i--;
            j--;
        }
        else if(flag[i][j]==2)  ///假設是斜向右標記
            j--;
        else if(flag[i][j]==3)  ///假設是斜向下標記
            i--;
    }

    for(i=k-1;i>=0;i--)
        printf("%c",res[i]);
}
技術分享圖片

    (3)圖示

技術分享圖片

也可採用遞歸的方式。缺點在於僅僅能得到最長公共子數列的長度,而無法得到詳細的子字符串:

#include<stdio.h>
#include<string.h>
char a[30],b[30];
int lena,lenb;
int LCS(int,int);  ///兩個參數分別表示數組a的下標和數組b的下標

int main()
{
    strcpy(a,"ABCBDAB");
    strcpy(b,"BDCABA");
    lena=strlen(a);
    lenb=strlen(b);
    printf("%d\n",LCS(0,0));
    return 0;
}

int LCS(int i,int j)
{
    if(i>=lena || j>=lenb)
        return 0;
    if(a[i]==b[j])
        return 1+LCS(i+1,j+1);
    else
        return LCS(i+1,j)>LCS(i,j+1)?

LCS(i+1,j):LCS(i,j+1); }


騰訊編程題