1. 程式人生 > >對於一個字串,請設計一個高效演算法,計算其中最長迴文子串的長度。

對於一個字串,請設計一個高效演算法,計算其中最長迴文子串的長度。

給定字串A以及它的長度n,請返回最長迴文子串的長度。 

測試樣例: "abc1234321ab",12 

返回:7

分析與解法

最容易想到的辦法是列舉所有的子串,分別判斷其是否為迴文。這個思路初看起來是正確的,但卻做了很多無用功,如果一個長的子串包含另一個短一些的子串,那麼對子串的迴文判斷其實是不需要的。

解法一

那麼如何高效的進行判斷呢?我們想想,如果一段字串是迴文,那麼以某個字元為中心的字首和字尾都是相同的,例如以一段迴文串“aba”為例,以b為中心,它的字首和字尾都是相同的,都是a。

那麼,我們是可以列舉中心位置,然後再在該位置上用擴充套件法,記錄並更新得到的最長的迴文長度

class Palindrome {

public:
    int getLongestPalindrome(string A, int n) {
        int max=0,count=0;
        for(int i=0;i<n;i++) //i作為迴文串的中心
            {
            for(int j=0;((i-j)>=0)&&((i+j)<n);j++)//若迴文串是奇數個,i中心前面有j個,後面有j個
                {
                if(A[i-j]!=A[i+j])
                    break;
                count=j*2+1;
            }
            if(max<count)
                max=count;
            for(int j=0;((i-j)>=0)&&((i+1+j)<n);j++)//若迴文串是偶數個,i和i+1是中心,前面有j個,後面有j個
                {
                if(A[i-j]!=A[i+1+j])
                    break;
                count=j*2+2;
            }
            if(max<count)
                max=count;
        }
        return max;
        
    }

};

解法二、O(N)解法

在上文的解法一:列舉中心位置中,我們需要特別考慮字串的長度是奇數還是偶數,所以導致我們在編寫程式碼實現的時候要把奇數和偶數的情況分開編寫,是否有一種方法,可以不用管長度是奇數還是偶數,而統一處理呢?比如是否能把所有的情況全部轉換為奇數處理?

答案還是肯定的。這就是下面我們將要看到的Manacher演算法,且這個演算法求最長迴文子串的時間複雜度是線性O(N)的。

首先通過在每個字元的兩邊都插入一個特殊的符號,將所有可能的奇數或偶數長度的迴文子串都轉換成了奇數長度。比如 abba 變成 #a#b#b#a#, aba變成 #a#b#a#。

此外,為了進一步減少編碼的複雜度,可以在字串的開始加入另一個特殊字元,這樣就不用特殊處理越界問題,比如$#a#b#a#。

以字串12212321為例,插入#和$這兩個特殊符號,變成了 S[] = "$#1#2#2#1#2#3#2#1#",然後用一個數組 P[i] 來記錄以字元S[i]為中心的最長迴文子串向左或向右擴張的長度(包括S[i])。

比如S和P的對應關係:

  • S # 1 # 2 # 2 # 1 # 2 # 3 # 2 # 1 #
  • P 1 2 1 2 5 2 1 4 1 2 1 6 1 2 1 2 1

可以看出,P[i]-1正好是原字串中最長迴文串的總長度,為5

接下來怎麼計算P[i]呢?Manacher演算法增加兩個輔助變數id和mx,其中id表示最大回文子串中心的位置,mx則為id+P[id],也就是最大回文子串的邊界。得到一個很重要的結論:

  • 如果mx > i,那麼P[i] >= Min(P[2 * id - i], mx - i)

C程式碼如下:

//mx > i,那麼P[i] >= MIN(P[2 * id - i], mx - i)
//故誰小取誰
if (mx - i > P[2*id - i])
    P[i] = P[2*id - i];
else  //mx-i <= P[2*id - i]
    P[i] = mx - i; 

下面,令j = 2*id - i,也就是說j是i關於id的對稱點。

當 mx - i > P[j] 的時候,以S[j]為中心的迴文子串包含在以S[id]為中心的迴文子串中,由於i和j對稱,以S[i]為中心的迴文子串必然包含在以S[id]為中心的迴文子串中,所以必有P[i] = P[j];

當 P[j] >= mx - i 的時候,以S[j]為中心的迴文子串不一定完全包含於以S[id]為中心的迴文子串中,但是基於對稱性可知,下圖中兩個綠框所包圍的部分是相同的,也就是說以S[i]為中心的迴文子串,其向右至少會擴張到mx的位置,也就是說 P[i] >= mx - i。至於mx之後的部分是否對稱,再具體匹配。

此外,對於 mx <= i 的情況,因為無法對 P[i]做更多的假設,只能讓P[i] = 1,然後再去匹配。

綜上,關鍵程式碼如下:

//輸入,並處理得到字串s
int p[1000], mx = 0, id = 0;
memset(p, 0, sizeof(p));
for (i = 1; s[i] != '\0'; i++) 
{
	p[i] = mx > i ? min(p[2 * id - i], mx - i) : 1;
	while (s[i + p[i]] == s[i - p[i]]) //未考慮詳細越界問題
		p[i]++;
	if (p[i] > mx-id) 
	{
		mx = i + p[i];
		id = i;
	}
}
//找出p[i]中最大的

此Manacher演算法使用id、mx做配合,可以在每次迴圈中,直接對P[i]的快速賦值,從而在計算以i為中心的迴文子串的過程中,不必每次都從1開始比較,減少了比較次數,最終使得求解最長迴文子串的長度達到線性O(N)的時間複雜度。

#include<iostream>
#include<string.h>
#include<string>
#include<algorithm>
using namespace std;


int main()
{
string in;
while (cin >> in)
{
int len = in.size();
string s = "#";
for (int i = 0; i < len; i++)
{
s = s + in[i] + "#";
}
//輸入,並處理得到字串s
cout << s << endl;
int p[1000], mx = 0, id = 0;
memset(p, 0, sizeof(p));
for (int i = 1; i<s.size(); i++)
{
p[i] = mx > i ? min(p[2 * id - i], mx - i) : 1;
while ((i + p[i]<s.size()) && ((i - p[i]) >= 0) && (s[i + p[i]] == s[i - p[i]]))//不能越界
p[i]++;
cout << p[i] << endl;//在中心位置i不斷增加時,每次輸出p[i]大小;
if (p[i] > mx - id)
{
mx = i + p[i];
id = i;
}
}
//找出p[i]中最大的
cout <<"最長迴文串是: "<< p[id] - 1;
}

return 0;
}