1. 程式人生 > >Luogu P2375 動物園 kmp

Luogu P2375 動物園 kmp

第一個 幫助 構造 procedure [1] 向前走 定義 con 包含

P2375 動物園

題目描述

近日,園長發現動物園中好吃懶做的動物越來越多了。例如企鵝,只會賣萌向遊客要吃的。為了整治動物園的不良風氣,讓動物們憑自己的真才實學向遊客要吃的,園長決定開設算法班,讓動物們學習算法。

某天,園長給動物們講解KMP算法。

園長:“對於一個字符串S,它的長度為L。我們可以在O(L)的時間內,求出一個名為next的數組。有誰預習了next數組的含義嗎?”

熊貓:“對於字符串S的前i個字符構成的子串,既是它的後綴又是它的前綴的字符串中(它本身除外),最長的長度記作next[i]。”

園長:“非常好!那你能舉個例子嗎?”

熊貓:“例S為abcababc,則next[5]=2。因為S的前5個字符為abcab,ab既是它的後綴又是它的前綴,並且找不到一個更長的字符串滿足這個性質。同理,還可得出next[1] = next[2] = next[3] = 0,next[4] = next[6] = 1,next[7] = 2,next[8] = 3。”

園長表揚了認真預習的熊貓同學。隨後,他詳細講解了如何在O(L)的時間內求出next數組。

下課前,園長提出了一個問題:“KMP算法只能求出next數組。我現在希望求出一個更強大num數組一一對於字符串S的前i個字符構成的子串,既是它的後綴同時又是它的前綴,並且該後綴與該前綴不重疊,將這種字符串的數量記作num[i]。例如S為aaaaa,則num[4] = 2。這是因為S的前4個字符為aaaa,其中a和aa都滿足性質‘既是後綴又是前綴’,同時保證這個後綴與這個前綴不重疊。而aaa雖然滿足性質‘既是後綴又是前綴’,但遺憾的是這個後綴與這個前綴重疊了,所以不能計算在內。同理,num[1] = 0,num[2] = num[3] = 1,num[5] = 2。”

最後,園長給出了獎勵條件,第一個做對的同學獎勵巧克力一盒。聽了這句話,睡了一節課的企鵝立刻就醒過來了!但企鵝並不會做這道題,於是向參觀動物園的你尋求幫助。你能否幫助企鵝寫一個程序求出num數組呢?

特別地,為了避免大量的輸出,你不需要輸出num[i]分別是多少,你只需要輸出所有num[i]的乘積,對1,000,000,007取模的結果即可。

輸入輸出格式

輸入格式:

第1行僅包含一個正整數n ,表示測試數據的組數。隨後n行,每行描述一組測試數據。每組測試數據僅含有一個字符串S,S的定義詳見題目描述。數據保證S 中僅含小寫字母。輸入文件中不會包含多余的空行,行末不會存在多余的空格。

輸出格式:

包含 n 行,每行描述一組測試數據的答案,答案的順序應與輸入數據的順序保持一致。對於每組測試數據,僅需要輸出一個整數,表示這組測試數據的答案對 1,000,000,007 取模的結果。輸出文件中不應包含多余的空行。

輸入輸出樣例

輸入樣例#1:
3
aaaaa
ab
abcababc
輸出樣例#1:
36
1
32 

說明

測試點編號 約定

1 N ≤ 5, L ≤ 50

2 N ≤ 5, L ≤ 200

3 N ≤ 5, L ≤ 200

4 N ≤ 5, L ≤ 10,000

5 N ≤ 5, L ≤ 10,000

6 N ≤ 5, L ≤ 100,000

7 N ≤ 5, L ≤ 200,000

8 N ≤ 5, L ≤ 500,000

9 N ≤ 5, L ≤ 1,000,000

10 N ≤ 5, L ≤ 1,000,000

Pre.

首先呢,這是一道非常好的語文題兼OI題。。

表示看題目時先是將num[i]看成了(前i個字符組成的字符串)的(最長的滿足(既是它的後綴同時又是它的前綴)而且(不重疊)的子串長度)

然後沙茶地認為前next[i]*2>i時,num[i]=i div 2;【捂臉熊.....】

於是發現樣例的奇怪

於是又看了下題目,結果又是把num[i]看成(s的子串中)(最長的滿足(既是它的後綴同時又是它的前綴)而且(不重疊)的子串長度)=i的個數【淚奔.....】

好吧,題意其實很清楚,怪我沒認真看題。。。。

“對於字符串S的前i個字符構成的子串,既是它的後綴同時又是它的前綴,並且該後綴與該前綴不重疊,將這種字符串的數量記作num[i]"

Sol.

感謝 @ 某沙茶的OI代碼庫 寫的題解,主要思路[應用部分]來自[省選前題目整理][BZOJ 3670][NOI 2014]動物園(KMP)

我們可以先用kmp求出$next$數組

然後我們構造一個$cnt$數組,

//註意:前綴$i$指的是前i個字符組成的字符串

$cnt[i]$=為滿足既是前綴$i$的前綴,又是前綴$i$的後綴的子串個數(包括前綴$i$本身),這個數組可以通過遞推在$O(n)$時間內得出:

$cnt[1]=1$ //前綴1只有本身
$cnt[i]=cnt[next[i]]+1 (1<i<=len)$ //前綴i的最長匹配next[i]+他自身

然後我們可以通過$cnt[]$和$next[]$數組求得$num[]$數組。

具體做法是,對於每個$i>=2$($i=1$時顯然$num[i]=0$),

通過沿著$next[]$指針向前走找到最大的j,

$j$滿足前綴$j$既是前綴i的前綴,也是它的後綴,且$2j<=i$(即題面中所限制的前綴和後綴不重疊),

那麽$num[i]=cnt[j]$.

胡弄一番證明——:

∵當前綴$i$的前綴$j$和他長度為$j$的後綴不重疊

∴前綴$j$的長度為$u$後綴=前綴$i$的長度為$u$的後綴 //當1<=u<=cnt[j]

又∵前綴$j$的長度為$u$後綴=前綴$j$的長度為$u$前綴=前綴$i$的長度為$u$的前綴

∴前綴$i$的長度為$u$的前綴=前綴$i$的長度為$u$的後綴=前綴$j$的長度為$u$前綴(這個的種數也就是cnt[j])=前綴$j$的長度為$u$後綴

又∵我們找到的j滿足$2j<=i$

∴$num[i]=cnt[j]$

然後我們就得到了一個50分的做法with TLE(註意ans為int64):

 1 program no;
 2 const
 3   m=1000000007;
 4 var
 5   b:ansistring;
 6   ans:int64;
 7   n,p,i,j,l,num:Longint;
 8   next,cnt:array[0..1000001] of longint;
 9 
10 procedure get_next_and_cnt;
11 begin
12      j:=0;
13     next[1]:=0;  cnt[1]:=1;
14     for i:= 2 to l do
15     begin
16       while (j>0) and (b[j+1]<>b[i]) do j:=next[j];
17       if b[j+1]=b[i] then inc(j);
18       next[i]:=j;              //kmp計算next
19       cnt[i]:=cnt[next[i]]+1;  //順帶計算cnt
20     end;
21 end;
22 
23 procedure cal;
24 begin
25     ans:=1;
26     for i:= 2 to l do
27       begin
28           j:=next[i];
29           while 2*j>i do j:=next[j];  //查找最大的符合條件的J
30           num:=cnt[j];
31           ans:=((ans mod m)*((num+1) mod m)) mod m;
32       end;
33 end;
34 
35 begin
36    //assign(input,1.in‘); assign(output,1.out);
37    reset(input); rewrite(output);
38 
39    readln(n);
40    for p:= 1 to n do
41    begin
42      readln(b);   l:=length(b);
43 
44      get_next_and_cnt();
45      cal();
46 
47      writeln(ans);
48    end;
49 
50    close(input);  close(output);
51 end.

所以還是沒有AC。。。。

首先我們會發現$get_next_and_cnt()$是$O(N)$明顯不會時超

所以 $cal()$是罪魁禍首!

於是下面是100分的做法:

我們可以把查找最大的符合條件的J的部分改為像kmp中的一樣:

 while(j<>0) and (b[j+1]<>b[i]) do j:=next[j];
            if(b[j+1]=b[i]) then inc(j);

我們在循環到$i$時當前的$j$是不是可以重前一次的最長的不重疊的$j$得到呢?

答案是肯定的要麽小於等於上一次的$j$,要麽等於上一次的$j+1$

=====

猜想:會不會是$j+2$或更大呢?

不,可以用反證法

假設第$i-1$次循環得到$j$為$j$,這次(第$i$次)最終得到的為$j+2$

那麽可以發現前綴$i$的前綴$j+2$=他長度為$j+2$的後綴

那麽前綴$j+2$=前綴$i$的長度為$j+2$的後綴的長度為$j+1$的前綴(結束為$i-1$)

又因為我們得到的$j+2$滿足不重疊,那麽$j+1$自然也不會重疊

那麽我們可以得到前綴$i-1$的的最優$j$為$j+1$

這樣就沖突啦,於是這是不可能的

=====

於是我們每次求$j$的操作就接近$O(1)$,那$cal()$也就接近O(n)啦!

AC Codes:

 1 program no;
 2 const
 3   m=1000000007;
 4 var
 5   b:ansistring;
 6   ans:int64;
 7   n,p,i,j,l,num:Longint;
 8   next,cnt:array[0..1000001] of longint;
 9 
10 procedure get_next_and_cnt;
11 begin
12      j:=0;
13     next[1]:=0;  cnt[1]:=1;
14     for i:= 2 to l do
15     begin
16       while (j>0) and (b[j+1]<>b[i]) do j:=next[j];
17       if b[j+1]=b[i] then inc(j);
18       next[i]:=j;
19       cnt[i]:=cnt[next[i]]+1;
20     end;
21 end;
22 
23 procedure cal;
24 begin
25     ans:=1;j:=0;
26     for i:= 2 to l do
27       begin
28         while(j<>0) and (b[j+1]<>b[i]) do j:=next[j];
29             if(b[j+1]=b[i]) then inc(j);            //修改的地方
30           while 2*j>i do j:=next[j];
31           num:=cnt[j];
32           ans:=((ans mod m)*((num+1) mod m)) mod m;
33       end;
34 end;
35 
36 begin
37   // assign(input,1.in‘); assign(output,1.out);
38    reset(input); rewrite(output);
39 
40    readln(n);
41    for p:= 1 to n do
42    begin
43      readln(b);   l:=length(b);
44 
45      get_next_and_cnt();
46      cal();
47 
48      writeln(ans);
49    end;
50 
51    close(input);  close(output);
52 end.

Luogu P2375 動物園 kmp