Luogu P2375 動物園 kmp
P2375 動物園
題目描述
近日,園長發現動物園中好吃懶做的動物越來越多了。例如企鵝,只會賣萌向遊客要吃的。為了整治動物園的不良風氣,讓動物們憑自己的真才實學向遊客要吃的,園長決定開設算法班,讓動物們學習算法。
某天,園長給動物們講解KMP算法。
園長:“對於一個字符串S,它的長度為L。我們可以在O(L)的時間內,求出一個名為next的數組。有誰預習了next數組的含義嗎?”
熊貓:“對於字符串S的前i個字符構成的子串,既是它的後綴又是它的前綴的字符串中(它本身除外),最長的長度記作next[i]。”
園長:“非常好!那你能舉個例子嗎?”
熊貓:“例S為abcababc,則next[5]=2。因為S的前5個字符為abcab,ab既是它的後綴又是它的前綴,並且找不到一個更長的字符串滿足這個性質。同理,還可得出next[1] = next[2] = next[3] = 0,next[4] = next[6] = 1,next[7] = 2,next[8] = 3。”
園長表揚了認真預習的熊貓同學。隨後,他詳細講解了如何在O(L)的時間內求出next數組。
下課前,園長提出了一個問題:“KMP算法只能求出next數組。我現在希望求出一個更強大num數組一一對於字符串S的前i個字符構成的子串,既是它的後綴同時又是它的前綴,並且該後綴與該前綴不重疊,將這種字符串的數量記作num[i]。例如S為aaaaa,則num[4] = 2。這是因為S的前4個字符為aaaa,其中a和aa都滿足性質‘既是後綴又是前綴’,同時保證這個後綴與這個前綴不重疊。而aaa雖然滿足性質‘既是後綴又是前綴’,但遺憾的是這個後綴與這個前綴重疊了,所以不能計算在內。同理,num[1] = 0,num[2] = num[3] = 1,num[5] = 2。”
最後,園長給出了獎勵條件,第一個做對的同學獎勵巧克力一盒。聽了這句話,睡了一節課的企鵝立刻就醒過來了!但企鵝並不會做這道題,於是向參觀動物園的你尋求幫助。你能否幫助企鵝寫一個程序求出num數組呢?
特別地,為了避免大量的輸出,你不需要輸出num[i]分別是多少,你只需要輸出所有num[i]的乘積,對1,000,000,007取模的結果即可。
輸入輸出格式
輸入格式:第1行僅包含一個正整數n ,表示測試數據的組數。隨後n行,每行描述一組測試數據。每組測試數據僅含有一個字符串S,S的定義詳見題目描述。數據保證S 中僅含小寫字母。輸入文件中不會包含多余的空行,行末不會存在多余的空格。
輸出格式:包含 n 行,每行描述一組測試數據的答案,答案的順序應與輸入數據的順序保持一致。對於每組測試數據,僅需要輸出一個整數,表示這組測試數據的答案對 1,000,000,007 取模的結果。輸出文件中不應包含多余的空行。
輸入輸出樣例
輸入樣例#1:3 aaaaa ab abcababc輸出樣例#1:
36 1 32
說明
測試點編號 約定
1 N ≤ 5, L ≤ 50
2 N ≤ 5, L ≤ 200
3 N ≤ 5, L ≤ 200
4 N ≤ 5, L ≤ 10,000
5 N ≤ 5, L ≤ 10,000
6 N ≤ 5, L ≤ 100,000
7 N ≤ 5, L ≤ 200,000
8 N ≤ 5, L ≤ 500,000
9 N ≤ 5, L ≤ 1,000,000
10 N ≤ 5, L ≤ 1,000,000
Solution
Pre.
首先呢,這是一道非常好的語文題兼OI題。。
表示看題目時先是將num[i]看成了(前i個字符組成的字符串)的(最長的滿足(既是它的後綴同時又是它的前綴)而且(不重疊)的子串長度)
然後沙茶地認為前next[i]*2>i時,num[i]=i div 2;【捂臉熊.....】
於是發現樣例的奇怪
於是又看了下題目,結果又是把num[i]看成(s的子串中)(最長的滿足(既是它的後綴同時又是它的前綴)而且(不重疊)的子串長度)=i的個數【淚奔.....】
好吧,題意其實很清楚,怪我沒認真看題。。。。
“對於字符串S的前i個字符構成的子串,既是它的後綴同時又是它的前綴,並且該後綴與該前綴不重疊,將這種字符串的數量記作num[i]"
Sol.
感謝 @ 某沙茶的OI代碼庫 寫的題解,主要思路[應用部分]來自[省選前題目整理][BZOJ 3670][NOI 2014]動物園(KMP)
我們可以先用kmp求出$next$數組
然後我們構造一個$cnt$數組,
//註意:前綴$i$指的是前i個字符組成的字符串
$cnt[i]$=為滿足既是前綴$i$的前綴,又是前綴$i$的後綴的子串個數(包括前綴$i$本身),這個數組可以通過遞推在$O(n)$時間內得出:
$cnt[1]=1$ //前綴1只有本身
$cnt[i]=cnt[next[i]]+1 (1<i<=len)$ //前綴i的最長匹配next[i]+他自身
然後我們可以通過$cnt[]$和$next[]$數組求得$num[]$數組。
具體做法是,對於每個$i>=2$($i=1$時顯然$num[i]=0$),
通過沿著$next[]$指針向前走找到最大的j,
$j$滿足前綴$j$既是前綴i的前綴,也是它的後綴,且$2j<=i$(即題面中所限制的前綴和後綴不重疊),
那麽$num[i]=cnt[j]$.
胡弄一番證明——:
∵當前綴$i$的前綴$j$和他長度為$j$的後綴不重疊
∴前綴$j$的長度為$u$後綴=前綴$i$的長度為$u$的後綴 //當1<=u<=cnt[j]
又∵前綴$j$的長度為$u$後綴=前綴$j$的長度為$u$前綴=前綴$i$的長度為$u$的前綴
∴前綴$i$的長度為$u$的前綴=前綴$i$的長度為$u$的後綴=前綴$j$的長度為$u$前綴(這個的種數也就是cnt[j])=前綴$j$的長度為$u$後綴
又∵我們找到的j滿足$2j<=i$
∴$num[i]=cnt[j]$
然後我們就得到了一個50分的做法with TLE(註意ans為int64):
1 program no;
2 const
3 m=1000000007;
4 var
5 b:ansistring;
6 ans:int64;
7 n,p,i,j,l,num:Longint;
8 next,cnt:array[0..1000001] of longint;
9
10 procedure get_next_and_cnt;
11 begin
12 j:=0;
13 next[1]:=0; cnt[1]:=1;
14 for i:= 2 to l do
15 begin
16 while (j>0) and (b[j+1]<>b[i]) do j:=next[j];
17 if b[j+1]=b[i] then inc(j);
18 next[i]:=j; //kmp計算next
19 cnt[i]:=cnt[next[i]]+1; //順帶計算cnt
20 end;
21 end;
22
23 procedure cal;
24 begin
25 ans:=1;
26 for i:= 2 to l do
27 begin
28 j:=next[i];
29 while 2*j>i do j:=next[j]; //查找最大的符合條件的J
30 num:=cnt[j];
31 ans:=((ans mod m)*((num+1) mod m)) mod m;
32 end;
33 end;
34
35 begin
36 //assign(input,‘1.in‘); assign(output,‘1.out‘);
37 reset(input); rewrite(output);
38
39 readln(n);
40 for p:= 1 to n do
41 begin
42 readln(b); l:=length(b);
43
44 get_next_and_cnt();
45 cal();
46
47 writeln(ans);
48 end;
49
50 close(input); close(output);
51 end.
所以還是沒有AC。。。。
首先我們會發現$get_next_and_cnt()$是$O(N)$明顯不會時超
所以 $cal()$是罪魁禍首!
於是下面是100分的做法:
我們可以把查找最大的符合條件的J的部分改為像kmp中的一樣:
while(j<>0) and (b[j+1]<>b[i]) do j:=next[j];
if(b[j+1]=b[i]) then inc(j);
我們在循環到$i$時當前的$j$是不是可以重前一次的最長的不重疊的$j$得到呢?
答案是肯定的要麽小於等於上一次的$j$,要麽等於上一次的$j+1$
=====
猜想:會不會是$j+2$或更大呢?
不,可以用反證法
假設第$i-1$次循環得到$j$為$j$,這次(第$i$次)最終得到的為$j+2$
那麽可以發現前綴$i$的前綴$j+2$=他長度為$j+2$的後綴
那麽前綴$j+2$=前綴$i$的長度為$j+2$的後綴的長度為$j+1$的前綴(結束為$i-1$)
又因為我們得到的$j+2$滿足不重疊,那麽$j+1$自然也不會重疊
那麽我們可以得到前綴$i-1$的的最優$j$為$j+1$
這樣就沖突啦,於是這是不可能的
=====
於是我們每次求$j$的操作就接近$O(1)$,那$cal()$也就接近O(n)啦!
AC Codes:
1 program no;
2 const
3 m=1000000007;
4 var
5 b:ansistring;
6 ans:int64;
7 n,p,i,j,l,num:Longint;
8 next,cnt:array[0..1000001] of longint;
9
10 procedure get_next_and_cnt;
11 begin
12 j:=0;
13 next[1]:=0; cnt[1]:=1;
14 for i:= 2 to l do
15 begin
16 while (j>0) and (b[j+1]<>b[i]) do j:=next[j];
17 if b[j+1]=b[i] then inc(j);
18 next[i]:=j;
19 cnt[i]:=cnt[next[i]]+1;
20 end;
21 end;
22
23 procedure cal;
24 begin
25 ans:=1;j:=0;
26 for i:= 2 to l do
27 begin
28 while(j<>0) and (b[j+1]<>b[i]) do j:=next[j];
29 if(b[j+1]=b[i]) then inc(j); //修改的地方
30 while 2*j>i do j:=next[j];
31 num:=cnt[j];
32 ans:=((ans mod m)*((num+1) mod m)) mod m;
33 end;
34 end;
35
36 begin
37 // assign(input,‘1.in‘); assign(output,‘1.out‘);
38 reset(input); rewrite(output);
39
40 readln(n);
41 for p:= 1 to n do
42 begin
43 readln(b); l:=length(b);
44
45 get_next_and_cnt();
46 cal();
47
48 writeln(ans);
49 end;
50
51 close(input); close(output);
52 end.
Luogu P2375 動物園 kmp