1. 程式人生 > >Uva1401 Remember the Word 字典樹trie

Uva1401 Remember the Word 字典樹trie

題意翻譯

Uva1401 Remember the Word (記單詞) 翻譯

題目描述

  • Neal 對有關組合的問題很感興趣,現在他有一個關於單詞的有趣問題要解決:

  • 他知道大佬Ray的記憶力像儲存器一樣好,這樣的問題肯定難不倒他,於是Neal把問題給了蒟蒻Jiejie。Jiejie經常記不住數字,他就用火柴棒來幫助自己記憶。Jiejie最多隻能用20071027根火柴棒(因為他只有那麼多),所以Jiejie數出來的數量需要關於20071027取模

  • 問題如下: 一個長單詞需要被分割成幾個小單詞(當然小單詞都在字典當中)。比如有包含4個單詞的字典:{a, b, cd, ab},則長單詞abcd有兩種分解方法: a+b+cd和ab+cd。

  • 現給定一個由s個不同單片語成的字典和一個長字串,Jiejie需要把這個長字串按字典分解成若干個單詞,問有多少種分解方法

輸入

  • 每個輸入檔案中有多組測試資料,對於每組測試資料:

  • 第一行是長單詞,單詞的長度不會超過300,000

  • 第二行是整數s,1≤s≤4000。

  • 接下來的s行,每行是字典中的一個單詞,每個單詞長度不超過100,所有單詞字母都是小寫的,且不會有相同單詞

  • 每組測試資料間都會有一個空行

  • 你的程式必須處理到檔案結束(即EOF)為止

輸出

  • 對於每組測試資料,輸出總數對20071027取模後的值,格式參考樣例。

樣例輸入

abcd
4
a
b
cd
ab

樣例輸出

Case 1: 2

原題連結 pdf

感謝@dasxxx 提供的翻譯

題目描述

PDF

輸入輸出格式

輸入格式:

輸出格式:

輸入輸出樣例

暫無測試點

演算法分析:

題意:

        給你一個由N個單片語成的詞典和一個字串S。問你S由N中的單片語成的方法有多少種?字典中的單詞可以重複使用但是不可重疊。

比如,

abcd
4
a
b
cd
ab

答案:a+b+cd  ab+cd

分析:

首先,我們能想到遞推法,

      dp[i]表示S串的字尾[i,len-1]串有多少種構成方式,則dp[i]=sum(  d[i+len(x)]  ) 單詞x是S[i...L]的字首且僅當[i,i+len(x)-1]區間的字元正好是字典中的一個單詞時

如果列舉x,時間肯定超時。

        然後初值d[L]=1,其他所有d值初始為0,然後從L-1一直遞推到0,最終結果就是d[0].

當我們遞推d[i]的時候,我們先用串[i,L-1]去查詢字典樹,如果查詢到了一個長5的單詞,那說明d[i] += d[i+5],如果查詢到另一個長8的單詞,那說明d[i] +=d[i+8].

        另外要說明的是:字典樹中的v值儲存的是該節點單詞的長度,如果該節點不是單詞,那麼v=0.

程式碼實現:

#include<cstdio>
#include<iostream>
#include<fstream>
#include<algorithm>
#include<functional>
#include<cstring>
#include<string>
#include<cstdlib>
#include<iomanip>
#include<numeric>
#include<cctype>
#include<cmath>
#include<ctime>
#include<queue>
#include<stack>
#include<list>
#include<set>
#include<map>
using namespace std;
#define N 300000+5
#define MAX 26

typedef long long ll;

const int MOD = 20071027;
const int maxnode=4000*100+100;//預計字典樹最大節點數目
const int sigma_size=26;       //每個節點的最多兒子數
 
struct Trie
{
    int ch[maxnode][sigma_size];//ch[i][j]==k表示第i個節點的第j個兒子是節點k
    int val[maxnode];//val[i]==x表示第i個節點的權值為x
    int sz;//字典樹一共有sz個節點,從0到sz-1標號
 
    //初始化
    void clear()
    {
        sz=1;
        memset(ch[0],0,sizeof(ch[0]));//ch值為0表示沒有兒子
    }
 
    //在字典樹中插入單詞s,但是如果已經存在s單詞會重複插入且覆蓋權值
    //所以insert前需要判斷一下是否已經存在s單詞了
    void insert(string s)
    { 
		int u=0,n=s.length();
        for(int i=0;i<n;i++)///建立字典樹
        {
            int id=s[i]-'a';
            if(ch[u][id]==0)//無該兒子
            {
                ch[u][id]=sz;
                memset(ch[sz],0,sizeof(ch[sz]));
                val[sz++]=0;
            }
            u=ch[u][id];
        }
        val[u]=n;
    }
 
    //在字典樹中查詢單詞s
    bool find(string s,vector<int> &v)
    {
        int n=s.length(),u=0;
        for(int i=0;i<n;i++)
        {
            int id=s[i]-'a';
            if(ch[u][id]==0)
                return false;
            u=ch[u][id];
            if(val[u]) v.push_back(val[u]);
        }
        return val[u];
    }
};
Trie trie;
ll dp[N];
int main()
{
	string s;
	int n;
	int kase=1;
	while(cin>>s)
	{
		
		trie.clear();
		memset(dp,0,sizeof(dp));
		
		scanf("%d",&n);
		for(int i=1;i<=n;i++)
		{
			string word;
			cin.get();
	        cin>>word;
			trie.insert(word);
		}
		int len=s.length();
		dp[len]=1;
		for(int i=len-1;i>=0;i--)
		{
			vector<int>v;//儲存s[i...len]中的字首在字典中單詞的長度
			//cout<<s.substr(i,len)<<endl;
			trie.find(s.substr(i,len),v);
			for(int j=0;j<v.size();j++)
			 dp[i]=(dp[i]+dp[i+v[j]])%MOD;
		}
		printf("Case %d: %d\n", kase++, dp[0]);
	}
	
}