201803-3 URL對映 ccf
問題描述
URL 對映是諸如 Django、Ruby on Rails 等網頁框架 (web frameworks) 的一個重要元件。對於從瀏覽器發來的 HTTP 請求,URL 對映模組會解析請求中的 URL 地址,並將其分派給相應的處理程式碼。現在,請你來實現一個簡單的 URL 對映功能。
本題中 URL 對映功能的配置由若干條 URL 對映規則組成。當一個請求到達時,URL 對映功能會將請求中的 URL 地址按照配置的先後順序逐一與這些規則進行匹配。當遇到第一條完全匹配的規則時,匹配成功,得到匹配的規則以及匹配的引數。若不能匹配任何一條規則,則匹配失敗。
本題輸入的 URL 地址是以斜槓 / 作為分隔符的路徑,保證以斜槓開頭。其他合法字元還包括大小寫英文字母、阿拉伯數字、減號 -、下劃線 _ 和小數點 .。例如,/person/123/ 是一個合法的 URL 地址,而 /person/123? 則不合法(存在不合法的字元問號 ?)。另外,英文字母區分大小寫,因此 /case/ 和 /CAse/ 是不同的 URL 地址。
對於 URL 對映規則,同樣是以斜槓開始。除了可以是正常的 URL 地址外,還可以包含引數,有以下 3 種:
字串 :用於匹配一段字串,注意字串裡不能包含斜槓。例如,abcde0123。
整數 :用於匹配一個不帶符號的整數,全部由阿拉伯數字組成。例如,01234。
路徑 :用於匹配一段字串,字串可以包含斜槓。例如,abcd/0123/。
以上 3 種引數都必須匹配非空的字串。簡便起見,題目規定規則中 和 前面一定是斜槓,後面要麼是斜槓,要麼是規則的結束(也就是該引數是規則的最後一部分)。而 的前面一定是斜槓,後面一定是規則的結束。無論是 URL 地址還是規則,都不會出現連續的斜槓。
輸入格式
輸入第一行是兩個正整數 n 和 m,分別表示 URL 對映的規則條數和待處理的 URL 地址個數,中間用一個空格字元分隔。
第 2 行至第 n+1 行按匹配的先後順序描述 URL 對映規則的配置資訊。第 i+1 行包含兩個字串 pi 和 ri,其中 pi 表示 URL 匹配的規則,ri 表示這條 URL 匹配的名字。兩個字串都非空,且不包含空格字元,兩者中間用一個空格字元分隔。
第 n+2 行至第 n+m+1 行描述待處理的 URL 地址。第 n+1+i 行包含一個字串 qi,表示待處理的 URL 地址,字串中不包含空格字元。
輸出格式
輸入共 m 行,第 i 行表示 qi 的匹配結果。如果匹配成功,設匹配了規則 pj ,則輸出對應的 rj。同時,如果規則中有引數,則在同一行內依次輸出匹配後的引數。注意整數引數輸出時要把前導零去掉。相鄰兩項之間用一個空格字元分隔。如果匹配失敗,則輸出 404。
樣例輸入
5 4
/articles/2003/ special_case_2003
/articles/<int>/ year_archive
/articles/<int>/<int>/ month_archive
/articles/<int>/<int>/<str>/ article_detail
/static/<path> static_serve
/articles/2004/
/articles/1985/09/aloha/
/articles/hello/
/static/js/jquery.js
樣例輸出
year_archive 2004
article_detail 1985 9 aloha
404
static_serve js/jquery.js
樣例說明
對於第 1 個地址 /articles/2004/,無法匹配第 1 條規則,可以匹配第 2 條規則,引數為 2004。
對於第 2 個地址 /articles/1985/09/aloha/,只能匹配第 4 條規則,引數依次為 1985、9(已經去掉前導零)和 aloha。
對於第 3 個地址 /articles/hello/,無法匹配任何一條規則。
對於第 4 個地址 /static/js/jquery.js,可以匹配最後一條規則,引數為 js/jquery.js。
資料規模和約定
1 ≤ n ≤ 100,1 ≤ m ≤ 100。
所有輸入行的長度不超過 100 個字元(不包含換行符)。
保證輸入的規則都是合法的。
#include <bits/stdc++.h>
using namespace std;
struct regulation{
string name;
vector<string> regv;
regulation(string a,vector<string> v):name(a),regv(v){}
};
vector<regulation> regulations;
vector<string> str2regv(string str){
vector<string> res;
str=str.substr(1,str.size()-1);
res.push_back("/");
size_t pos=str.find("/");
while(pos!=string::npos){
res.push_back(str.substr(0,pos));
res.push_back("/");
str=str.substr(pos+1);
pos=str.find("/");
}
if(str.size()) res.push_back(str);
return res;
}
void urlmap(string str){
vector<string> v=str2regv(str);
for(size_t i=0;i<regulations.size();++i){
vector<string> &r=regulations[i].regv;
string res=regulations[i].name;
size_t lr=r.size(),lv=v.size(),j=0,k=0;
while(j<lr&&k<lv){
if(r[j]==v[k]){
++j,++k;continue;
}
if(r[j]=="<path>"){
if(v[lv-1]=="/") break;
res+=" ";
while(k<lv){
res+=v[k++];
}
cout<<res<<endl;
return;
}else if(r[j]=="<int>"){
string num;
bool tag=1;
for(size_t l=0;l<v[k].size();++l){
if(isdigit(v[k][l])) num+=v[k][l];
else {
tag=0;break;
}
}
if(tag==0) break;
size_t uz=0;
while(num[uz]=='0'&&uz<num.size()-1) ++uz;
res+=" "+num.substr(uz,num.size()-uz);
}else if(r[j]=="<str>"){
res+=" "+v[k];
}else break;
++j;++k;
}
if(j==lr&&k==lv){
cout<<res<<endl;
return;
}
}
cout<<"404"<<endl;
}
int main()
{
int n,m;
cin>>n>>m;
for(int i=0;i<n;++i){
string regstr,name;
cin>>regstr>>name;
regulations.push_back(regulation(name,str2regv(regstr)));
}
while(m--){
string str;
cin>>str;
urlmap(str);
}
return 0;
}