1. 程式人生 > >Stanford-parser依存句法關係解釋

Stanford-parser依存句法關係解釋

計算機語言學家羅賓森總結了依存語法的四條定理:

1、一個句子中存在一個成分稱之為根(root),這個成分不依賴於其它成分。

2、其它成分直接依存於某一成分;

3、任何一個成分都不能依存與兩個或兩個以上的成分;

4、如果A成分直接依存於B成分,而C成分在句中位於A和B之間,那麼C或者直接依存於B,或者直接依存於A和B之間的某一成分;

5、中心成分左右兩面的其它成分相互不發生關係。

使用斯坦福句法分析器做依存句法分析可以輸出句子的依存關係,Stanford parser基本上是一個詞彙化的概率上下文無關語法分析器,同時也使用了依存分析。

下面是對分析的結果中一些符號的解釋:

ROOT:要處理文字的語句;IP:簡單從句;NP:名詞短語;VP:動詞短語;PU:斷句符,通常是句號、問號、感嘆號等標點符號;LCP:方位詞短語;PP:介詞短語;CP:由‘的’構成的表示修飾性關係的短語;DNP:由‘的’構成的表示所屬關係的短語;ADVP:副詞短語;ADJP:形容詞短語;DP:限定詞短語;QP:量詞短語;NN:常用名詞;NR:固有名詞;NT:

ROOT:要處理文字的語句

IP:簡單從句

NP:名詞短語

VP:動詞短語

PU:斷句符,通常是句號、問號、感嘆號等標點符號

LCP:方位詞短語

PP:介詞短語

CP:由‘的’構成的表示修飾性關係的短語

DNP:由‘的’構成的表示所屬關係的短語

ADVP:副詞短語

ADJP:形容詞短語

DP:限定詞短語

QP:量詞短語

NN:常用名詞

NR:固有名詞

NT:時間名詞

PN:代詞

VV:動詞

VC:是

CC:表示連詞

VE:有

VA:表語形容詞

AS:內容標記(如:了)

VRD:動補複合詞

CD: 表示基數詞

DT: determiner 表示限定詞

EX: existential there 存在句

FW: foreign word 外來詞

IN: preposition or conjunction, subordinating 介詞或從屬連詞

JJ: adjective or numeral, ordinal 形容詞或序數詞

JJR: adjective, comparative 形容詞比較級

JJS: adjective, superlative 形容詞最高階

LS: list item marker 列表標識

MD: modal auxiliary 情態助動詞

PDT: pre-determiner 前位限定詞

POS: genitive marker 所有格標記

PRP: pronoun, personal 人稱代詞

RB: adverb 副詞

RBR: adverb, comparative 副詞比較級

RBS: adverb, superlative 副詞最高階

RP: particle 小品詞

SYM: symbol 符號

TO:”to” as preposition or infinitive marker 作為介詞或不定式標記

WDT: WH-determiner WH限定詞

WP: WH-pronoun WH代詞

WP$: WH-pronoun, possessive WH所有格代詞

WRB:Wh-adverb WH副詞

關係表示

abbrev: abbreviation modifier,縮寫

acomp: adjectival complement,形容詞的補充;

advcl : adverbial clause modifier,狀語從句修飾詞

advmod: adverbial modifier狀語

agent: agent,代理,一般有by的時候會出現這個

amod: adjectival modifier形容詞

appos: appositional modifier,同位詞

attr: attributive,屬性

aux: auxiliary,非主要動詞和助詞,如BE,HAVE SHOULD/COULD等到

auxpass: passive auxiliary 被動詞

cc: coordination,並列關係,一般取第一個詞

ccomp: clausal complement從句補充

complm: complementizer,引導從句的詞好重聚中的主要動詞

conj : conjunct,連線兩個並列的詞。

cop: copula。系動詞(如be,seem,appear等),(命題主詞與謂詞間的)連繫

csubj : clausal subject,從主關係

csubjpass: clausal passive subject 主從被動關係

dep: dependent依賴關係

det: determiner決定詞,如冠詞等

dobj : direct object直接賓語

expl: expletive,主要是抓取there

infmod: infinitival modifier,動詞不定式

iobj : indirect object,非直接賓語,也就是所以的間接賓語;

mark: marker,主要出現在有“that” or “whether”“because”, “when”,

mwe: multi-word expression,多個詞的表示

neg: negation modifier否定詞

nn: noun compound modifier名詞組合形式

npadvmod: noun phrase as adverbial modifier名詞作狀語

nsubj : nominal subject,名詞主語

nsubjpass: passive nominal subject,被動的名詞主語

num: numeric modifier,數值修飾

number: element of compound number,組合數字

parataxis: parataxis: parataxis,並列關係

partmod: participial modifier動詞形式的修飾

pcomp: prepositional complement,介詞補充

pobj : object of a preposition,介詞的賓語

poss: possession modifier,所有形式,所有格,所屬

possessive: possessive modifier,這個表示所有者和那個’S的關係

preconj : preconjunct,常常是出現在 “either”, “both”, “neither”的情況下

predet: predeterminer,字首決定,常常是表示所有

prep: prepositional modifier

prepc: prepositional clausal modifier

prt: phrasal verb particle,動詞短語

punct: punctuation,這個很少見,但是保留下來了,結果當中不會出現這個

purpcl : purpose clause modifier,目的從句

quantmod: quantifier phrase modifier,數量短語

rcmod: relative clause modifier相關關係

ref : referent,指示物,指代

rel : relative

root: root,最重要的詞,從它開始,根節點

tmod: temporal modifier

xcomp: open clausal complement

xsubj : controlling subject 掌控者

中心語為謂詞

subj — 主語

nsubj — 名詞性主語(nominal subject) (同步,建設)

top — 主題(topic) (是,建築)

npsubj — 被動型主語(nominal passive subject),專指由“被”引導的被動句中的主語,一般是謂詞語義上的受事 (稱作,鎳)

csubj — 從句主語(clausal subject),中文不存在

xsubj — x主語,一般是一個主語下面含多個從句 (完善,有些)

中心語為謂詞或介詞

obj — 賓語

dobj — 直接賓語 (頒佈,檔案)

iobj — 間接賓語(indirect object),基本不存在

range — 間接賓語為數量詞,又稱為與格 (成交,元)

pobj — 介詞賓語 (根據,要求)

lobj — 時間介詞 (來,近年)

中心語為謂詞

comp — 補語

ccomp — 從句補語,一般由兩個動詞構成,中心語引導後一個動詞所在的從句(IP) (出現,納入)

xcomp — x從句補語(xclausal complement),不存在

acomp — 形容詞補語(adjectival complement)

tcomp — 時間補語(temporal complement) (遇到,以前)

lccomp — 位置補語(localizer complement) (佔,以上)

— 結果補語(resultative complement)

中心語為名詞

mod — 修飾語(modifier)

pass — 被動修飾(passive)

tmod — 時間修飾(temporal modifier)

rcmod — 關係從句修飾(relative clause modifier) (問題,遇到)

numod — 數量修飾(numeric modifier) (規定,若干)

ornmod — 序數修飾(numeric modifier)

clf — 類別修飾(classifier modifier) (檔案,件)

nmod — 複合名詞修飾(noun compound modifier) (浦東,上海) amod — 形容詞修飾(adjetive modifier) (情況,新)

advmod — 副詞修飾(adverbial modifier) (做到,基本)

vmod — 動詞修飾(verb modifier,participle modifier)

prnmod — 插入詞修飾(parenthetical modifier)

neg — 不定修飾(negative modifier) (遇到,不)

det — 限定詞修飾(determiner modifier) (活動,這些) possm — 所屬標記(possessive marker),NP

poss — 所屬修飾(possessive modifier),NP

dvpm — DVP標記(dvp marker),DVP (簡單,的)

dvpmod — DVP修飾(dvp modifier),DVP (採取,簡單)

assm — 關聯標記(associative marker),DNP (開發,的)

assmod — 關聯修飾(associative modifier),NP|QP (教訓,特區) prep — 介詞修飾(prepositional modifier) NP|VP|IP(採取,對) clmod — 從句修飾(clause modifier) (因為,開始)

plmod — 介詞性地點修飾(prepositional localizer modifier) (在,上) asp — 時態標詞(aspect marker) (做到,了)

partmod– 分詞修飾(participial modifier) 不存在

etc — 等關係(etc) (辦法,等)

中心語為實詞

conj — 聯合(conjunct)

cop — 系動(copula) 雙指助動詞????

cc — 連線(coordination),指中心詞與連詞 (開發,與)

其它

attr — 屬性關係 (是,工程)

cordmod– 並列聯合動詞(coordinated verb compound) (頒佈,實行) mmod — 情態動詞(modal verb) (得到,能)

ba — 把字關係

tclaus — 時間從句 (以後,積累)

— semantic dependent

cpm — 補語化成分(complementizer),一般指“的”引導的CP (振興,的)