ICTCLAS 漢語詞性標註集中科院

阿新 • • 發佈：2019-01-13

Ag 形語素形容詞性語素。形容詞程式碼為a，語素程式碼ｇ前面置以A。

a 形容詞取英語形容詞adjective的第1個字母。

ad 副形詞直接作狀語的形容詞。形容詞程式碼a和副詞程式碼d並在一起。

an 名形詞具有名詞功能的形容詞。形容詞程式碼a和名詞程式碼n並在一起。

b 區別詞取漢字“別”的聲母。

c 連詞取英語連詞conjunction的第1個字母。

Dg 副語素副詞性語素。副詞程式碼為d，語素程式碼ｇ前面置以D。

d 副詞取adverb的第2個字母，因其第1個字母已用於形容詞。

e 嘆詞取英語嘆詞exclamation的第1個字母。

f 方位詞取漢字“方”

g 語素絕大多數語素都能作為合成詞的“詞根”，取漢字“根”的聲母。

h 前接成分取英語head的第1個字母。

i 成語取英語成語idiom的第1個字母。

j 簡稱略語取漢字“簡”的聲母。

k 後接成分

l 習用語習用語尚未成為成語，有點“臨時性”，取“臨”的聲母。

m 數詞取英語numeral的第3個字母，n，u已有他用。

Ng 名語素名詞性語素。名詞程式碼為n，語素程式碼ｇ前面置以N。

n 名詞取英語名詞noun的第1個字母。

nr 人名名詞程式碼n和“人(ren)”的聲母並在一起。

ns 地名名詞程式碼n和處所詞程式碼s並在一起。

nt 機構團體 “團”的聲母為t，名詞程式碼n和t並在一起。

nz 其他專名 “專”的聲母的第1個字母為z，名詞程式碼n和z並在一起。

o 擬聲詞取英語擬聲詞onomatopoeia的第1個字母。

p 介詞取英語介詞prepositional的第1個字母。

q 量詞取英語quantit的第1個字母。

r 代詞取英語代詞pronoun的第2個字母,因p已用於介詞。

s 處所詞取英語space的第1個字母。

Tg 時語素時間詞性語素。時間詞程式碼為t,在語素的程式碼g前面置以T。

t 時間詞取英語time的第1個字母。

u 助詞取英語助詞auxiliary

Vg 動語素動詞性語素。動詞程式碼為v。在語素的程式碼g前面置以V。

v 動詞取英語動詞verb的第一個字母。

vd 副動詞直接作狀語的動詞。動詞和副詞的程式碼並在一起。

vn 名動詞指具有名詞功能的動詞。動詞和名詞的程式碼並在一起。

w 標點符號

x 非語素字非語素字只是一個符號，字母x通常用於代表未知數、符號。

y 語氣詞取漢字“語”的聲母。

z 狀態詞取漢字“狀”的聲母的前一個字母。
-------------------------------------------------------------------------------
a: 形容詞
b: 區別詞
c: 連詞
d: 副詞
e: 嘆詞
g: 語素字
h: 前接成分
i: 習用語
j: 簡稱
k: 後接成分
m: 數詞
n: 普通名詞
nd: 方位名詞
nh: 人名
ni: 機構名
nl: 處所名詞
ns: 地名
nt: 時間詞
nz: 其他專名
o: 擬聲詞
p: 介詞
q: 量詞
r: 代詞
u: 助詞
v: 動詞
wp: 標點符號
ws: 字串
x: 非語素字

ICTCLAS 漢語詞性標註集中科院

ICTCLAS 漢語詞性標註集中科院

計算所詞性標註集

北大詞性標註集

ansj中的一些詞性標註集

哈工大ltp詞性標註列表和ICTCLAS詞性列表

Tensorflow進行POS詞性標註NER實體識別 - 構建LSTM網絡進行序列化標註

轉：CRF++詞性標註

自然語言處理---用隱馬爾科夫模型（HMM）實現詞性標註---1998年1月份人民日報語料---learn---test---evaluation---Demo---java實現

一套準確率高且效率高的分詞、詞性標註工具-thulac

斯坦福大學-自然語言處理入門筆記第十二課詞性標註（Part-of-speech tagging）

Stanford-corenlp 英文詞性標註

【NLP】【四】jieba原始碼分析之詞性標註

自然語言處理基礎技術之詞性標註實戰

自然語言處理基礎技術之詞性標註

python 自然語言處理詞性標註

HMM與分詞、詞性標註、命名實體識別

pyhanlp 詞性標註（正篇）

jieba詞性標註與分詞結果不一致(提取關鍵詞）

jieba分詞-詞性標註

python_NLP實戰之詞性標註與命名實體識別

ICTCLAS 漢語詞性標註集 中科院

相關推薦

ICTCLAS 漢語詞性標註集中科院