1. 程式人生 > >哈工大ltp詞性標註列表和ICTCLAS詞性列表

哈工大ltp詞性標註列表和ICTCLAS詞性列表

哈工大ltp詞性列表

Tag Description Example
a   adjective   美麗  
b   other noun-modifier 大型, 西式  
c   conjunction 和, 雖然   
d   adverb  很   
e   exclamation 哎   
g   morpheme    茨, 甥    
h   prefix  阿, 偽    
i   idiom   百花齊放    
j   abbreviation    公檢法 
k   suffix  界, 率    
m   number  一, 第一   
n   general noun    蘋果  
nd  direction noun  右側      
nh  person name
杜甫, 湯姆 ni organization name 保險公司 nl location noun 城郊 ns geographical name 北京 nt temporal noun 近日, 明代 nz other proper noun 諾貝爾獎 o onomatopoeia 嘩啦 p preposition 在, 把 q quantity 個 r pronoun 我們 u auxiliary 的, 地 v verb 跑, 學習 wp punctuation ,。! ws foreign words CPU x non-lexeme 萄, 翱

ICTCLAS 詞性列表

POS = {
    "n": {  # 1. 名詞  (1個一類,7個二類,5個三類)
        "n": "名詞",
        "nr": "人名",
        "nr1": "漢語姓氏",
        "nr2": "漢語名字",
        "nrj": "日語人名",
        "nrf": "音譯人名",
        "ns": "地名",
        "nsf": "音譯地名",
        "nt": "機構團體名",
        "nz": "其它專名",
        "nl": "名詞性慣用語"
, "ng": "名詞性語素" }, "t": { # 2. 時間詞(1個一類,1個二類) "t": "時間詞", "tg": "時間詞性語素" }, "s": { # 3. 處所詞(1個一類) "s": "處所詞" }, "f": { # 4. 方位詞(1個一類) "f": "方位詞" }, "v": { # 5. 動詞(1個一類,9個二類) "v": "動詞", "vd": "副動詞", "vn": "名動詞", "vshi": "動詞“是”", "vyou": "動詞“有”", "vf": "趨向動詞", "vx": "形式動詞", "vi": "不及物動詞(內動詞)", "vl": "動詞性慣用語", "vg": "動詞性語素" }, "a": { # 6. 形容詞(1個一類,4個二類) "a": "形容詞", "ad": "副形詞", "an": "名形詞", "ag": "形容詞性語素", "al": "形容詞性慣用語" }, "b": { # 7. 區別詞(1個一類,2個二類) "b": "區別詞", "bl": "區別詞性慣用語" }, "z": { # 8. 狀態詞(1個一類) "z": "狀態詞" }, "r": { # 9. 代詞(1個一類,4個二類,6個三類) "r": "代詞", "rr": "人稱代詞", "rz": "指示代詞", "rzt": "時間指示代詞", "rzs": "處所指示代詞", "rzv": "謂詞性指示代詞", "ry": "疑問代詞", "ryt": "時間疑問代詞", "rys": "處所疑問代詞", "ryv": "謂詞性疑問代詞", "rg": "代詞性語素" }, "m": { # 10. 數詞(1個一類,1個二類) "m": "數詞", "mq": "數量詞" }, "q": { # 11. 量詞(1個一類,2個二類) "q": "量詞", "qv": "動量詞", "qt": "時量詞" }, "d": { # 12. 副詞(1個一類) "d": "副詞" }, "p": { # 13. 介詞(1個一類,2個二類) "p": "介詞", "pba": "介詞“把”", "pbei": "介詞“被”" }, "c": { # 14. 連詞(1個一類,1個二類) "c": "連詞", "cc": "並列連詞" }, "u": { # 15. 助詞(1個一類,15個二類) "u": "助詞", "uzhe": "著", "ule": "了 嘍", "uguo": "過", "ude1": "的 底", "ude2": "地", "ude3": "得", "usuo": "所", "udeng": "等 等等 云云", "uyy": "一樣 一般 似的 般", "udh": "的話", "uls": "來講 來說 而言 說來", "uzhi": "之", "ulian": "連 " # (“連小學生都會”) }, "e": { # 16. 嘆詞(1個一類) "e": "嘆詞" }, "y": { # 17. 語氣詞(1個一類) "y": "語氣詞(delete yg)" }, "o": { # 18. 擬聲詞(1個一類) "o": "擬聲詞" }, "h": { # 19. 字首(1個一類) "h": "字首" }, "k": { # 20. 字尾(1個一類) "k": "字尾" }, "x": { # 21. 字串(1個一類,2個二類) "x": "字串", "xx": "非語素字", "xu": "網址URL" }, "w": { # 22. 標點符號(1個一類,16個二類) "w": "標點符號", "wkz": "左括號", # ( 〔 [ { 《 【 〖 〈 半形:( [ { < "wky": "右括號", # ) 〕 ] } 》 】 〗 〉 半形: ) ] { > "wyz": "全形左引號", # “ ‘ 『 "wyy": "全形右引號", # ” ’ 』 "wj": "全形句號", # 。 "ww": "問號", # 全形:? 半形:? "wt": "歎號", # 全形:! 半形:! "wd": "逗號", # 全形:, 半形:, "wf": "分號", # 全形:; 半形: ; "wn": "頓號", # 全形:、 "wm": "冒號", # 全形:: 半形: : "ws": "省略號", # 全形:…… … "wp": "破折號", # 全形:—— -- ——- 半形:--- ---- "wb": "百分號千分號", # 全形:% ‰ 半形:% "wh": "單位符號" # 全形:¥ $ £ ° ℃ 半形:$ } }

jieba的詞性標註與ICTCLAS相近; 哈工大的pyltp使用哈工大的詞性列表