Python 基礎 jieba庫——詞性標註與篩選
阿新 • • 發佈:2020-12-11
詞性 ,指以詞的特點作為劃分詞類的根據,主要用來描述一個詞在上下文中的作用。中文常見的有,a形容詞,d副詞,n名詞等等。
1 import jieba.posseg as pseg
2 words = pseg.cut("我愛自然語言處理")
3 for word, flag in words:
4 print('%s %s' % (word, flag))
當獲得到詞性時,我們就可以根據詞性進行篩選。
1 import jieba.posseg as pseg
2 words = pseg.cut( "我愛自然語言處理")
3 lst = [x.word for x in words if x,flag == 'v']
4 print(lst)
>>>['愛','處理']