1. 程式人生 > 其它 >Python 基礎 jieba庫——詞性標註與篩選

Python 基礎 jieba庫——詞性標註與篩選

技術標籤:python 基礎自然語言處理python

詞性 ,指以詞的特點作為劃分詞類的根據,主要用來描述一個詞在上下文中的作用。中文常見的有,a形容詞,d副詞,n名詞等等。

1 import jieba.posseg as pseg
2 words = pseg.cut("我愛自然語言處理")
3 for word, flag in words:
4     print('%s %s' % (word, flag))

在這裡插入圖片描述
當獲得到詞性時,我們就可以根據詞性進行篩選。

1 import jieba.posseg as pseg
2 words = pseg.cut(
"我愛自然語言處理") 3 lst = [x.word for x in words if x,flag == 'v'] 4 print(lst) >>>['愛','處理']