python學習筆記(一)jieba模組初探
阿新 • • 發佈:2019-01-22
環境說明:windows 7,python27,jieba VERSION 0.38,pycharm2016.1
1.簡介:
支援中文分詞,關鍵字提取,詞性標註,自己管理詞庫等
2.安裝:
方法一:開始->搜尋cmd->cd到pip.exe目錄->輸入命令pip install jieba
3.程式碼片段:
import jieba
seg = jieba.cut('有關青春萌動',True/False)#分詞,True/False 全模式/精確模式
seg = jieba.cut_for_search('有關青春萌動',True)#分詞,搜尋引擎模式
#seg 是迭代器,可通過list(seg)將其轉換為列表
#關鍵詞提取(import jieba.analyse)(sentence,關鍵詞數目)
import jieba.analyse
seg = jieba.analyse.extract_tags('有關青春萌動',12)
print ' '.join(seg)
#詞性標註
# import jieba.posseg as pseg
words = pseg.cut("我愛北京天安門")
for w in words:
print w.word,w.flag