python之jieba
阿新 • • 發佈:2018-11-19
中文分詞
呼叫jieba的cut對中文字串進行分詞即可,返回一個生成器
In [1]: import jieba In [2]: strings='直方圖是用面積表示各組頻數的多少,矩形的高度表示每一組的頻數或 ...: 頻率,寬度則表示各組的組距,其高度與寬度均有意義' In [3]: data=jieba.cut(strings) In [4]: type(data) Out[4]: generator In [5]: list(data) Building prefix dict from the default dictionary ... Loading model from cache /tmp/jieba.cache Loading model cost 1.077 seconds. Prefix dict has been built succesfully. Out[5]: ['直方圖', '是', '用', '面積', '表示', '各組', '頻數', '的', '多少', ',', '矩形', '的', '高度', '表示', '每', '一組', '的', '頻數', '或', '頻率', ',', '寬度', '則', '表示', '各組', '的', '組距', ',', '其', '高度', '與', '寬度', '均', '有', '意義'] In [6]: