1. 程式人生 > >python之jieba

python之jieba

中文分詞

呼叫jieba的cut對中文字串進行分詞即可,返回一個生成器

In [1]: import jieba

In [2]: strings='直方圖是用面積表示各組頻數的多少,矩形的高度表示每一組的頻數或
   ...: 頻率,寬度則表示各組的組距,其高度與寬度均有意義'

In [3]: data=jieba.cut(strings)

In [4]: type(data)
Out[4]: generator

In [5]: list(data)
Building prefix dict from the default dictionary ...
Loading model from cache /tmp/jieba.cache
Loading model cost 1.077 seconds.
Prefix dict has been built succesfully.
Out[5]: 
['直方圖',
 '是',
 '用',
 '面積',
 '表示',
 '各組',
 '頻數',
 '的',
 '多少',
 ',',
 '矩形',
 '的',
 '高度',
 '表示',
 '每',
 '一組',
 '的',
 '頻數',
 '或',
 '頻率',
 ',',
 '寬度',
 '則',
 '表示',
 '各組',
 '的',
 '組距',
 ',',
 '其',
 '高度',
 '與',
 '寬度',
 '均',
 '有',
 '意義']

In [6]: