Python生成詞雲的實現程式碼
阿新 • • 發佈:2020-01-15
1 概述
利用Python生成簡單的詞雲,需要的工具是cython,wordcloud與anaconda.
2 準備工作
包括安裝cython,wordcloud與anaconda.
2.1 安裝anaconda
下載官網
選擇對應的版本下載即可.
2.2 安裝cython
cython是為了安裝wordcloud準備的.
pip -m pip install --upgrade cython
2.3 安裝wordcloud
安裝wordcloud前需要先安裝Microsoft Visuall C++ 14.0.
這裡下載
安裝好了以後重啟,輸入
python -m easy_install wordcloud
3 使用
3.1 開啟Jupyter
開啟Jupyter Notebook.
然後會在瀏覽器開啟這個頁面,新建一個notebook.
先把需要的庫匯入:
from wordcloud import WordCloud import matplotlib.pyplot as plt
3.2 建立文字型檔
簡單的文字型檔可以直接選擇一個txt檔案,複雜的話可以選擇建立一個excel,匯出為csv檔案,然後利用pandas庫的read_csv()讀入檔案.這裡建立一個txt,空格分隔單詞即可.
然後上傳到Jupyter中:
3.3 生成詞雲
首先讀入檔案:
text = open('1.txt').read()
然後使用WordCloud().generate(text),在裡面設定各種屬性.
wc=WordCloud( width=800,repeat=True,height=800).generate(text)
這裡設定了高度與寬度,允許重複.
plt.imshow(wc,interpolation="bilinear") plt.axis("off") plt.show()
顯示詞雲,
interpolation='bilinear'
會使顯示平滑更加平滑,axis("off")表示不顯示座標軸.
下面是效果:
3.4 注意事項
如果含有漢字,首先在讀取時設定編碼:
text = open('1.txt',encoding='utf-8')
然後再生成詞雲時設定字型:
wc = WordCloud(font_path=r'C:\Windows\Fonts\simfang.ttf')
測試:
text=open('1.txt',encoding='utf-8').read() wc=WordCloud( width=1300,font_path=r'C:\Windows\Fonts\simfang.ttf',height=1300).generate(text) plt.imshow(wc,interpolation="bilinear") plt.axis("off") plt.savefig('aaaa.jpg')
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。