1. 程式人生 > 程式設計 >Python生成詞雲的實現程式碼

Python生成詞雲的實現程式碼

1 概述

利用Python生成簡單的詞雲,需要的工具是cython,wordcloud與anaconda.

2 準備工作

包括安裝cython,wordcloud與anaconda.

2.1 安裝anaconda

下載官網


選擇對應的版本下載即可.

2.2 安裝cython

cython是為了安裝wordcloud準備的.

pip -m pip install --upgrade cython

2.3 安裝wordcloud

安裝wordcloud前需要先安裝Microsoft Visuall C++ 14.0.
這裡下載
安裝好了以後重啟,輸入

python -m easy_install wordcloud

3 使用

3.1 開啟Jupyter

開啟Jupyter Notebook.


然後會在瀏覽器開啟這個頁面,新建一個notebook.


先把需要的庫匯入:

from wordcloud import WordCloud
import matplotlib.pyplot as plt

3.2 建立文字型檔

簡單的文字型檔可以直接選擇一個txt檔案,複雜的話可以選擇建立一個excel,匯出為csv檔案,然後利用pandas庫的read_csv()讀入檔案.這裡建立一個txt,空格分隔單詞即可.


然後上傳到Jupyter中:

3.3 生成詞雲

首先讀入檔案:

text = open('1.txt').read()

然後使用WordCloud().generate(text),在裡面設定各種屬性.

wc=WordCloud(
  width=800,repeat=True,height=800).generate(text)

這裡設定了高度與寬度,允許重複.

plt.imshow(wc,interpolation="bilinear")
plt.axis("off")
plt.show()

顯示詞雲,

interpolation='bilinear'

會使顯示平滑更加平滑,axis("off")表示不顯示座標軸.
下面是效果:

3.4 注意事項

如果含有漢字,首先在讀取時設定編碼:

text = open('1.txt',encoding='utf-8')

然後再生成詞雲時設定字型:

wc = WordCloud(font_path=r'C:\Windows\Fonts\simfang.ttf')

測試:

text=open('1.txt',encoding='utf-8').read()
wc=WordCloud(
  width=1300,font_path=r'C:\Windows\Fonts\simfang.ttf',height=1300).generate(text)
plt.imshow(wc,interpolation="bilinear")
plt.axis("off")
plt.savefig('aaaa.jpg')


以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。