利用詞雲圖分析熱詞
阿新 • • 發佈:2018-11-25
1.安裝第三方庫(matplotlib,jieba,wordcloud,numpy)
1.1安裝方法:pip命令線上安裝(python3.x預設安裝了pip,pip下載地址:https://pypi.python.org/pypi/pip#downloads)
已經配置好環境變數前提下,在cmd視窗直接執行:pip install 包名(應為我已經安裝過了,所以提示已經安裝過了),如 pip install numpy
1.2官網下載對應的whl進行安裝
在 http://www.lfd.uci.edu/~gohlke/pythonlibs/ 下載所需的庫的.whl檔案,注意如果安裝Python3.6,應下載對應的cp36的.whl檔案,執行pip install **.whl
2. 匯入對應的庫
import matplotlib import matplotlib.pyplot as plt #資料視覺化 import jieba #詞語切割 import wordcloud #分詞 from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS #詞雲,顏色生成器,停止 import numpy as np #科學計算 from PIL import Image #處理圖片
3.主要實現程式碼
def ciyun(): #開啟文字 textfile = open('1.txt').read() #讀取文字內容 wordlist = jieba.cut_for_search(textfile)#切割詞語 space_list = ' '.join(wordlist) # 連結詞語 backgroud = np.array(Image.open('2.jpg')) #背景圖片,只有黑白圖才能按照形狀生成詞雲 mywordcloud = WordCloud(width=1400, height=1200, background_color= 'white',#背景顏色 mask=backgroud, #寫字用的背景圖,從圖片中提取顏色 max_words=500, #最大詞語數 stopwords=STOPWORDS,#停止的預設詞語 font_path='simkai.ttf',#原始碼自帶字型 max_font_size=100,#最大字型尺寸 random_state=50,#隨機角度 scale=1).generate(space_list) #生成詞雲 image_color = ImageColorGenerator(backgroud)#生成詞雲的顏色 plt.imshow(mywordcloud) #顯示詞雲 plt.axis('off') #關閉座標(x,y軸) #plt.savefig('4.png') #儲存圖片 plt.show()#顯示 def main(): ciyun() if __name__ == '__main__': main()
4.效果如下: