1. 程式人生 > >利用詞雲圖分析熱詞

利用詞雲圖分析熱詞

1.安裝第三方庫(matplotlib,jieba,wordcloud,numpy)

  1.1安裝方法:pip命令線上安裝(python3.x預設安裝了pip,pip下載地址:https://pypi.python.org/pypi/pip#downloads

    已經配置好環境變數前提下,在cmd視窗直接執行:pip install 包名(應為我已經安裝過了,所以提示已經安裝過了),如 pip install numpy

 

  1.2官網下載對應的whl進行安裝

    在 http://www.lfd.uci.edu/~gohlke/pythonlibs/ 下載所需的庫的.whl檔案,注意如果安裝Python3.6,應下載對應的cp36的.whl檔案,執行pip install **.whl

2. 匯入對應的庫

import matplotlib
import matplotlib.pyplot as plt #資料視覺化
import jieba #詞語切割
import wordcloud #分詞
from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS #詞雲,顏色生成器,停止
import numpy as np #科學計算
from PIL import Image #處理圖片

3.主要實現程式碼

def ciyun():
    #開啟文字
    textfile = open('1.txt').read() #讀取文字內容
    wordlist = jieba.cut_for_search(textfile)#切割詞語
    space_list = ' '.join(wordlist) # 連結詞語
    backgroud = np.array(Image.open('2.jpg')) #背景圖片,只有黑白圖才能按照形狀生成詞雲
    mywordcloud = WordCloud(width=1400, height=1200,
                            background_color= 'white',#背景顏色
                            mask=backgroud, #寫字用的背景圖,從圖片中提取顏色
                            max_words=500, #最大詞語數
                            stopwords=STOPWORDS,#停止的預設詞語
                            font_path='simkai.ttf',#原始碼自帶字型
                            max_font_size=100,#最大字型尺寸
                            random_state=50,#隨機角度
                            scale=1).generate(space_list) #生成詞雲
    image_color = ImageColorGenerator(backgroud)#生成詞雲的顏色
    plt.imshow(mywordcloud) #顯示詞雲
    plt.axis('off') #關閉座標(x,y軸)
    #plt.savefig('4.png') #儲存圖片
    plt.show()#顯示

def main():
    ciyun()

if __name__ == '__main__':
    main()

4.效果如下: