利用python製作漂亮的詞雲圖
阿新 • • 發佈:2018-12-22
- 隨便找個地方新建一個目錄,比如我在F盤下面新建一個word_cloud資料夾(名字都是隨便取),並且開啟這個資料夾.
- 把剛剛下載的msyh.ttc複製到這裡.
- 新建一個my_word_cloud.py在這裡.
然後可以在my_word_cloud.py寫程式碼了,首先匯入相關的包
##對於NLP(自然語言處理)來說,分詞是一步重要的工作,這裡使用jieba分詞 ##對你輸入的文章進行分詞然後統計等等操作 import jieba ##匯入用於用於製作詞雲圖的wordcloud from wordcloud import WordCloud,ImageColorGenerator from matplotlib import pyplot as plt from PIL import Image import numpy as np
收集文字資訊
比如,我現在隨便找一篇文章,裡面包含大量文字
為什麼《鋼之鍊金術師FA》被稱為神作?
想要兩者兼得非常難,要說明它的難度,得舉個沒做到又有分量的作品為例子:老賊的《獵人》《鋼煉》是一部涵蓋面很廣的作品,其中想要探討的,有人性、戰爭、宗教、哲學、科學,但受限於【少年漫】這一題材,探索的面雖然廣卻基本不深入。真正讓《鋼煉》顯得極為成熟的,是“態度“…………..然後,把這些文字複製並且儲存為info.txt,就儲存在word_cloud資料夾裡面
繼續編輯程式碼
##開啟剛剛的info.txt,並且把得到的控制代碼內容複製給content with open('info.txt','r',encoding="UTF-8") as file1: content = "".join(file1.readlines()) ##然後使用jieba模組進行對文字分詞整理 content_after = "".join(jieba.cut(content,cut_all=True)) ##font_path ##使用worldCloud模組對剛剛整理好的分詞資訊進行處理. ##max_font_size引數是可以調整部分當個詞語最大尺寸 ##max_words是最大可以允許多少個詞去組成這個詞雲圖 ##height高度,width寬度, ##background_color背景顏色 wc = WordCloud(font_path="msyh.ttc",background_color="black",max_words=1000,max_font_size=100, width=1500,height=1500).generate(content) ##使用matplotlib的pyplot來進行最後的渲染出圖. plt.imshow(wc) ##目標檔案另存為這個名錄下 wc.to_file('wolfcodeTarget.png')