1. 程式人生 > >利用python製作漂亮的詞雲圖

利用python製作漂亮的詞雲圖

  • 隨便找個地方新建一個目錄,比如我在F盤下面新建一個word_cloud資料夾(名字都是隨便取),並且開啟這個資料夾.
  • 把剛剛下載的msyh.ttc複製到這裡.
  • 新建一個my_word_cloud.py在這裡.
  • 然後可以在my_word_cloud.py寫程式碼了,首先匯入相關的包

    ##對於NLP(自然語言處理)來說,分詞是一步重要的工作,這裡使用jieba分詞
    ##對你輸入的文章進行分詞然後統計等等操作
    import jieba
    ##匯入用於用於製作詞雲圖的wordcloud
    from wordcloud import WordCloud,ImageColorGenerator
    from matplotlib import pyplot as plt
    from PIL import Image
    import numpy as np
    
  • 收集文字資訊

    • 比如,我現在隨便找一篇文章,裡面包含大量文字

      為什麼《鋼之鍊金術師FA》被稱為神作?
      想要兩者兼得非常難,要說明它的難度,得舉個沒做到又有分量的作品為例子:老賊的《獵人》《鋼煉》是一部涵蓋面很廣的作品,其中想要探討的,有人性、戰爭、宗教、哲學、科學,但受限於【少年漫】這一題材,探索的面雖然廣卻基本不深入。真正讓《鋼煉》顯得極為成熟的,是“態度“…………..

    • 然後,把這些文字複製並且儲存為info.txt,就儲存在word_cloud資料夾裡面

  • 繼續編輯程式碼

    ##開啟剛剛的info.txt,並且把得到的控制代碼內容複製給content
    with open('info.txt','r',encoding="UTF-8") as file1:
      content = "".join(file1.readlines())
    ##然後使用jieba模組進行對文字分詞整理
    content_after = "".join(jieba.cut(content,cut_all=True))
    
    ##font_path
    ##使用worldCloud模組對剛剛整理好的分詞資訊進行處理.
    ##max_font_size引數是可以調整部分當個詞語最大尺寸
    ##max_words是最大可以允許多少個詞去組成這個詞雲圖
    ##height高度,width寬度,
    ##background_color背景顏色
    wc = WordCloud(font_path="msyh.ttc",background_color="black",max_words=1000,max_font_size=100,
                  width=1500,height=1500).generate(content)
    ##使用matplotlib的pyplot來進行最後的渲染出圖.
    plt.imshow(wc)
    ##目標檔案另存為這個名錄下
    wc.to_file('wolfcodeTarget.png')