自主學習：02詞雲圖製作

阿新 • • 發佈：2022-01-14

詞雲圖製作

之前爬了網易雲歌曲成都的評論，就想著做一個詞雲圖，搞一下。

下載相關庫

1、jieba庫

jieba庫是一箇中文分詞庫。

在pycharm的setting中，找到project interpreter，加號，manager repositories，更改下下載路徑。原路徑下載太慢了，最後就下載不下來了。

可以在Manage Repositories中新增映象

下面的都可以用：

阿里雲
http://mirrors.aliyun.com/pypi/simple

豆瓣(douban)
http://pypi.douban.com/simple

清華大學
https://pypi.tuna.tsinghua.edu.cn/simple

中國科學技術大學
http://pypi.mirrors.ustc.edu.cn/simple

改好後回到這個頁面，記得一定重新整理一下（description旁邊的那個重新整理），或者重新開啟一下setting，就可以啦！

2、wordcloud庫

wordcloud是詞雲圖庫。

在pycharm中下載wordcloud包，用各種映象都下不了，搞了一晚上。

所有，可以試試以下方法：

①在python路徑下可以先下載好wordcloud。

下載連結：https://www.lfd.uci.edu/~gohlke/pythonlibs/

在網頁的很下面很下面，下載對應自己python版本的wordcloud，我下載的是wordcloud-1.8.1-cp39-cp39-win_amd64.whl

②放在python\Scripts資料夾下面，用cmd開啟這個資料夾，執行安裝：

pip install wordcloud-1.8.1-cp39-cp39-win_amd64.whl

③然後在python路徑下的Lib/site-packages資料夾下，找到這兩個資料夾。

把這兩個資料夾複製放到pycharm中現在正在執行的檔案路徑裡，就好啦！！！

親測有效！

3、imageio包和停用詞

imageio是個影象模組，可以用作詞雲圖匯入影象，直接在pycharm中下載就好。

cn_stopwords.txt是停用詞文件，裡面有一些對我們分類沒有用的詞，譬如一、一個之類的，在百度搜索就能下載。

完整程式碼

# 匯入中文分詞庫
import jieba
# 詞雲圖庫
import wordcloud
# 影象模組
import imageio


file = open('chengdu01.txt', mode='r', encoding='utf-8')
txt = file.read()
# print(txt)
txt_list = jieba.lcut(txt)
# print('分詞結果',txt_list)

string = ''.join(txt_list)
# print('合併分詞',string)

# 製作詞雲圖

# 讀取影象
img = imageio.imread('鳥.png')
# 設定詞雲圖
wc = wordcloud.WordCloud(
    width=1000,   # 詞雲圖的寬
    height=7000,  # 詞雲圖的高
    background_color='white',  # 詞雲圖背景顏色
    font_path='msyh.ttc',  # 詞雲字型,微軟雅黑，win系統自帶
    scale=10,  # 字型大小
    mask=img,
    stopwords=set([line.strip() for line in open('cn_stopwords.txt', mode='r', encoding='utf-8').readline()])
)

print('正在繪製詞雲圖。。。。')
wc.generate(string)
wc.to_file('output.png')
print('詞雲圖製作成功！！！')

輸出結果

我用的是網易雲音樂成都，下面的評論。

最後生成的詞雲圖是這樣的：

最後的思考

其實程式碼很少，還很難理解，難的是，要去下載很多的庫，下都下不下來嗚嗚嗚搞了一晚上。

完成，去搞吃的。

自主學習：02詞雲圖製作

詞雲圖製作之前爬了網易雲歌曲成都的評論，就想著做一個詞雲圖，搞一下。

新聞分類（包含：畫詞雲圖、停用詞使用等）

import pandas as pd data = pd.read_table(\'val.txt\',names=[\'category\',\'theme\',\'URL\',\'content\'])

詞雲圖製作

【寫在前面】先放效果圖在學習Python的過程中，發現製作一個詞雲圖看以來既有趣又實用，故作此部落格來記錄一下製作詞雲圖的過程。希望以後做PPT的時候能用上（狗頭

Python基於WordCloud製作詞雲圖

這篇文章主要介紹了python基於WordCloud製作詞雲圖,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python製作詞雲圖程式碼例項

詞雲圖是將詞彙按照頻率的高低顯示不同大小而形成的圖，可以一目瞭然地看出關鍵詞。下面是詞雲圖的python程式碼～

核心模組學習記錄02：核心對模組的重定位

模組的重定向本系列主要保留本人在學習核心模組（2.6.24）部分的一些文字材料，涉及的內容主要包括：

Linux文字處理三劍客之awk學習筆記02：命令列和語法結構

命令列和語法結構 awk [ options ] [ -- ] program-text file ... options即選項；program-text即awk程式碼；file ...即待處理的讀入資料，可以是檔案也可以是標準輸入，只要是資料來源即可。

Python 獲取好友資訊並將結果視覺化，製作詞雲圖

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

花幾天時間肝了一個線上製作詞雲圖網站

大家好，我是辰哥~ 背景：看過辰哥往前文章的都知道，在視覺化方面經常繪製詞雲圖、折線圖、柱狀圖等。所以為了方便繪製這些圖表，辰哥就把這些視覺化圖的繪製做成可操作的過程。

遊戲開發程式設計基礎（自主學習2）第二章：打字母小遊戲

遊戲開發程式設計基礎【中國傳媒大學】第二章：打字母小遊戲第一節：流程圖如下

Java基礎學習：方法02（Java都是值傳遞）

方法的定義： Java的方法類似於其他語言的函式，是一段用來完成特定功能的程式碼片段；

Java基礎學習：陣列02

Java基礎學習：陣列02 陣列的宣告和建立：首先必須宣告陣列變數，才能在程式中使用陣列，下面是宣告陣列變數的語法：

Java基礎學習：面向物件02（重點看：引用傳遞）

Java基礎學習：面向物件02 回顧方法的定義：方法的定義：修飾符返回型別方法名：注意規範，見名之意

【Mybatis】學習筆記02：實現簡單的查

Mybatis02：簡單的查如果你沒先去學增刪改，然後直接看這篇記錄，我想會有些困難。因為該文寫的很粗劣，只是簡單的截圖。所以沒基礎的建議先去看

Maven學習：【使用IDEA搭建SSM聚合工程】

1.Maven聚合工程介紹 1.Maven聚合的特點： 1、經過一定的配置之後，每一次執行Maven命令都同時對子模組生效，大大減少重複的工作。

資料結構與演演算法學習：陣列和連結串列

陣列陣列是一個線性表資料結構。它用一段連續的記憶體地址空間，來儲存一些相同型別的資料。

python根據文字生成詞雲圖程式碼例項

這篇文章主要介紹了python根據文字生成詞雲圖程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python資料視覺化處理庫PyEcharts柱狀圖,餅圖,線性圖,詞雲圖常用例項詳解

python可以在處理各種資料時，如果可以將這些資料，利用圖表將其視覺化，這樣在分析處理起來，將更加直觀、清晰，以下是利用 PyEcharts 常用圖表的視覺化Demo,開發環境 python3

學習：MySQL---》索引及其優化

1.索引：把新增索引的欄位全部放在一棵B+樹上，再次查詢的時候就會更加快速；

Python實現Wordcloud生成詞雲圖的示例

wordcloud是Python擴充套件庫中一種將詞語用圖片表達出來的一種形式，通過詞雲生成的圖片，我們可以更加直觀的看出某篇文章的故事梗概。