python-wordcloud詞雲庫

阿新 • • 發佈：2021-12-16

一、詞雲介紹

詞雲又叫文字雲，是對文字資料中出現頻率較高的”關鍵詞“在視覺上的突出呈現，形成關鍵詞的渲染形成類似雲一樣的彩色圖片，從而一眼就可以領略文字資料的主要表達意思。
wordcloud 是優秀的詞雲展示第三方庫，以詞語為基本單位，通過圖形視覺化的方式，更加直觀和藝術的展現文字

二、庫安裝

開啟cmd
輸入 pip install wordcloud
輸入 pip install imageio
輸入 pip install jieba

若是提示報錯，有可能是pip工具版本過低，需要更新pip包管理工具
只需要輸入 pip -m pip install --upgrade pip 即可

三、wordcloud 方法引數

wordcloud.WordCloud 物件

wordcloud.WordCloud(font_path=None, width=400, height=200, margin=2, ranks_only=None, prefer_horizontal=0.9,mask=None, scale=1, color_func=None, max_words=200, min_font_size=4, stopwords=None, random_state=None,background_color='black', max_font_size=None, font_step=1, mode='RGB', relative_scaling=0.5, regexp=None, collocations=True,colormap=None, normalize_plurals=True)

引數說明

font_path:string

字型路徑，需要展現什麼字型就把該字型的路徑+字尾名寫上，如：font_path = "黑體.ttf"

width:int(default = 400)

輸出畫布的寬度，預設為400畫素

height:int(default = 200)

輸出畫布的高度，預設為200畫素

prefer_horizontal:float(default = 0.90)

詞語水平方向排版出現的頻率，預設0.9，所以詞語垂直方向排版出現的頻率為0.1

mask:nd-array or None (default = None)

如果引數為空，則使用二維遮罩繪製詞雲。如果mask非空，設定的寬高值將被忽略，遮罩形狀被mask取代。除全白（#FFFFFF）的部分將不會繪製，其餘部分會用於繪製詞雲。如：bg_pic = imread('讀取一張圖片.png')，背景圖片的畫布一定要設定為白色（#FFFFFF），然後顯示的形狀為不是白色的其他顏色。可以用ps工具將自己要顯示的形狀複製到一個純白色的畫布上再儲存

scale:float(default = 1)

按照比例進行放大畫布，如設定為1.5，則長和高都是原來畫布的1.5倍

min_font_size:int(default = 4)

顯示的最小的字型大小

font_step:int(default = 1)

字型步長，如果步長大於1，會加快運算但是可能會導致結果出現較大的誤差

max_words:number(default = 200)

要顯示的詞的最大個數

stopwords:set of strings or None

設定需要遮蔽的詞，如果為空，則使用內建的 STOPWORDS

background_color:color value(default = "black")

背景顏色，如：background_color = 'white'

max_font_size:int or None(default = None)

顯示的最大的字型大小

mode:string(default = "RGB")

當引數為'RGB' 並且background_color不為空時，背景為透明

relative_scaling:float(default = 0.5)

詞頻和字型大小的關聯性

color_func:callable(default = None)

生成新顏色的函式，如果為空，則使用 self.color_func

regexp:string or None (optional)

使用正則表示式分隔輸入的文字

collocations:bool(default = True)

是否包括兩個詞的搭配

colormap:string or matplotlib colormap(default = "ciridis")

給每個單詞隨機分配顏色，若指定color_func，則忽略該方法

函式

fit_words(frequencies)

根據詞頻生成詞雲

generate(text)

根據文字生成詞雲

generate_from_text(text)

根據文字生成詞雲

process_text(text)

將長文字分詞並去除遮蔽詞(此處指的是英文，中文分詞需要用其他庫來實現)

recolor([random_state,color_func,colormap])

對現有輸出重新著色。重新著色會比重新生成整個詞雲快很多

to_array()

轉化為 numpy array

to_file(filename)

輸出到檔案

四、示例

案例一

import wordcloud

w = wordcloud.WordCloud()
w.generate("python c++ javascript java c  c#")
w.to_file("a.png")

案例二

import wordcloud

txt = '''A good book may be among the best of friends. It is the same today that it always was, and it will never change. It is the most patient and cheerful of companions. It does not turn its back upon us in times of adversity or distress. It always receives us with the same kindness; amusing and instructing us in youth, and comforting and consoling us in age.'''
# 將預設黑色背景換成白色並且遮蔽單詞'sn'
w = wordcloud.WordCloud(background_color = "white",stopwords={"sn"})
w.generate(txt)
w.to_file("詞雲.png")

案例三
下面示例一箇中文，使用的分詞庫是jieba庫

import jieba
import wordcloud

text = '''計算機網路學習的核心內容就是網路協議的學習。網路協議是為計算機網路中進行
資料交換而建立的規則、標準或者說是約定的集合。因為不同使用者的資料終端可能採取的字
符集是不同的，兩者需要進行通訊，必須要在一定的標準上進行。一個很形象地比喻就是我
們的語言，我們大天朝地廣人多，地方性語言也非常豐富，而且方言之間差距巨大。A地區的
方言可能B地區的人根本無法接受，所以我們要為全國人名進行溝通建立一個語言標準，這就
是我們的普通話的作用。同樣，放眼全球，我們與外國友人溝通的標準語言是英語，所以我
們才要苦逼的學習英語'''

# 使用jieba來對文章進行分詞
txt = " ".join(jieba.cut(text))
# font_path 字型路徑
w = wordcloud.WordCloud(background_color="white", font_path = "msyh.ttc")
w.generate(txt)
w.to_file("中文詞雲.png")

案例四
接下來的案例可能需要一些txt文字和圖片，可以點選這裡下載
使用周杰倫 Mojito 歌詞，生成詞雲

import jieba
import wordcloud

# 開啟txt檔案
f = open("Mojito.txt", "r", encoding="utf-8")
t = f.read()
f.close()

txt = " ".join(jieba.lcut(t))

w = wordcloud.WordCloud( \
    background_color = "white",
    font_path = "msyh.ttc"    
    )
w.generate(txt)
w.to_file("Mojito.png")

案例五
周杰倫歷年歌詞比較，生成詞雲

import jieba
import wordcloud
f1 = open("Jay11月的蕭邦.txt", "r", encoding="utf-8")
f2 = open("Jay2016-2020單曲歌詞.txt", "r", encoding="utf-8")

t1 = f1.read()
t2 = f2.read()
f1.close()
f2.close()

txt1 = " ".join(jieba.lcut(t1))
w1 = wordcloud.WordCloud( \
    background_color = "white",
    font_path = "msyh.ttc"    
    )
w1.generate(txt1)
w1.to_file("Jay1.png")

txt2 = " ".join(jieba.lcut(t2))
w2 = wordcloud.WordCloud( \
    background_color = "white",
    font_path = "msyh.ttc"    
    )
w2.generate(txt2)
w2.to_file("Jay2.png")

案例六
Jay2016-2020單曲歌詞不規則圖形詞雲

import jieba
import wordcloud
from imageio import imread

mask = imread("smile.jpg")
f = open("Jay2016-2020單曲歌詞.txt", "r", encoding="utf-8")
t = f.read()
f.close()

txt = " ".join(jieba.lcut(t))
w = wordcloud.WordCloud(\
    background_color = "white",\
    font_path = "msyh.ttc", mask = mask,\
    )
w.generate(txt)
w.to_file("jaysmile.png")

python-wordcloud詞雲庫

一、詞雲介紹詞雲又叫文字雲，是對文字資料中出現頻率較高的”關鍵詞“在視覺上的突出呈現，形成關鍵詞的渲染形成類似雲一樣的彩色圖片，從而一眼就可以領略文字資料的主要表達意思。

python詞雲庫wordcloud的使用方法與例項詳解

wordcloud是優秀的詞雲展示第三方庫一、基本使用 import jieba import wordcloud txt = open(\"1.txt\",\"r\",encoding=\'utf-8\').read()

python詞雲庫wordCloud使用方法詳解(解決中文亂碼)

文章中的例子主要借鑑wordColud的examples，在文章對examples中的例子做了一些改動。

Python資料視覺化：詞雲庫的講解和如何製作詞雲

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python生成詞雲的實現程式碼

1 概述利用Python生成簡單的詞雲,需要的工具是cython,wordcloud與anaconda. 2 準備工作

python生成詞雲（可更換背景圖）

原始碼如下： import jieba import matplotlib.pyplot as plt from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator

使用Python寫詞雲資料視覺化

詞雲的應用場景會議記錄海報製作 PPT製作生日表白資料探勘情感分析使用者畫像

Python基於jieba, wordcloud庫生成中文詞雲

程式碼如下 import wordcloud import jieba font = r\'C:\\Windows\\Fonts\\simfang.ttf\' w = wordcloud.WordCloud(height = 700,width = 1000,font_path=font,\\

python中使用wordcloud庫生成詞雲

需要安裝的第三方庫： pip install -i https://pypi.douban.com/simple wordcloud pip install -i https://pypi.douban.com/simple jieba

基於Python詞雲分析政府工作報告關鍵詞

前言十三屆全國人大三次會議作了政府工作報告。這份政府工作報告僅有10500字左右，據悉是改革開放40年以來最短的一次。受到疫情影響，今年的兩會會議適當縮短，政府工作報告也大幅壓縮，體現了“實幹為要”的理念。

詞雲wordcloud的實現

什麼是雲詞快速實現分詞視覺化實現原理TOC 什麼是雲詞詞雲，也稱為文字雲或標籤雲。在詞雲圖片製作中，一般我們規定特定文字詞在文字資料來源中出現的次數越多，說明該詞越重要，其在詞雲中所佔區域也就越大。

<Python> python從入門到實踐（實踐篇）（1） --詞雲製作

實現詞雲製作需要用到wordcloud庫 wordcloud庫的使用 wordcloud是優秀的詞雲展示第三方庫

詞雲 wordcloud

import jieba# 分詞 import numpy as np# 矩陣運算 import pymysql from PIL import Image# 圖片處理

Python爬蟲之js加密破解，抓取網易雲音樂評論生成詞雲

js破解歷程前言技能點介面概況靜態網頁動態網頁頁面解析 step1：找引數step2：分析js函式step3：分析引數step4：校驗step5：轉為python程式碼

python讀取excel製作柱狀圖和詞雲圖片

問題描述需要將excel中的一列內容轉換成柱狀圖和詞雲，所以用到了matplotlib/xlrd/wordcloud三個庫來解決問題

python爬蟲-爬蟲電影八佰詞雲

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

python分析：爬取《靈籠》這部國產動漫彈幕，分析詞雲！看看網友究竟在說啥？

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

python scrapy 豆瓣爬蟲及詞雲

沒事弄著玩的，爬取的是電影《流浪貓鮑勃》的電影評價，說是有1W多評價，實際只有500條左右，估計是引用的也算進去了用的是python scrapy框架，安裝部分就省略了import timeimport scrapyfrom scrapy.selector impor

Python wordcloud庫安裝方法總結

碰到有關於“詞雲”的概念，那就一定要用到本章教學庫——wordcloud，這是第三方的庫，主要是用於詞雲的展示，基本的單位也是以詞云為主，利用它的功能，我們可以實現過濾文字資訊，這樣，就可以直觀的觀察到我們所需

中/英詞雲製作（Python）

技術標籤：實踐python 中/英詞雲製作-Python Author： zhww Update time：2021.02.07 Description: 中英文詞雲製作主要步驟、個人理解與可執行程式。

python-wordcloud詞雲庫

一、詞雲介紹

二、庫安裝

三、wordcloud 方法引數

wordcloud.WordCloud 物件

引數說明

函式

四、示例

相關推薦