python實現詞雲圖

阿新 • • 發佈：2020-12-05

引言

最近再參加網頁設計大賽，任務量都在網頁設計和網頁修改，以至於落了好多天學習大資料的知識。今天比賽結束，正好寫一篇網頁大賽用到的技術

正文

我們做的是一個豆瓣top250資料分析的一個網頁，其中有一項技術是用到了詞雲，今天正好把這項技術說說。

具體怎麼做的呢，首先我們先爬取了豆瓣top250 220條關於某個電影的短評，然後將短評存到資料庫，讀取資料庫，將關於該部電影的短評組成一句話，進行jieba分詞，然後再過濾掉停用詞，製作詞雲圖，最後儲存詞雲圖.

步驟

1、導包

## 包的作用
import jieba  #分詞
from wordcloud import WordCloud  #詞雲
from PIL import Image   #圖片處理
import numpy as np  #將圖片變成陣列
import collections  #計數器
from matplotlib import pyplot as plt  #繪圖
import sqlite3  #資料庫

2、讀取資料,並返回資料

def get_data(db_name,sql):
    #連線資料庫
    conn = sqlite3.connect(db_name)
    #獲取遊標
    cursor = conn.cursor()
    #執行sql語句
    data = cursor.execute(sql)
    text = ""
    #拼接資訊
    for item in data:
        text += item[0]+" "
    cursor.close()
    #關閉資料庫
    conn.close()
    return text

3、進行分詞，並返回字典。(name:對應的單詞,value:單詞出現的個數)

def cut_word(text):
    #分詞：cut_all=False：精確模式 HMM=True：使用隱式馬爾科夫
    cut = jieba.cut(text,cut_all=False,HMM=True)
    object_list = []
    #讀取停用詞
    with open("stop_word.txt", 'r', encoding='UTF-8') as meaninglessFile:
        stopwords = set(meaninglessFile.read().split('\n'))
    stopwords.add(' ')
    #如果單詞不在停用詞裡，則新增
    for word in cut:
        if word not in stopwords:
            object_list.append(word)
    #collections.Counter 計數器，統計單詞個數
    word_counts = collections.Counter(object_list)
    print(word_counts)
    return word_counts

4、生成詞雲圖並儲存

def get_cloud(word_counts,i):
    #遮罩圖:必須是白底的
    img = Image.open(r'./img/tree.jpg')
    img_array = np.array(img)  #將圖片變為陣列
    wc = WordCloud(
        background_color = 'white', # 背景顏色
        mask = img_array,  #遮罩圖片
        font_path = 'msyh.ttc'  #字型樣式

    )
    wc.generate_from_frequencies(word_counts)  #生成詞雲圖
    fig = plt.figure(1)
    plt.imshow(wc)  # 顯示詞雲
    plt.axis('off') # 關閉儲存
    #plt.show()
    #調整邊框
    plt.subplots_adjust(top=0.99, bottom=0.01, right=0.99, left=0.01, hspace=0, wspace=0)
    #儲存圖片
    plt.savefig(r'./movie_img/movie{0}.jpg'.format(i),dpi = 500)

5、總的程式碼

#-*- codeing = utf-8 -*-
#@Time : 2020/11/14 22:16
#@Author : 楊曉
#@File : testCloud.py
#@Software: PyCharm
## 包的作用
import jieba  #分詞
from wordcloud import WordCloud  #詞雲
from PIL import Image   #圖片處理
import numpy as np  #將圖片變成陣列
import collections  #計數器
from matplotlib import pyplot as plt  #繪圖
import sqlite3  #資料庫
# 獲取短評資訊
def get_data(db_name,sql):
    #連線資料庫
    conn = sqlite3.connect(db_name)
    #獲取遊標
    cursor = conn.cursor()
    #執行sql語句
    data = cursor.execute(sql)
    text = ""
    for item in data:
        text += item[0]+" "
    cursor.close()
    #關閉資料庫
    conn.close()
    return text

def cut_word(text):
    #分詞：cut_all=False：精確模式 HMM=True：使用隱式馬爾科夫
    cut = jieba.cut(text,cut_all=False,HMM=True)
    object_list = []
    #讀取停用詞
    with open("stop_word.txt", 'r', encoding='UTF-8') as meaninglessFile:
        stopwords = set(meaninglessFile.read().split('\n'))
    stopwords.add(' ')
    #如果單詞不在停用詞裡，則新增
    for word in cut:
        if word not in stopwords:
            object_list.append(word)
    #collections.Counter 計數器，統計單詞個數
    word_counts = collections.Counter(object_list)
    print(word_counts)
    return word_counts
def get_cloud(word_counts,i):
    #遮罩圖:必須是白底的
    img = Image.open(r'./img/tree.jpg')
    img_array = np.array(img)  #將圖片變為陣列
    wc = WordCloud(
        background_color = 'white', # 背景顏色
        mask = img_array,  #遮罩圖片
        font_path = 'msyh.ttc'  #字型樣式

    )
    wc.generate_from_frequencies(word_counts)  #生成詞雲圖
    fig = plt.figure(1)
    plt.imshow(wc)  # 顯示詞雲
    plt.axis('off') # 關閉儲存
    #plt.show()
    #調整邊框
    plt.subplots_adjust(top=0.99, bottom=0.01, right=0.99, left=0.01, hspace=0, wspace=0)
    #儲存圖片
    plt.savefig(r'./movie_img/movie{0}.jpg'.format(i),dpi = 500)

if __name__ == '__main__':
    for i in range(1,251):
        #編寫查詢語句
        sql = "select info from movie"+str(i)
        text = get_data('duanping',sql)
        word_counts = cut_word(text)
        get_cloud(word_counts,i)

因為要生成250個詞雲圖，所有才有for迴圈。具體要求請讀者按照自己的需求更改main函式程式碼

執行結果:

肖申克的救贖:

王霸別姬

python實現詞雲圖

引言最近再參加網頁設計大賽，任務量都在網頁設計和網頁修改，以至於落了好多天學習大資料的知識。今天比賽結束，正好寫一篇網頁大賽用到的技術

Python簡單實現詞雲圖程式碼及步驟解析

一、安裝 wordcloud pip install wordcloud 二、載入包、設定路徑 import os from wordcloud import WordCloud

python中實現詞雲圖的示例

import matplotlib.pyplot as plt import jieba from wordcloud import wordcloud # 1.讀出詞語 text = open(\'text/test.txt\',\'r\',encoding=\'utf-8\').read()

Python製作詞雲圖程式碼例項

詞雲圖是將詞彙按照頻率的高低顯示不同大小而形成的圖，可以一目瞭然地看出關鍵詞。下面是詞雲圖的python程式碼～

pyecharts實現詞雲圖html和png

目標是使用python程式讀取詞、詞頻生成一個詞雲圖，結果輸出可以選擇html格式，也可以選擇png

Python生成詞雲圖

1.整體簡介詞雲圖，也叫文字雲，是對文字中出現頻率較高的“關鍵詞”予以視覺化的展現，詞雲圖過濾掉大量的低頻低質的文字資訊，使得瀏覽者只要一眼掃過文字就可領略文字的主旨。

vue專案中實現詞雲圖

技術標籤：Vuevue詞雲圖Wordcloud 首先看下效果圖：實現步驟：一、安裝包 npm install vue-b2wordcloud --save

Python生成詞雲圖，TIIDF方法文字挖掘: 詞頻統計，詞雲圖

python中使用wordcloud包生成的詞雲圖。下面來介紹一下wordcloud包的基本用法。 class wordcloud.WordCloud(font_path=None, width=400, height=200, margin=2, ranks_only=None, prefer_horizontal=0.9,mask=None

Python實現Wordcloud生成詞雲圖的示例

wordcloud是Python擴充套件庫中一種將詞語用圖片表達出來的一種形式，通過詞雲生成的圖片，我們可以更加直觀的看出某篇文章的故事梗概。

Python基於wordcloud及jieba實現中國地圖詞雲圖

熱詞圖很酷炫，也非常適合熱點事件，抓住重點，以圖文結合的方式表現出來，很有衝擊力。下面這段程式碼是製作熱詞圖的，用到了以下技術：

Python基於WordCloud製作詞雲圖

這篇文章主要介紹了python基於WordCloud製作詞雲圖,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python根據文字生成詞雲圖程式碼例項

這篇文章主要介紹了python根據文字生成詞雲圖程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python實現的讀取網頁並分詞功能示例

本文例項講述了python實現的讀取網頁並分詞功能。分享給大家供大家參考，具體如下：

Python生成詞雲的實現程式碼

1 概述利用Python生成簡單的詞雲,需要的工具是cython,wordcloud與anaconda. 2 準備工作

Python資料視覺化處理庫PyEcharts柱狀圖,餅圖,線性圖,詞雲圖常用例項詳解

python可以在處理各種資料時，如果可以將這些資料，利用圖表將其視覺化，這樣在分析處理起來，將更加直觀、清晰，以下是利用 PyEcharts 常用圖表的視覺化Demo,開發環境 python3

python實現對變位詞的判斷方法

Python實現對變位詞的判斷，供大家參考，具體內容如下什麼是變位詞呢？即兩個單詞都是由相同的字母組成，而各自的字母順序不同，譬如python和typhon，heart和earth。

基於python實現檢索標記敏感詞並輸出

　一些帶有過度宣傳的詞，在淘寶、京東對商品的宣傳有一定的限制，這些最佳，最大、盜版、水貨等詞語都不能用於產品的宣傳，可以使用程式檢測敏感詞，以下既是具體程式碼。

基於python生成英文版詞雲圖程式碼例項

　使用wordcloud模組，生成雲圖，測試文字為： Betty Botter bought some butter but she said the butter\'s bitter. If I put it in my batter it will make my batter bitter. So,she bought some better butter

Python通過文字和圖片生成詞雲圖

使用現有的txt文字和圖片，就可以用wordcloud包生成詞雲圖。大致步驟是： 1、讀取txt文字並簡單處理；

詞雲圖是怎麼做出來的？Python爬取B站視訊彈幕，並做成詞雲圖

前言今天介紹一個獲取B站資料的Python擴充套件庫-bilibili_api 可以獲取的資料包括：

python實現詞雲圖

引言

最近再參加網頁設計大賽，任務量都在網頁設計和網頁修改，以至於落了好多天學習大資料的知識。今天比賽結束，正好寫一篇網頁大賽用到的技術

正文

我們做的是一個豆瓣top250資料分析的一個網頁，其中有一項技術是用到了詞雲，今天正好把這項技術說說。

具體怎麼做的呢，首先我們先爬取了豆瓣top250 220條關於某個電影的短評，然後將短評存到資料庫，讀取資料庫，將關於該部電影的短評組成一句話，進行jieba分詞，然後再過濾掉停用詞，製作詞雲圖，最後儲存詞雲圖.

步驟

1、導包

2、讀取資料,並返回資料

3、進行分詞，並返回字典。(name:對應的單詞,value:單詞出現的個數)

4、生成詞雲圖並儲存

5、總的程式碼

因為要生成250個詞雲圖，所有才有for迴圈。具體要求請讀者按照自己的需求更改main函式程式碼

執行結果:

肖申克的救贖:

王霸別姬

相關推薦