python資料視覺化初步-詞雲實踐

阿新 • • 發佈：2021-10-09

背景

今天學習了詞語的使用藉機研究了資料視覺化

資料視覺化

在大資料分析工具和軟體中提到的資料視覺化，就是利用運用計算機圖形學、影象、人機互動等技術，將採集或模擬的資料對映為可識別的圖形、影象。

1. 什麼是詞雲

“詞雲”就是對網路文字中出現頻率較高的“關鍵詞”予以視覺上的突出，形成“關鍵詞雲層”或“關鍵詞渲染”，從而過濾掉大量的文字資訊，一眼掃過文字就可以領略文字的主旨。

詞雲”就是資料視覺化的一種形式。給出一段文字的關鍵詞，根據關鍵詞的出現頻率而生成的一幅影象，人們只要掃一眼就能夠明白文章主旨。

2. 詞雲的生成

工具：

matplotlib matplotlib

，python 繪相簿，最終詞雲的繪製需要用到它。
jieba jieba，最開源中文分詞工具。他最主要的兩個功能是分詞和關鍵詞的抽取。在詞雲的生成過程中都需要用到。
wordcloud wordcloud是一個詞雲生成器，只要進行相關的配置就能生成相應的詞雲。

實現過程

實現的過程簡單來講，兩步走，1. 提取關鍵詞，2. 生成詞雲。

Demo ：解析愛在遙遠的星空下

在電腦中發現一個text文件《愛在遙遠的星空下》[作者]雪透 TXT下載
嘗試做了解析

原圖

碼雲

分詞沒有特別設的所以出現最多的是男女主名字

程式示例

from wordcloud import WordCloud  
import jieba  
import PIL  
import matplotlib.pyplot as plt  
import numpy as np  
  
  
def wordcloudplot(txt):  
    font = r'cn.ttf'
    demo_mask = np.array(PIL.Image.open('test2.png'))
    wordcloud = WordCloud(font_path=font,  
                          background_color="white",  
                          margin=5, width=1800, height=800, mask=demo_mask, max_words=2000, max_font_size=60,  
                          random_state=42)  
    wordcloud = wordcloud.generate(txt)  
    wordcloud.to_file('t2.jpg')
    plt.imshow(wordcloud)  
    plt.axis("off")  
    plt.show()  
  
  
def main():  
    a = []  
    f = open(r'book.txt', 'r',encoding='utf-8').read()
    words = list(jieba.cut(f))  
    for word in words:  
        if len(word) > 1:  
            a.append(word)  
    txt = r' '.join(a)  
    wordcloudplot(txt)  
  
  
if __name__ == '__main__':  
    main()

結論

這是一個簡單的資料視覺化分詞決定了統計結果

python資料視覺化初步-詞雲實踐

背景今天學習了詞語的使用藉機研究了資料視覺化資料視覺化在大資料分析工具和軟體中提到的資料視覺化，就是利用運用計算機圖形學、影象、人機互動等技術，將採集或模擬的資料對映為可識別的圖形、影象。

Python資料視覺化：詞雲庫的講解和如何製作詞雲

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python資料視覺化處理庫PyEcharts柱狀圖,餅圖,線性圖,詞雲圖常用例項詳解

python可以在處理各種資料時，如果可以將這些資料，利用圖表將其視覺化，這樣在分析處理起來，將更加直觀、清晰，以下是利用 PyEcharts 常用圖表的視覺化Demo,開發環境 python3

Python之pyecharts資料視覺化，詞雲圖，儀表盤！

一、詞雲圖詞雲就是通過形成關鍵詞雲層或關鍵詞渲染，過濾掉大量的文字資訊，對網路文字中出現頻率較高的關鍵詞的視覺上的突出。

Python資料視覺化:頂級繪相簿plotly詳解

有史以來最牛逼的繪圖工具，沒有之一 plotly是現代平臺的敏捷商業智慧和資料科學庫，它作為一款開源的繪相簿，可以應用於Python、R、MATLAB、Excel、JavaScript和jupyter等多種語言，主要使用的js進行圖形繪製，實現

Python資料視覺化:冪律分佈例項詳解

1、公式推導對冪律分佈公式：對公式兩邊同時取以10為底的對數：所以對於冪律公式，對X,Y取對數後，在座標軸上為線性方程。

Python資料視覺化:餅狀圖的例項講解

使用python實現論文裡面的餅狀圖：原圖： python程式碼實現： # # 餅狀圖 # plot.figure(figsize=(8,8))

Python資料視覺化:泊松分佈詳解

一個服從泊松分佈的隨機變數X，表示在具有比率引數（rate parameter）λ的一段固定時間間隔內，事件發生的次數。引數λ告訴你該事件發生的比率。隨機變數X的平均值和方差都是λ。

Python資料視覺化：箱線圖多種庫畫法

概念箱線圖通過資料的四分位數來展示資料的分佈情況。例如：資料的中心位置，資料間的離散程度，是否有異常值等。

解決Python資料視覺化中文部分顯示方塊問題

一、問題程式碼如下，發現標題的中文顯示的是方塊 import matplotlib import matplotlib.pyplot as plt

Python資料視覺化圖實現過程詳解

python畫分佈圖程式碼示例： # encoding=utf-8 import matplotlib.pyplot as plt from pylab import * # 支援中文

python資料視覺化學習-3

第4章學習更多圖表和定製化 4.4 向圖表新增資料表當前的圖表和子圖可以使用plt.gcf()和plt.gca()獲得，分別表示\"Get Current Figure\"和\"Get Current Axes\"。

python資料視覺化：折線圖、條形圖、餅狀圖顯示

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python資料視覺化：畫餅狀圖、折線圖、圈圖

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python資料視覺化實現多種圖例程式碼詳解

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python資料視覺化：matplotlib 常見圖表繪製——直方圖

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python資料視覺化實現漏斗圖過程圖解

專案實現知識點： Pandas庫及pyecharts庫 Pandas：資料分析和處理工具。 pd.read_csv()：讀取csv檔案。

python 資料視覺化

1、散點圖 plot(x, y, \'.\', color = (r,g,b)) plt.xlable(\'x軸標籤\') plt.ylable(\'y軸標籤\') x,y x軸和y 軸的序列； \'.\', \'。\'小點還是大點color, 散點圖的顏色，可以用rgb定義，也可以用英文字母定義

Python資料視覺化基礎講解

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python資料視覺化入門：使用Matplotlib繪圖

前言 Matplotlib是一個非常有用的Python繪相簿。它和NumPy結合得很好，但本身是一個單獨的開源專案。你可以訪問http://matplotlib.sourceforge.net/gallery.html檢視美妙的示例相簿。