製作簡單 '詞雲圖'

阿新 • • 發佈：2018-12-22

import jieba
from jieba.analyse import extract_tags
from scipy.misc import imread
from wordcloud import WordCloud

import matplotlib.pyplot as plt

def generater(**kwargs):
    content_name = kwargs['content_name']
    content_path = './{}.txt'.format(content_name)
    top_k = kwargs['top_k']
    bg_name = kwargs['bg_name']
    color = kwargs['color']
    font_type = kwargs['font_type']

    with open(content_path, mode='r', encoding='utf-8') as f:
        content = f.read()
    '''
    根據TF/IDF提取topK個關鍵詞
    '''
    tags = extract_tags(sentence=content, topK=top_k)
    '''
    得到關鍵詞的詞頻
    '''
    # 全模式
    words = [word for word in jieba.cut(content, cut_all=True)]
    words_freq = {}
    for tag in tags:
        freq = words.count(tag)
        words_freq[tag] = freq
    '''
    設定背景
    scipy.misc imread()：返回的是 numpy.ndarray 也即 numpy 下的多維陣列物件
    '''
    bg_path = './{}.png'.format(bg_name)
    bg_img = imread(bg_path)
    font_path = './{}.ttf'.format(font_type)
    word_cloud = WordCloud(font_path=font_path, # 設定字型
                           background_color=color, # 背景顏色
                           max_words=top_k, # 詞雲顯示的最多詞數
                           max_font_size=100, # 字型最大
                           mask=bg_img, # 背景圖
                           )
    word_cloud.generate_from_frequencies(words_freq)

    plt.imshow(word_cloud)
    plt.axis('off') # 不顯示座標軸
    plt.show()

    # 儲存圖片
    word_cloud_img = './{}_word_cloud.jpg'.format(content_name)
    word_cloud.to_file(word_cloud_img)

if __name__ == '__main__':
    generater(content_name='習近平：在慶祝中國共產黨成立95週年大會上的講話',
              top_k=66,
              bg_name='china', # 預設png
              color='black',
              font_type='wryh')

windows 安裝 wordcloud

下載地址

pip install  wordcloud-1.3.1-cp36-cp36m-win_amd64.whl

製作簡單 '詞雲圖'

import jieba from jieba.analyse import extract_tags from scipy.misc import imread from wordcloud import WordCloud import matplotlib.pypl

（資料科學學習手札71）在Python中製作個性化詞雲圖

本文對應指令碼及資料已上傳至我的Github倉庫https://github.com/CNFeffery/DataScienceStudyNotes 一、簡介　　詞雲圖是文字挖掘中用來表徵詞頻的資料視覺化影象，通過它可以很直觀地展現文字資料中地高頻詞：圖1 詞雲圖示例　　在Python中有很多視

最簡單中文詞雲圖

word and via dom htm col tail mask imp # -*- coding: utf-8 -*- #author:蔔靈 from wordcloud import WordCloud import jieba import matplotlib

使用中文製作詞雲圖---

''' 製作詞雲圖,背景可以替換成任意圖片，本例中未展示圖片 ''' import numpy as np import pandas as pd from wordcloud import WordCloud #詞雲包 import jieba

抓取qq音樂評論 (林俊杰-雪落下的聲音) 製作詞雲圖，是否值得一聽

使用抓包工具 charles 抓取qq音樂客戶端 url = "https://c.y.qq.com/base/fcgi-bin/fcg_global_comment_h5.fcg?g_tk=798799166&loginUin=1152921504630904742&

中文分詞，詞頻統計，詞雲圖製作

from collections import Counter import jieba #jieba的安裝就不多介紹，網上相應的教程比較多 import matplotlib.pyplot as plt from wordcloud import WordClo

【實戰】詞頻統計及詞雲圖製作

寫在開頭最近對詞雲有些興趣，就自己瞎琢磨研究一些這方面的知識，期間也遇到一些小問題，寫下此篇文章留作備註吧。研究物件金庸老先生的《天龍八部》正式開始（微笑臉）統計字頻（1）先統計下小說的字頻數：天龍八部總共用字量4134個，

利用python製作漂亮的詞雲圖

隨便找個地方新建一個目錄,比如我在F盤下面新建一個word_cloud資料夾(名字都是隨便取),並且開啟這個資料夾.把剛剛下載的msyh.ttc複製到這裡.新建一個my_word_cloud.py在這裡.然後可以在my_word_cloud.py寫程式碼了,首先匯入相關的包##對於NLP（自然語言處理）來說，

python製作詞雲圖

開局10分鐘關於wordcloud庫的安裝問題在上一篇的部落格中已經介紹了，這篇主要和大家分享我學習使用wordcloud庫的一些經歷。 tips:需要注意的是使用wordcloud庫是依賴numpy庫和PIL庫的，因此需要提前安裝好這兩個庫。證據如下：開啟wordcloud.py

根據（本地）資料或檔案製作詞雲圖

首先，我們需要收集和篩選自己需要的資料內容，可以使用資料爬蟲爬取或者是本地檔案。前期準備： 1.python3及以上 2.使用pip安裝jieba，PIL， matplotlib，numpy，wordcloud ，msyh.ttf中文字型，其中jieba主要應用於分詞，num

特朗普退出《巴黎協定》：python詞雲圖輿情分析

con ddd 思路 uip important colors mlu mcs cli 1 前言 2017年6月1日，美國特朗普總統正式宣布美國退出《巴黎協定》。宣布退出《巴黎協定》後，特朗普似乎成了“全球公敵”。特斯拉總裁馬斯克宣

詞雲wordcloud類介紹&python制作詞雲圖&詞雲圖亂碼問題等小坑

fan ask 其中文字 doesn 說明 bool 精神則表達式詞雲圖，大家一定見過，大數據時代大家經常見，我們今天就來用python的第三方庫wordcloud，來制作一個大數據詞雲圖，同時會降到這個過程中遇到的各種坑，舉個例子，下面是我從自己的微信上抓的微信好

爬蟲QQ說說並生成詞雲圖，回憶滿滿！比比誰更殺馬特！

body ~~ beautiful BE -c 添加 Python標準庫 clas mark 無圖言虛空解析器使用方法優勢劣勢 Python標準庫 BeautifulSoup(markup, "html.parser") Python的內置標準庫執行速度

Python文本處理: 分詞和詞雲圖

wordcloud jieba python3 詞雲分詞 ‘‘‘ import os import jieba # 分詞包 import numpy # numpy計算包 import codecs # codecs提供open方法指定打開的文件的語言編碼，它會在讀取時自動轉換為內

python爬蟲爬取QQ說說並且生成詞雲圖，回憶滿滿！

運維開發網絡分析 matplot 容易 jieba 編程語言提示框然而 Python（發音：英[?pa?θ?n]，美[?pa?θɑ:n]），是一種面向對象、直譯式電腦編程語言，也是一種功能強大的通用型語言，已經具有近二十年的發展歷史，成熟且穩定。它包含了一組完善而且

python 爬取視頻評論生成詞雲圖

爬取評論生成詞雲首先爬取評論寫入文件，用上一篇爬取騰訊是視頻的評論的方法提取評論http://blog.51cto.com/superleedo/2126099 代碼需要稍作修改如下：#!/usr/bin/env python # -*- coding: utf-8 -*- import re import

用Python繪制紅樓夢詞雲圖，竟然發現了這個！

微信 mce dataframe 文言文中文分詞 import 雲圖標點符號 data Python在數據分析中越來越受歡迎，已經達到了統計學家對R的喜愛程度，Python的擁護者們當然不會落後於R，開發了一個個好玩的數據分析工具，下面我們來看看如何使用Python，

分詞及詞雲圖設計

display als return color pos d+ resource div 更改１.jieba的基本使用 1 import jieba 2 3 4 s1 = ‘我喜歡廣州小蠻腰‘ 5 s2 = "我喜歡上海東方明珠" 6 #jieba,c

詞雲圖

scrip preview ava eating top target align 文章 targe https://www.jianshu.com/p/4fb27471295f 現成工具 https://blog.csdn.net/zhchs2012

CSS製作簡單的縱向選單

1.先寫一個列表，建立選單的結構 <span style="font-size:14px;"><span style="font-size:14px;"><div class="menu"> <ul> <li&g

製作簡單 '詞雲圖'

相關推薦