python WordCloud 簡單例項

阿新 • • 發佈：2019-02-20

首先需要進行分詞，也就是將一個句子分割成一個個的詞語，我這裡使用的是jieba分詞

import jieba 
cut = jieba.cut(text)  #text為你需要分詞的字串/句子
string = ' '.join(cut)  #將分開的詞用空格連線
print(string)

上面是一個非常簡單的分詞的例子，在cut的時候也可以選擇不同的引數，使用不同的模式進行分詞，具體使用方法可自行百度，當然也有其他的分詞包，大家可自行選擇

分好詞後就需要將詞做成詞雲了，我使用的是wordcloud

from matplotlib import pyplot as plt
from wordcloud import WordCloud

string = 'Importance of relative word frequencies for font-size. With relative_scaling=0, only word-ranks are considered. With relative_scaling=1, a word that is twice as frequent will have twice the size. If you want to consider the word frequencies and not only their rank, relative_scaling around .5 often looks good.'
font = r'C:\Windows\Fonts\FZSTK.TTF'
wc = WordCloud(font_path=font, #如果是中文必須要新增這個，否則會顯示成框框
               background_color='white',
               width=1000,
               height=800,
               ).generate(string)
wc.to_file('ss.png') #儲存圖片
plt.imshow(wc)  #用plt顯示圖片
plt.axis('off') #不顯示座標軸
plt.show() #顯示圖片

這是一個十分簡單的例子，文字是我隨便copy的，不過這樣方方正正的不怎麼好看，我希望能做成網上那樣有不同形狀的，在wordcloud中提供了一個引數mask，他可以讓你指定你想繪製的圖片，不過必須是白底的，他會在你非白底的地方填充上文字，所以最終我的程式碼是這樣的：

import jieba
from matplotlib import pyplot as plt
from wordcloud import WordCloud
from PIL import Image
import numpy as np

path = r'檔案儲存的目錄'
font = r'C:\Windows\Fonts\FZSTK.TTF'

text = (open(path+r'\崗位需求.txt','r',encoding='utf-8')).read()
cut = jieba.cut(text)  #分詞
string = ' '.join(cut)
print(len(string))
img = Image.open(path+r'\22.png') #開啟圖片
img_array = np.array(img) #將圖片裝換為陣列
stopword=['xa0']  #設定停止詞，也就是你不想顯示的詞，這裡這個詞是我前期處理沒處理好，你可以刪掉他看看他的作用
wc = WordCloud(
    background_color='white',
    width=1000,
    height=800,
    mask=img_array,
    font_path=font,
    stopwords=stopword
)
wc.generate_from_text(string)#繪製圖片
plt.imshow(wc)
plt.axis('off')
plt.figure()
plt.show()  #顯示圖片
wc.to_file(path+r'\new.png')  #儲存圖片

源圖片為

這是我從另外一個博主那拉下來的，侵刪，生成的結果是這樣的：

從這個圖片看來資料探勘和機器學習的關係是非常密切。還生成了一張文字的，不過很模糊

最後貼幾個參考資料的連結，在此感謝各位博主：

python WordCloud 簡單例項

首先需要進行分詞，也就是將一個句子分割成一個個的詞語，我這裡使用的是jieba分詞import jieba cut = jieba.cut(text) #text為你需要分詞的字串/句子 string = ' '.join(cut) #將分開的詞用空格連線 print(

Python-GUI簡單例項

用python實現一個GUI小程式，一個可以開啟txt並寫入txt的記事本程式 import wx def load(event): file = open(openfilename.Get

Python ghost.py 0.2版簡單例項

from ghost import Ghost ghost = Ghost() with ghost.start() as session: 　　page, extra_resources = session.open("http://www.baidu.com") if page.http_s

【筆記】嵩天-Python語言程式設計-完成兩個簡單例項

【根索引】　【Python索引】目標使用PyCharm，完成兩個小例項的編寫和執行。一個是溫度轉換，一個是蟒蛇圖形繪製。過程 1、先設定project目錄，雖然命名不是很正式，主要不太習慣軟體的目錄結構，好在只是熟悉語言和工具，就先把程式碼都放一個目錄下吧。 2、可以開啟多個py檔案，執行時可

Python中簡單的GUI--Tkinter例項分析--2

廢話少說，直接從最初到後面一個一個程式碼展示最近參考文章（辛星tkinter第二版）書寫的程式碼內容 from tkinter import * def xinlabel(): '''2 ways to bind''' global xin s =

python多型簡單例項

import abc # 制定規則 class BaseObj(metaclass=abc.ABCMeta): # 吃 @abc.abstractmethod def eat(self): pass # 說 @abc.abstractmethod def say(self):

Python簡單例項

1,基礎語法 1)print自帶換行，取消換行？ x=raw_input() y=raw_input() z=raw_input() lst=[] lst.append(x) lst.app

Python+Selenium 簡單的例項

1、Baidu_Serch.py #coding=utf-8 from selenium import webdriver from selenium.common.exceptions import NoSuchElementException,TimeoutExcep

win10 Python+selenium安裝+簡單例項

選用：python3.6.5setuptools-39.1.0pip-10.0.1selenium3.0安裝環境windows10 ，64位一、安裝python3.61、python下載：下載地址：python官網選擇windows 64位下的內容，我選擇的是python3

python簡單例項一

1.自定義函式 #coding=utf-8#自定義函式,傳入引數,沒有傳入引數def sayHello():print("hello word")def maxed(a,b):if(a>b):print(a)else:print(b) sayHello()prin

Python的abs、print、重定向到檔案簡單例項

#coding=utf-8 import sys import os print "%s version is %.1f" %("python",2.7) output=open('E:\Python

列表的應用例項——用Python實現簡單的通訊錄

Python3 列表序列是Python中最基本的資料結構。序列中的每個元素都分配一個數字 - 它的位置，或索引，第一個索引是0，第二個索引是1，依此類推。 Python有6個序列的內建型別，但最常見的是列表和元組。序列都可以進行的操作包括索引，切片，加，乘，檢查成員

Python爬蟲的post請求簡單例項

登陸網頁註冊時用Python進行post請求，程式碼首先檢視頁面原始碼，注意form表單部分，哪裡是需要遞交的表單資訊執行程式碼 import urllib.request import urllib.parse url='http://www.iqianyue.co

Appium+python 一個簡單的登入測試例項

# coding=utf-8 from appium import webdriver import time import unittest import os import HTMLTestRunner class LoginTestLizi(unit

python 編寫簡單的setup.py

ria 如何代碼使用文本 highlight ttl pac 文件夾　　學習python也已經有一段時間了，發現python作為腳本語言一個很重要的特點就是簡單易用，而且擁有巨多的第三方庫，幾乎方方面面的庫都有，無論你處於哪個行業，想做什麽工作，幾乎都能找到對應的第

Python超簡單批量改文件後綴

radio 路徑 tdi for rename python blog 當前 dir 1 import os 2 3 files = os.listdir("D:\QTDownloadRadio\QTDownloadRadio - 副本")#列出當前目錄下所有的文

Python實現簡單的三次登錄

退出初始 class for highlight 執行 count isa bre Python實現簡單的三次登錄方法一： count = 1 # 定義初始值為1 while count <= 3:

python實現簡單圖片爬蟲並保存

.com 貪婪模式 web頁面 logs urn 並不是 python 保存 light 先po代碼 #coding=utf-8 import urllib.request #3之前的版本直接用urllib即可，下同 #該模塊提供了web頁面讀取數據的接口，使得我們可以

python實現簡單的循環購物車小功能

iphone6s opp lose pre 選擇小功能 alt else ret python實現簡單的循環購物車小功能 # -*- coding: utf-8 -*- __author__ = ‘hujianli‘ shopping = [ ("iphon

Python開發簡單爬蟲（二）---爬取百度百科頁面數據

class 實例實例代碼編碼 mat 分享 aik logs title 一、開發爬蟲的步驟 1.確定目標抓取策略：打開目標頁面，通過右鍵審查元素確定網頁的url格式、數據格式、和網頁編碼形式。 ①先看url的格式, F12觀察一下鏈接的形式;② 再看目標文本信息的

python WordCloud 簡單例項

相關推薦