1. 程式人生 > >Python3做詞雲(一)

Python3做詞雲(一)

所在系統:Ubuntu14.04

工具:anaconda,清華映象,wordcloud   這裡的安裝報錯問題在我另一篇文章記錄安裝anaconda3-5.01,清華映象與wordcloud的各種報錯中有解析

步驟:1先建立一個資料夾demo

mkdir demo

2進入該資料夾並匯入影象和txt檔案(這裡圖片最好選黑白,txt裡面內容中英文即可)

我這裡輸入的影象是

匯入了農夫的好彩分手歌詞

喂 唔駛咁愁喎朋友 
一段感情梗有佢完嘅時候
佢肯同你分手 你應該走夾唔抖
咁嘅人都有 簡直系禽獸 我明架
你能夠忍嘅都忍夠 你等佢變
佢冇理過你感受 佢洗你錢
佢cut你線 佢落你面
你對佢仁至義盡啦 佢仲想你點
記住今日佢飛你係佢唔識貨
呢種人你咪當從來無識過
你只系信錯衰人一個
咪唔信愛情 系會有好結果
你個ex擺明系賤人 系廢人
你咪為佢費神 你當為己為人
你有冇聽聞得饒人處且饒人
佢仲喺instagram處寫條文
你話佢扮咩 扮咩受害者
佢話佢比你仲傷
其實你係你俾佢中傷
呢啲咪趟著都要中槍
邊有人分手趙完仲唱
人生流流長 總會遇到幾條
好彩諗起嗰一次你有分手
最委屈嘅你受夠 冇分手會有排你受
終於搵到嗰一對美滿雙手
你開心到冇朋友 最初玩你嘅人等天收
系 我知你未放得低
但系呢個人冇資格影響你一世
喊啦 即管喊出黎
少少眼淚 咪當交少少學費
你唔想拍拖拍到似上戰場
但系佢次次傷害你嘅方法都唔一樣
講大話佢太擅長 朋友你太善良
你點對人 唔等於人地會點對你
學識呢個道理 獲益嘅系你自己
或者呢段感情繫有啲苦澀味
不過你應該慶幸 
呢個人冇同你走到結尾
你個ex擺明呢一生呢一世
你都會憎佢做嘅一切
你後悔同佢一齊
正所謂自古人生誰冇死
其實你想佢嗰日早啲嚟
你仲要扮咩 扮咩偉大啫
根本佢就係有史以嚟
呢個人淨系識愛自己
分左手仲要講你是非
邊有人一衰衰到貼地
人生流流長 總有人唔洗原諒
好彩諗起嗰一次你有分手
最委屈嘅你受夠
冇分手會有排你受
終於搵到嗰一對美滿雙手
你開心到冇朋友
最初玩你嘅人等天收
嗱 好彩分手 洗乜怕醜
嗱 佢講出口 即刻拍手
嗱 你轉身走 駛乜深究
嗱 你放心有最尾完美嘅邂逅 

3匯入simfang.ttf  --主要用於中文解析,wordcloud中預設只解析英文,所以你要上網下載simfang,並把simfang下到該資料夾中

4在終端輸入

[email protected]:~$ cd demo
[email protected]:~/demo$ jupyter notebook

5在開啟的頁面中點選左上角,new-Python3

在彈開的視窗上輸入程式碼如下:

#匯入wordcloud模組
from wordcloud import  WordCloud
from scipy.misc import imread

#讀取一個txt檔案
filename = "fenshou.txt"
with open(filename) as f:
 mytext = f.read()
#讀入背景圖片
bg_pic = imread('5aa3c38e3348374fbe68bf5958d8cc54.jpg')
#生成詞雲
wordcloud = WordCloud(font_path='simfang.ttf',mask=bg_pic,background_color='white',scale=1.5).generate(mytext)
#儲存圖片
%pylab inline
import matplotlib.pyplot as plt
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")

6最後按shift+enter鍵執行

7結果如下:


相關推薦

Python3

所在系統:Ubuntu14.04工具:anaconda,清華映象,wordcloud   這裡的安裝報錯問題在我另一篇文章記錄安裝anaconda3-5.01,清華映象與wordcloud的各種報錯中有解析步驟:1先建立一個資料夾demomkdir demo2進入該資料夾並匯

Python小程式——利用wordcloud庫生成

最近自學Python的中文處理,其中用到了wordcloud庫生成一篇文章的詞雲,能更直觀的表現出文章的主題,是一個不錯的工具。雖然現在網上有很多詞雲線上生成的應用,不過為了更個性化一點,還是寫一個自己的詞雲生成工具吧。 import jieba import wordcloud from

新手必會:商業智能BI入門專業

操作數 讀者 模式 分析工具 重新 實現 資源 框架 計算機程序   進入任何一個行業,都必須經歷的就是了解該行業的相關專業詞匯,尤其是IT行業。如果專業詞匯都不懂幾個,勢必會影響後續的深入學習。在我們每周三的公開課裏已經有或多或少提及到關於商業智能BI入門的一些專業詞匯,

Python培訓知識總結系列- 第三章 Python3文件操作

readline new socket 總結 排序 tin strip() list 是否 open 123456789f = open(‘filename‘,‘r‘) # 讀模式f = open(‘filename‘,‘w‘) # 寫模式f = open(‘filenam

python3.6 集合筆記

python 集合 慢慢體會到,在學習或者解決一個問題的時候,首先要盡量理解透問題本身涉及到的相關概念,再去進一步分析解決具體問題,即可事半功倍。 比如,對於編程語言裏面的集合問題,以python語言為例(在此順便復習下關於集合本身的東西)。而集合本身在數學領域具有無可比擬的特殊重要性。在數學學科上集合的分類

Python3從零學習

# python 3.+ # -*- coding: utf-8 -*- #檢視版本號python -V #列印 print("Hello Python") #等待使用者輸入 input("請按下回車鍵") #同一行顯示多條語句 import sys;x = '同一行顯示多條語句';sy

python用selenium自動化測試

python 用selenium做自動化測試: 在w3school裡搜尋css python3 test_w3school_search.py XPath路徑表示式: http://www.ruanyifeng.com/blog/2009/07/xpath_pa

Python小程式——利用wordcloud庫生成

wordcloud庫利用wordcloud物件生成詞雲,其中可以配置很多屬性,讓你的詞雲更加個性化。 w_cloud = wordcloud.WordCloud( font_path=font, background_color=None, mode="RGBA", # 背

python3 django框架開發 html呼叫static檔案

轉載請註明:https://blog.csdn.net/weixin_40490238/article/details/84573309 django的準備工作: 開啟pycharm建立的django專案,並新建一個python虛擬環境 開啟命令列,輸入:建立一個新的

redis可以用來什麼?

redis可以用來做什麼?以部落格帖子為例大概說說,當然redis的其他功能還有很多,後續在做介紹。 Redis 是網際網路技術領域使用最為廣泛的儲存中介軟體,它是「Remote Dictionary Service」的首字母縮寫,也就是「遠端字典服務」。 記錄帖子的點贊數、評論數和點選數 (hash)

c++牛客網題筆記

一邊做題一邊思考,才能夠提高學習的效率。為了加深記憶,將每天做的題的筆記記錄在部落格上。 1. 字元陣列與字串 char a[] = {'a','b'}; char b[] = {"ab"}; b陣列比a陣列多一個‘\0’。b為字串常量,a為字元陣列。

python3.5進階-------------------網路通訊ip、埠,socket

1. ip地址:如198.168.1.1 ,用於在網路中標記區分每臺電腦,在本地區域網中是唯一的。window下程式->cmd->輸入ipconfig(檢視ipv4就是ip地址)。拓展:ip v4表示ip的第四個版本,目前出現了ipv6,ipv1/2/3/5都

python3 每日十題

'''1 列表[1,3,5,7,9],請將之拼接為一個字串''' print(''.join([str(i) for i in [1,3,5,7,9] ])) '''2 將"13579"的字串轉換為一個列表''' a_list = [] for i in "13579

python3+opencv3 影象處理讀取顯示張圖片

  先在此處先宣告,後面學習python+opencv影象處理時均參考這位博主的博文https://blog.csdn.net/u011321546/article/category/7495016/2?,我只是復現和稍微修改一下程式碼,加深自己印象的同時也督促自己好好學習影

從零開始SSH專案

  1.資料庫指令碼 使用者表 CREATE TABLE `ybl`.`userinfo`( `id` INT NOT NULL AUTO_INCREMENT, `email` VARCHAR(64) NOT NULL, `identity` INT NOT NUL

Python3之Django學習

python 版本3.6.3  Django版本2.1.2 本篇學習筆記參照菜鳥教程的步驟實現 主要遇到了這個頁面顯示問題,記錄一下: 如果是 Django >= 2.0 的版本,urls.

創業公司資料分析開篇

      瞭解“認知心理學”的朋友應該知道:人類對事物的認知,總是由淺入深。然而,每個人思考的深度千差萬別,關鍵在於思考的方式。通過提問三部曲:WHAT->HOW->WHY,可以幫助我們一步步地從事物的表象深入到事物的本質。比如學習一個新的技術框架,需要逐步

Word2Vec向量

 一、詞向量基礎(一)來源背景   word2vec是google在2013年推出的一個NLP工具,它的特點是將所有的詞向量化,這樣詞與詞之間就可以定量的去度量他們之間的關係,挖掘詞之間的聯絡。雖然原始碼是開源的,但是谷歌的程式碼庫國內無法訪問,      &

中文分系列 雙陣列Tire樹(DART)詳解

雙陣列Tire樹是Tire樹的升級版,Tire取自英文Retrieval中的一部分,即檢索樹,又稱作字典樹或者鍵樹。下面簡單介紹一下Tire樹。 1.1 Tire樹 Trie是一種高效的索引方法,它實際上是一種確定有限自動機(DFA),在樹的結構中,每一個結點對應一個DFA狀態,每一個從父結點指向子結點

python3下tensorflow練習

1.瞭解tensorflow基本架構2.用梯度下降的方法訓練處模型3.視覺化樣本資料,視覺化訓練出的模型以及視覺化損失函式""" Created on Wed May 2 09:40:08 2018 @author: jiangcheng """ import tens