1. 程式人生 > 程式設計 >基於Python詞雲分析政府工作報告關鍵詞

基於Python詞雲分析政府工作報告關鍵詞

前言

十三屆全國人大三次會議作了政府工作報告。這份政府工作報告僅有10500字左右,據悉是改革開放40年以來最短的一次。受到疫情影響,今年的兩會會議適當縮短,政府工作報告也大幅壓縮,體現了“實幹為要”的理念。那麼,這份政府工作報告突出強調了哪些關鍵詞呢?我們其實可以基於Python技術進行詞頻分析和詞雲製作!

import matplotlib.pyplot as plt#繪相簿
import jieba
from wordcloud import WordCloud

# 讀入文字資料
fp = open(r'D:\爬蟲下載\2020年政府工作報告.txt','r',encoding='utf-8')
content = fp.read()
# print(content)
#分詞
words = jieba.lcut(content)
# 詞頻分析操作
data = {}
for word in words:
  if len(word)>1:
    if word in data:
      data[word]+=1
    else:
      data[word]=1
# print(data)

#排序
hist = list(data.items())#轉成列表
hist.sort(key=lambda x:x[1],reverse=True)
# print(hist)

#除錯輸出
for i in range(20):
  # print(hist[i])
  print('{:<10}{:>5}'.format(hist[i][0],hist[i][1]))#左對齊10,右對齊5個長度

下表統計了今年的政府工作報告中出現次數最多的幾個關鍵詞。我們可以看到,今年的政府工作報告中提到“發展”的次數最多,一共出現了69次,“發展”一直都是政府工作報告中的重要關鍵詞;其次是“就業”,出現了39次,足以顯示新冠疫情之下就業問題的嚴峻性,以及黨中央、國務院對就業問題的高度重視,政府工作報告中沒有提出全年經濟增速的具體目標,但仍然提出了就業目標——城鎮新增就業900萬人以上、城鎮調查失業率6%左右、城鎮登記失業率5.5%左右;第三多的就是“疫情”,報告中多次提到疫情防控工作,並指出這次新冠肺炎疫情,是新中國成立以來我國遭遇的傳播速度最快、感染範圍最廣、防控難度最大的公共衛生事件。

基於Python詞雲分析政府工作報告關鍵詞

“企業”作為市場經濟的主體,出現的次數達到了30次,要想保障就業和民生,必須穩住上億市場主體,盡力幫助企業特別是中小微企業、個體工商戶渡過難關,報告提出要加大巨集觀政策實施力度,著力穩企業保就業。還有“支援”、“保障”、“加強”、“推進”等鼓舞人心的關鍵詞出現次數也很多,相信大家看到政府工作報告中滿滿的政策“乾貨”,信心和底氣也會更足了。

根據關鍵詞的出現次數,我們可以使用Python繪製出政府工作報告詞雲圖。Python的詞雲功能相當強大,你可以自己設定形狀、字型、大小!

result = ' '.join(words)
# print(result)
#生成詞雲
wc = WordCloud(
  font_path=r'D:\PPT\ppt字型\思源宋體SC-Regular.otf',background_color = 'white',#背景顏色
  width=500,#圖片的寬
  height=300,max_font_size=50,min_font_size=12
)
wc.generate(result)
wc.to_file(r'.\wordcloud.png')#儲存圖片
#顯示圖片
plt.figure('政府工作報告')
plt.imshow(wc)
plt.axis('off')#關閉座標軸
plt.show()

基於Python詞雲分析政府工作報告關鍵詞

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。