基於Python詞雲分析政府工作報告關鍵詞
阿新 • • 發佈:2020-06-03
前言
十三屆全國人大三次會議作了政府工作報告。這份政府工作報告僅有10500字左右,據悉是改革開放40年以來最短的一次。受到疫情影響,今年的兩會會議適當縮短,政府工作報告也大幅壓縮,體現了“實幹為要”的理念。那麼,這份政府工作報告突出強調了哪些關鍵詞呢?我們其實可以基於Python技術進行詞頻分析和詞雲製作!
import matplotlib.pyplot as plt#繪相簿 import jieba from wordcloud import WordCloud # 讀入文字資料 fp = open(r'D:\爬蟲下載\2020年政府工作報告.txt','r',encoding='utf-8') content = fp.read() # print(content) #分詞 words = jieba.lcut(content) # 詞頻分析操作 data = {} for word in words: if len(word)>1: if word in data: data[word]+=1 else: data[word]=1 # print(data) #排序 hist = list(data.items())#轉成列表 hist.sort(key=lambda x:x[1],reverse=True) # print(hist) #除錯輸出 for i in range(20): # print(hist[i]) print('{:<10}{:>5}'.format(hist[i][0],hist[i][1]))#左對齊10,右對齊5個長度
下表統計了今年的政府工作報告中出現次數最多的幾個關鍵詞。我們可以看到,今年的政府工作報告中提到“發展”的次數最多,一共出現了69次,“發展”一直都是政府工作報告中的重要關鍵詞;其次是“就業”,出現了39次,足以顯示新冠疫情之下就業問題的嚴峻性,以及黨中央、國務院對就業問題的高度重視,政府工作報告中沒有提出全年經濟增速的具體目標,但仍然提出了就業目標——城鎮新增就業900萬人以上、城鎮調查失業率6%左右、城鎮登記失業率5.5%左右;第三多的就是“疫情”,報告中多次提到疫情防控工作,並指出這次新冠肺炎疫情,是新中國成立以來我國遭遇的傳播速度最快、感染範圍最廣、防控難度最大的公共衛生事件。
“企業”作為市場經濟的主體,出現的次數達到了30次,要想保障就業和民生,必須穩住上億市場主體,盡力幫助企業特別是中小微企業、個體工商戶渡過難關,報告提出要加大巨集觀政策實施力度,著力穩企業保就業。還有“支援”、“保障”、“加強”、“推進”等鼓舞人心的關鍵詞出現次數也很多,相信大家看到政府工作報告中滿滿的政策“乾貨”,信心和底氣也會更足了。
根據關鍵詞的出現次數,我們可以使用Python繪製出政府工作報告詞雲圖。Python的詞雲功能相當強大,你可以自己設定形狀、字型、大小!
result = ' '.join(words) # print(result) #生成詞雲 wc = WordCloud( font_path=r'D:\PPT\ppt字型\思源宋體SC-Regular.otf',background_color = 'white',#背景顏色 width=500,#圖片的寬 height=300,max_font_size=50,min_font_size=12 ) wc.generate(result) wc.to_file(r'.\wordcloud.png')#儲存圖片 #顯示圖片 plt.figure('政府工作報告') plt.imshow(wc) plt.axis('off')#關閉座標軸 plt.show()
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。