1. 程式人生 > 程式設計 >Python寫出新冠狀病毒確診人數地圖的方法

Python寫出新冠狀病毒確診人數地圖的方法

最近肺炎的發展速度屬實有點恐怖。剛知道python的pyecharts這個庫,想到pyecharts視覺化的特點,正好可以扒一下肺炎實時播報的官網也做個地圖。

第一步扒取資料:發現一個大問題,各省的確診人數網頁原始碼裡竟然沒有。百度才知道這是js渲染生產的,又是一頓查。找到一種方法。用selenium執行一遍網頁渲染的過程就可以了,首先安裝selenium。

pip install selenium

在引用庫的時候還需要webdriver這個啟動瀏覽器的東西,我用的是google,所以要下載chromedriver。先查詢自己chrome的版本

Python寫出新冠狀病毒確診人數地圖的方法

然後找到chromedriver的對應版本,下載

Python寫出新冠狀病毒確診人數地圖的方法

下載之後把exe檔案解壓到編程式碼的資料夾裡就可以使用了。現在可以爬資料了,匯入庫

from selenium import webdriver

然後驅動瀏覽器,並訪問網址

driver = webdriver.Chrome()
driver.get('https://news.163.com/special/epidemic/#map_block')

這裡記住得設定一個等待,要不然爬取資料的時候可能程式執行完了網頁還沒開啟

driver.implicitly_wait(5)

這時就可以獲取資料了

data = driver.page_source

還是得用正則表示式篩選一下想要的資料,別忘了在前面匯入import re

name = re.findall(r'<span class="item_name">(.*?)</span>',data,re.S)[1:32]
value = re.findall(r'span class="item_confirm">(.*?)</span>',re.S)[1:32]

爬取成功

Python寫出新冠狀病毒確診人數地圖的方法

已經爬取到資料了,接下來就是視覺化的部分了,用到pyecharts的Map塊。

pyecharts文件連結在這裡——按照文件裡把庫匯入

Python寫出新冠狀病毒確診人數地圖的方法

地圖的程式碼如下

Python寫出新冠狀病毒確診人數地圖的方法

但是我Faker這個下不下來,後來查了一下用了這個大佬的方法:地址

整體程式碼如下:

from pyecharts.charts import Map
from pyecharts import options as opts
import re
from selenium import webdriver

driver = webdriver.Chrome()


driver.get('https://news.163.com/special/epidemic/#map_block')
driver.implicitly_wait(5)
#data = driver.find_element_by_xpath('/html/body/div[3]/div[2]/div[2]/ul[1]/li[1]/div/span[1]').text#.get_attribute('href')
data = driver.page_source
attr = re.findall(r'<span class="item_name">(.*?)</span>',re.S)[1:32]

sequence = list(zip(attr,value))


def map_visualmap(sequence,year) -> Map:
 c = (
  Map()
   .add(year,sequence,"china",)
   .set_global_opts(
   title_opts=opts.TitleOpts(title="新冠裝狀病毒各省確診人數"),visualmap_opts=opts.VisualMapOpts(max_=130,min_=95),)
 )
 return c


map = map_visualmap(sequence,'新冠病毒感染情況')
map.render(path='2020.html')

看一下成果吧!

以上就是我們小編整理的全部內容,感謝大家的學習和支援。