Python寫出新冠狀病毒確診人數地圖的方法
阿新 • • 發佈:2020-02-13
最近肺炎的發展速度屬實有點恐怖。剛知道python的pyecharts這個庫,想到pyecharts視覺化的特點,正好可以扒一下肺炎實時播報的官網也做個地圖。
第一步扒取資料:發現一個大問題,各省的確診人數網頁原始碼裡竟然沒有。百度才知道這是js渲染生產的,又是一頓查。找到一種方法。用selenium執行一遍網頁渲染的過程就可以了,首先安裝selenium。
pip install selenium
在引用庫的時候還需要webdriver這個啟動瀏覽器的東西,我用的是google,所以要下載chromedriver。先查詢自己chrome的版本
然後找到chromedriver的對應版本,下載
下載之後把exe檔案解壓到編程式碼的資料夾裡就可以使用了。現在可以爬資料了,匯入庫
from selenium import webdriver
然後驅動瀏覽器,並訪問網址
driver = webdriver.Chrome() driver.get('https://news.163.com/special/epidemic/#map_block')
這裡記住得設定一個等待,要不然爬取資料的時候可能程式執行完了網頁還沒開啟
driver.implicitly_wait(5)
這時就可以獲取資料了
data = driver.page_source
還是得用正則表示式篩選一下想要的資料,別忘了在前面匯入import re
name = re.findall(r'<span class="item_name">(.*?)</span>',data,re.S)[1:32] value = re.findall(r'span class="item_confirm">(.*?)</span>',re.S)[1:32]
爬取成功
已經爬取到資料了,接下來就是視覺化的部分了,用到pyecharts的Map塊。
pyecharts文件連結在這裡——按照文件裡把庫匯入
地圖的程式碼如下
但是我Faker這個下不下來,後來查了一下用了這個大佬的方法:地址
整體程式碼如下:
from pyecharts.charts import Map from pyecharts import options as opts import re from selenium import webdriver driver = webdriver.Chrome() driver.get('https://news.163.com/special/epidemic/#map_block') driver.implicitly_wait(5) #data = driver.find_element_by_xpath('/html/body/div[3]/div[2]/div[2]/ul[1]/li[1]/div/span[1]').text#.get_attribute('href') data = driver.page_source attr = re.findall(r'<span class="item_name">(.*?)</span>',re.S)[1:32] sequence = list(zip(attr,value)) def map_visualmap(sequence,year) -> Map: c = ( Map() .add(year,sequence,"china",) .set_global_opts( title_opts=opts.TitleOpts(title="新冠裝狀病毒各省確診人數"),visualmap_opts=opts.VisualMapOpts(max_=130,min_=95),) ) return c map = map_visualmap(sequence,'新冠病毒感染情況') map.render(path='2020.html')
看一下成果吧!
以上就是我們小編整理的全部內容,感謝大家的學習和支援。