Python爬取天氣網歷史天氣數據

阿新 • • 發佈：2017-12-05

ast 信息爬蟲 cmake tex for roc ins fonts

使用Python的requests 和BeautifulSoup模塊，Python 2.7.12可在命令行中直接使用pip進行模塊安裝。爬蟲的核心是利用BeautifulSoup的select語句獲取需要的信息。

pip install requests
pip install bs4

以武漢市2017年5~7月的歷史為例爬取天氣網中武漢市的歷史天氣數據。
7月對應的網址為http://lishi.tianqi.com/wuhan/201707.html

1.requests模塊獲取網頁內容

url=‘http://lishi.tianqi.com/wuhan/201707.html‘
response = requests.get(url)                          
soup = BeautifulSoup(response.text, ‘html.parser‘)

2.利用.select語句找到網頁中天氣數據所在的div

weather_list = soup.select(‘div[class="tqtongji2"]‘)

技術分享圖片

3.找出日期、最高氣溫、最低氣溫、天氣等數據，用li.string獲取li中的信息。

ul_list = weather.select(‘ul‘)
for ul in ul_list:
    li_list= ul.select(‘li‘)
    for li in li_list:
        li.string.encode(‘utf-8‘)  #具體的天氣信息

技術分享圖片

具體代碼實現如下：

#encoding:utf-8                                                                      
import requests                                                                      
from bs4 import BeautifulSoup                                                        

urls = ["http://lishi.tianqi.com/wuhan/201707.html",                                 
        "http://lishi.tianqi.com/wuhan/201706.html",                                 
        "http://lishi.tianqi.com/wuhan/201705.html"]                                 
file = open(‘wuhan_weather.csv‘,‘w‘)                                                 
for url in urls:                                                                     
    response = requests.get(url)                                                     
    soup = BeautifulSoup(response.text, ‘html.parser‘)                               
    weather_list = soup.select(‘div[class="tqtongji2"]‘)                             

    for weather in weather_list:                                                     
        weather_date = weather.select(‘a‘)[0].string.encode(‘utf-8‘)                 
        ul_list = weather.select(‘ul‘)                                               
        i=0                                                                          
        for ul in ul_list:                                                           
            li_list= ul.select(‘li‘)                                                 
            str=""                                                                   
            for li in li_list:                                                       
                str += li.string.encode(‘utf-8‘)+‘,‘                                 
            if i!=0:                                                                 
                file.write(str+‘\n‘)                                                 
            i+=1                                                                     
file.close()

最後的結果：
技術分享圖片

Python爬取天氣網歷史天氣數據

ast 信息爬蟲 cmake tex for roc ins fonts 使用Python的requests 和BeautifulSoup模塊，Python 2.7.12可在命令行中直接使用pip進行模塊安裝。爬蟲的核心是利用BeautifulSoup的select語句獲

2018-7-12python爬取歷史天氣數據

www. 正在 history ins tran 文件 idt 寫入文件 1.3 2018-7-12python爬取歷史天氣數據 python 爬蟲天氣數據需求需要幾個城市的歷史天氣數據，為了方便最後入庫，需要的字段為城市、溫度、天氣。最好能生成一個完整的c

Python爬取天氣預報

exc res http tee parser ror .cn date req 將持續更新…… 1.實現爬取一天的天氣預報 from urllib.request import urlopen from bs4 import BeautifulSoup import re

Python爬取全書網小說，免費看小說

tle 3.6 tro con fin 保存 get 正在 url地址什麽是網絡爬蟲網絡爬蟲（又被稱為網頁蜘蛛，網絡機器人，在FOAF社區中間，更經常的稱為網頁追逐者），是一種按照一定的規則，自動地抓取萬維網信息的程序或者腳本。另外一些不常使用的名字還有螞蟻、自

Python爬蟲案例：利用Python爬取笑話網

htm 分享 targe pen 技術分享搞笑 lan tle import 學校的服務器可以上外網了，所以打算寫一個自動爬取笑話並發到bbs的東西，從網上搜了一個笑話網站，感覺大部分還不太冷，html結構如下：可以看到，笑話的鏈接列表都在<div cla

Python爬取天氣資訊並定時傳送給微信好友(異地戀神器)！！

效果前言中國天氣網： http://www.weather.com.cn/ 點選右上角的具體的天氣資料想獲取哪個城市的天氣，就搜尋城市進行切換這裡以青島為例可以看到此時url為： http://www.weather.com.cn/weat

python 爬取豆瓣網搜尋結果同城活動資料

主要使用的庫： requests:爬蟲請求並獲取原始碼 re：使用正則表示式提取資料 json:使用JSON提取資料 pandas：使用pandans儲存資料 bs4:網頁程式碼解析以下是原始碼： #!coding=utf-8 import requests

Python爬取下載網易雲音樂

from urllib import request import requests import re from bs4 import BeautifulSoup from pprint import pprint import urllib, time def get

Python爬取天氣預報資料，並存入到本地EXCEL中

近期忙裡偷閒，搞了幾天python爬蟲，基本可以實現常規網路資料的爬取，比如糗事百科、豆瓣影評、NBA資料、股票資料、天氣預報等的爬取，整體過程其實比較簡單，有一些HTML+CSS+DOM樹等知識就很easy，我就以天氣預報資料的爬取為例，整理出來。需求：採

python爬取天氣資訊

功能講解： 1.根據你的ip地址，定位你所在的城市，然後把城市引數傳給city_weather函式，向伺服器傳送請求，得到天氣結果 2.直接輸入你要查詢的城市名，就可獲取天氣情況。程式碼： import requests,json def city_weather(cit

Python爬取妹子網圖片

提取文章標題 import requests from bs4 import BeautifulSoup url = 'http://www.mzitu.com/26685' header = {'User-Agent': 'Mozilla/5.0 (

python 爬取知網url

由於知網存在非同步載入，爬取需要獲得queryid，cookies等程式碼如下： #coding:utf-8 ''' Created on 2016-8-15 @author: 劉帥 ''' import urllib2 from bs4 impor

Python爬取百度貼吧數據

utf-8 支持我 family encode code word keyword 上一條時間　　本渣除了工作外，在生活上還是有些愛好，有些東西，一旦染上，就無法自拔，無法上岸，從此走上一條不歸路。花鳥魚蟲便是我堅持了數十年的愛好。　　本渣還是需要上班，才能支持我的

python爬天氣網歷史資料

#爬取天氣網氣象資料____聶拉木 from urllib.request import urlopen from bs4 import BeautifulSoup import re import pandas as pd ## 生成爬取網址由於氣象網資料的網站連結地址比較特殊，採用

python爬取歷史天氣

初衷十一回家走訪親戚，家長們聊關於附近工廠的事情。筆者家附近有一個清潔能源廠，同時還有一個水庫，這種複雜的空氣對流，夏季容易遭受冰雹的侵害。以水果謀生的農戶，躲得過人禍，免不了天災。筆者暗想，用一定的大資料分析，證明這兩種存在對當地的影響。於是有了此文。程式碼網上相關資

利用python的bs4和selenium庫結合實現動態頁面的爬取（爬取天氣網上面的歷史天氣資料）

報告分析需要歷史氣象資料，查詢到天氣網上面有歷史天氣資料，從2011年到2018年，第一次接觸爬蟲，在網上找了爬取天氣網歷史資料的python原始碼，利用bs4庫，但是實際操作中發現soup.select( )函式返回的列表總是[ ] （空），查詢發現天氣網目前使用的是javascript寫的動態頁

26、自動爬取每日的天氣，並定時把天氣數據和穿衣提示發送到你的郵箱

The sch run parser ali pri mes use content 自動爬取每日的天氣，並定時把天氣數據和穿衣提示發送到你的郵箱。之所以選擇這個相對樸實的爬蟲項目，是因為天氣每天都會有變化，那麽在學完這一關之後，不出意外，你就可以在明早收到天氣信

python爬取網易雲音樂歌單音樂

string attrs default textarea bsp color read contents dom 在網易雲音樂中第一頁歌單的url：http://music.163.com/#/discover/playlist/ 依次第二頁：http://music.1

python爬取七星彩的開獎歷史記錄

clas 程序代碼 aip dal zip file utf mage decode 1.因為人不可能一直無休止的學習，偶爾也想做點兒別的，昨天無聊就想寫寫Python，當然我承認我上班後基本都是在學工作方面的事情，在這個崗位我也呆了三年多了，還是那句話問我什麽會不會我會給

我用Python爬取網易雲音樂上的Hip-hop歌單，分析rapper如何押韻

line gone 謠言大致 -i 態度大眾其中當前緣起《中國有嘻哈》這個節目在這個夏天吸引了無數的目光，也讓嘻哈走進了大眾的視野。作為我今年看的唯一一個綜藝節目，它對我的影響也蠻大。這個夏天，我基本都在杭州度過，在上下班的taxi上，我幾乎都在刷這個節目，最後

Python爬取天氣網歷史天氣數據

相關推薦