Python 爬蟲實現簡單例子（爬取某個頁面）

阿新 • • 發佈：2019-01-10

Python爬蟲最簡單實現

#!/usr/bin/env python
#coding=utf-8
import urllib
import urllib2
def login():
    url = 'https://www.oschina.net/action/user/hash_login'
    values= {'userMail':'[email protected]','userPassword':'123456'}
    headers = {'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X10_11_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87Safari/537.36'

}
    data = urllib.urlencode(values)
    request = urllib2.Request(url=url,data=data,headers=headers)
    response = urllib2.urlopen(request)
    printresponse.read()
if __name__ == "__main__":
    login()

urllib.urlencode來對輸入的資料進行格式化，urllib2.urlopen後面既可以是一個request物件又可以是一個URL的字串。但是推薦使用的是request物件，因為這樣看起來比較清楚，從建立請求傳入引數，都是比較清晰的。最後對爬到的網頁內容進行輸出即可。

note：在上面的程式中加上了header資訊，並不是所有的網站都是需要加的，但是有些網站禁止爬蟲來爬取這些資訊，所以加上這些資訊之後我們就可以偽造成瀏覽器的訪問請求了。

Python 爬蟲實現簡單例子（爬取某個頁面）

Python 爬蟲實現簡單例子（爬取某個頁面）

Python 爬蟲簡單實現（爬取下載連結）

python之簡單爬蟲（爬取豆瓣出版社）

python爬蟲（爬取豆瓣電影）_動態網頁,json解釋,中文編碼

Python——網路爬蟲（爬取網頁圖片）

python爬蟲（爬取彈幕）

大神教你如果學習Python爬蟲如何才能高效地爬取海量數據

【Python爬蟲】從html裏爬取中國大學排名

python爬蟲-20行代碼爬取王者榮耀所有英雄圖片，小白也輕輕松松

Python爬蟲初探 - selenium+beautifulsoup4+chromedriver爬取需要登錄的網頁信息

【Python爬蟲實戰專案一】爬取大眾點評團購詳情及團購評論

Python爬蟲實習筆記 | Week3 資料爬取和正則再學習

Python爬蟲系列之小說網爬取

Python 3.5_簡單上手、爬取百度圖片的高清原圖 Python 3.5_簡單上手、爬取百度圖片的高清原圖

Python爬蟲實戰 requests+beautifulsoup+ajax 爬取半次元Top100的cos美圖

Python爬蟲入門之豆瓣短評爬取

Python爬蟲-利用正則表示式爬取貓眼電影

Python爬蟲(二十)_動態爬取影評信息

python爬蟲建立代理池，爬取5000個代理IP並進行驗證！

python爬蟲學習筆記分析Ajax爬取果殼網文章

Python 爬蟲實現簡單例子（爬取某個頁面）

相關推薦