python(四)網頁下載器

阿新 • • 發佈：2019-01-06

這裡寫圖片描述
網頁下載器有兩種:
1 urllib2 —Python官網基礎模組
2 requests —第三方包更強大

urllib2
最簡潔的方法
urllib2.urlopen(url)
這裡寫圖片描述

urllib2下載網頁方法2 :新增data,http header
這裡寫圖片描述

這裡寫圖片描述

urllib2方法3 :新增特殊情景的處理器
HTTPCookieProcessor :有些網站需要登入才可以使用,我們就用這個.
ProxyHandle:有些網頁需要代理才可用使用,我們用這個.
HTTPSHandler:有些網頁是使用HTTPS加密訪問的,我們使用這個
HTTPRedirectHandler:有些網頁URL自動跳轉的關係,我們使用這個.
這裡寫圖片描述

舉個coockie的栗子
這裡寫圖片描述

程式碼栗子:

import urllib.request,http.cookiejar

url = “http://www.baidu.com”
print(“第一種方法”)
response1 = urllib.request.urlopen(url)
print(response1.getcode())
print(len(response1.read()))

print(“第二種方法”)
request = urllib.request.Request(url)
request.add_header(“user-agent”, ‘Mozilla/5.0’)
response2 = urllib.request.urlopen(request)
print(response2.getcode())
print(len(response2.read()))

print(“第三種方法”)
cj = http.cookiejar.CookieJar()
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))
urllib.request.install_opener(opener)
response3 = urllib.request.urlopen(url)
print(response3.getcode())
print(cj)
print(response3.read())

學習自:慕課網

python(四)網頁下載器

python(四)網頁下載器

[Python] [爬蟲] 5.批量政府網站的招投標、中標資訊爬取和推送的自動化爬蟲——網頁下載器

爬蟲學習——網頁下載器和urllib2模塊

利用python內建下載器-快速分享檔案

網頁下載器urllib2例項

Python 爬蟲--網站下載器

Python網路爬蟲（四）：視訊下載器

以下三種下載方式有什麽不同？如何用python模擬下載器下載？

Python爬蟲(十四)_BeautifulSoup4 解析器

python學習1-Python內置下載服務器

python函數四（裝飾器進階）

Python學習(十四)--叠代器

python基礎四：裝飾器

記錄一次python抓取網頁下載視訊

[Python] [爬蟲] 6.批量政府網站的招投標、中標資訊爬取和推送的自動化爬蟲——網頁解析器

Python指令碼下載今日頭條視訊附加Android版本輔助下載器

利用Python打造一款一鍵下載器！管他是vip還是付費的！一鍵下載

Python任意指定下載網易雲歌曲，做個專屬播放器有何難？

python爬蟲自動下載網頁連結

Python音樂下載器(for QQ music)

python(四)網頁下載器

相關推薦