python中urllib, urllib2,urllib3, httplib,httplib2, request的區別

阿新 • • 發佈：2018-12-22

若只使用python3.X, 下面可以不看了, 記住有個urllib的庫就行了

python2.X 有這些庫名可用: urllib, urllib2, urllib3, httplib, httplib2, requests

python3.X 有這些庫名可用: urllib, urllib3, httplib2, requests

兩者都有的urllib3和requests, 它們不是標準庫. urllib3 提供執行緒安全連線池和檔案post支援,與urllib及urllib2的關係不大. requests 自稱HTTP for Humans, 使用更簡潔方便

對於python2.X:
urllib和urllib2的主要區別:

urllib2可以接受Request物件為URL設定頭資訊,修改使用者代理,設定cookie等, urllib只能接受一個普通的URL.
urllib提供一些比較原始基礎的方法而urllib2沒有這些, 比如 urlencode
urllib官方文件的幾個例子

使用帶引數的GET方法取回URL

import urllib
params = urllib.urlencode({'spam': 1, 'eggs': 2, 'bacon': 0})
f = urllib.urlopen("http://www.musi-cal.com/cgi-bin/query?%s" % params)
print f.read 
()

使用POST方法

import urllib
params = urllib.urlencode({'spam': 1, 'eggs': 2, 'bacon': 0})
f = urllib.urlopen("http://www.musi-cal.com/cgi-bin/query", params)
print f.read()

使用HTTP代理,自動跟蹤重定向

import urllib
proxies = {'http': 'http://proxy.example.com:8080/'}
opener = urllib.FancyURLopener(proxies)
f = opener.open 
("http://www.python.org")
f.read()

不使用代理

import urllib
opener = urllib.FancyURLopener({})
f = opener.open("http://www.python.org/")
f.read()

urllib2的幾個官方文件的例子:

GET一個URL

>>> import urllib2
>>> f = urllib2.urlopen('http://www.python.org/')
>>> print f.read()

使用基本的HTTP認證

import urllib2
auth_handler = urllib2.HTTPBasicAuthHandler()
auth_handler.add_password(realm='PDQ Application',
                          uri='https://mahler:8092/site-updates.py',
                          user='klem',
                          passwd='kadidd!ehopper')
opener = urllib2.build_opener(auth_handler)
urllib2.install_opener(opener)
urllib2.urlopen('http://www.example.com/login.html')

build_opener() 預設提供很多處理程式, 包括代理處理程式, 代理預設會被設定為環境變數所提供的.

一個使用代理的例子

proxy_handler = urllib2.ProxyHandler({'http': 'http://www.example.com:3128/'})
proxy_auth_handler = urllib2.ProxyBasicAuthHandler()
proxy_auth_handler.add_password('realm', 'host', 'username', 'password')

opener = urllib2.build_opener(proxy_handler, proxy_auth_handler)
opener.open('http://www.example.com/login.html')

新增HTTP請求頭部

import urllib2
req = urllib2.Request('http://www.example.com/')
req.add_header('Referer', 'http://www.python.org/')
r = urllib2.urlopen(req)

更改User-agent

import urllib2
opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
opener.open('http://www.example.com/')

httplib 和 httplib2 httplib 是http客戶端協議的實現,通常不直接使用, urllib是以httplib為基礎 httplib2 是第三方庫, 比httplib有更多特性

httplib比較底層，一般使用的話用urllib和urllib2即可

對於python3.X:
這裡urllib成了一個包, 此包分成了幾個模組,

urllib.request 用於開啟和讀取URL, 
urllib.error 用於處理前面request引起的異常, 
urllib.parse 用於解析URL, 
urllib.robotparser用於解析robots.txt檔案
python2.X 中的 urllib.urlopen()被廢棄, urllib2.urlopen()相當於python3.X中的urllib.request.urlopen()

幾個官方例子:

GET一個URL

import urllib.request
with urllib.request.urlopen('http://www.python.org/') as f:
...     print(f.read(300))

PUT一個請求

import urllib.request
DATA=b'some data'
req = urllib.request.Request(url='http://localhost:8080', data=DATA,method='PUT')
with urllib.request.urlopen(req) as f:
    pass
print(f.status)
print(f.reason)

基本的HTTP認證

import urllib.request
auth_handler = urllib.request.HTTPBasicAuthHandler()
auth_handler.add_password(realm='PDQ Application',
                          uri='https://mahler:8092/site-updates.py',
                          user='klem',
                          passwd='kadidd!ehopper')
opener = urllib.request.build_opener(auth_handler)
urllib.request.install_opener(opener)
urllib.request.urlopen('http://www.example.com/login.html')

使用proxy

proxy_handler = urllib.request.ProxyHandler({'http': 'http://www.example.com:3128/'})
proxy_auth_handler = urllib.request.ProxyBasicAuthHandler()
proxy_auth_handler.add_password('realm', 'host', 'username', 'password')

opener = urllib.request.build_opener(proxy_handler, proxy_auth_handler)
opener.open('http://www.example.com/login.html')

新增頭部

import urllib.request
req = urllib.request.Request('http://www.example.com/')
req.add_header('Referer', 'http://www.python.org/')
r = urllib.request.urlopen(req)

更改User-agent

import urllib.request
opener = urllib.request.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
opener.open('http://www.example.com/')

使用GET時設定URL的引數

>>> import urllib.request
>>> import urllib.parse
>>> params = urllib.parse.urlencode({'spam': 1, 'eggs': 2, 'bacon': 0})
>>> url = "http://www.musi-cal.com/cgi-bin/query?%s" % params
>>> with urllib.request.urlopen(url) as f:
...     print(f.read().decode('utf-8'))
...

使用POST時設定引數

>>> import urllib.request
>>> import urllib.parse
>>> data = urllib.parse.urlencode({'spam': 1, 'eggs': 2, 'bacon': 0})
>>> data = data.encode('ascii')
>>> with urllib.request.urlopen("http://requestb.in/xrbl82xr", data) as f:
...     print(f.read().decode('utf-8'))
...

指定proxy

>>> import urllib.request
>>> proxies = {'http': 'http://proxy.example.com:8080/'}
>>> opener = urllib.request.FancyURLopener(proxies)
>>> with opener.open("http://www.python.org") as f:
...     f.read().decode('utf-8')
...

不使用proxy, 覆蓋環境變數的proxy

>>> import urllib.request
>>> opener = urllib.request.FancyURLopener({})
>>> with opener.open("http://www.python.org/") as f:
...     f.read().decode('utf-8')
...

python2.X中的httplib被重新命名為 http.client

使用 2to3 工具轉換原始碼時, 會自動處理這幾個庫的匯入

總的來說, 使用python3, 記住只有urllib, 想要更簡潔好用就用requests, 但不夠通用

python中urllib, urllib2,urllib3, httplib,httplib2, request的區別

若只使用python3.X, 下面可以不看了, 記住有個urllib的庫就行了 python2.X 有這些庫名可用: urllib, urllib2, urllib3, httplib, httplib2, requests python3.X 有這些庫名可用: urllib, ur

Python中urllib.urlencode中文字符的一個問題

如果 ice pytho div win enc nbsp window gbk Django項目在訪問Restful service時調用urllib.urlencode編碼中文字符串時碰到下面這個錯誤、 v = quote_plus(str(v)) U

給Python中通過urllib2.urlopen獲取網頁的過程中，新增gzip的壓縮與解壓縮支援

之前已經實現了用Python獲取網頁的內容，相關已實現程式碼為： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35

Python 中利用urllib2簡單實現網頁抓取

網頁抓取就是把URL地址中指定的網路資源從網路流中讀取出來，儲存到本地。在Python中，可以使用urllib2這個模組來抓取網頁,模組提供了讀取web頁面資料的介面，我們可以像讀

Python中os與sys模塊的區別

mov clear maintain n) 安裝文件 join() pat 系統 os與sys模塊的官方解釋如下： os: This module provides a portable way of using operating system dependent

Python中threading的join和setDaemon的區別及用法

退出 mon comment ber .cn 結束必須用法方法 Python多線程編程時經常會用到join()和setDaemon()方法，基本用法如下： join([time]): 等待至線程中止。這阻塞調用線程直至線程的join() 方法被調用中止-正常退出或者

Python中sys和os模塊的區別

tro nes with span ren ocs acc input.h open() sys： This module provides access to some variables used or maintained by the interpreter an

python中type、class、object的區別

版本 src 同時 ati 創建內置 lis dict 之間 type 一、 type可以用來返回一個對象的類型例如：二、由於Python中一切皆對象，也就是說Python中的任何變量類型都是可以被修改的，這也是Python等動態編程語言的特點。type的基類是o

python 中迭代和遍歷的區別

什麼是迭代？迭代就是重複執行一段程式碼語句塊的能力。分為兩種方式使用遞迴函式使用迴圈(for 或 while 迴圈）假設有個需求，要按照降序列印10以下(包括10）,0 以上的整數,用遞迴和迴圈都可以實現，但都要重複執行一段程式碼語句，就是迭代。遞迴函式實現先看使用遞迴函式

python中init()方法和new()方法的區別

new()理解： class A(object): def __init__(self,*args,**kwargs): print "init &&&& %s" % self.__class__ def __new__(

python中range、xrange、arange的區別

1、range() range多用作迴圈，格式：range（start,end,step），返回的是一個range物件。例如： for i in range(10,20,2): print(i) 輸出： 10 12 14 16 18 如想返回一個list，

python 中 '/' 和 '//'的區別

上述兩種符號可以總結為兩種形式 A/B ：返回整個商的值 A//B：返回結果的最小整數例程： >>> 9/2 4.5 >>> 9//2 4 >>> 3//0.5 6.0 >>> 7//0.3 23.0 >

Python中單、雙下劃線的區別總結

前言 Python 的程式碼風格由 PEP 8 描述。這個文件描述了 Python 程式設計風格的方方面面。在遵守這個文件的條件下，不同程式設計師編寫的 Python 程式碼可以保持最大程度的相似風格。這樣就易於閱讀，易於在程式設計師之間交流。我們大家在學習Python的時候，好像

python中filter、map、reduce的區別

python中有一些非常有趣的函式，今天也來總結一下，不過該類的網上資料也相當多，也沒多少乾貨，只是習慣性將一些容易遺忘的功能進行整理。 lambda 為關鍵字。filter，map，reduce為內建函式。 lambda：實現python中單行最小函式。 g = lambda x:

Python基礎學習-Python中最常見括號()、[]、{}的區別

數字分別是 {} 一個準備 dict 希望基礎 list Python中最常見括號的區別：在Python語言中最常見的括號有三種，分別是：小括號（）、中括號[]、花括號{}；其作用也不相同，分別用來代表不同的Python基本內置數據類型。 Python中的小括號（）

python中氣泡排序和選擇排序及其區別

氣泡排序：每次去相鄰的兩個元素比較，不合適就交換，依次向後選擇排序：將第一個元素和後面的元素挨個輪流比較，如果按照從小到大排序，大的排序往後面 #排序函式 def paixu(li): for j in range(1, len(li)): #j是外層迴

Python中threading的join和setDaemon的區別及用法［例子］

Python多執行緒程式設計時，經常會用到join()和setDaemon()方法，今天特地研究了一下兩者的區別。 1、join ()方法：主執行緒A中，建立了子執行緒B，並且在主執行緒A中呼叫了B.join()，那麼，主執行緒A會在呼叫的地方等待，直到子執行

python 中的閉包與函式的區別

定義：（重點在定義）在外部函式裡面定義一個內部函式，並且這個內部函式用到了外部函式的變數，那麼將這個內部函式和用到的一些變數統稱為閉包。首先看一個閉包的例項： def lines(a, b):

Python中 is同一性運算子和==相等運算子區別

Python中有很多運算子，今天我們就來講講is和==兩種運算子在應用上的本質區別是什麼。在講is和==這兩種運算子區別之前，首先要知道Python中物件包含的三個基本要素，分別是：id(身份標識)、python type()(資料型別)和value(值)。is和==都是

Python中os模組和sys模組的區別

首先，官方解釋是這樣的： os: This module provides a portable way of using operating system dependent functionality. 這個模組提供了一種方便的使用作業系統函式的方法。 sy

python中urllib, urllib2,urllib3, httplib,httplib2, request的區別

相關推薦