python urllib 庫

阿新 • • 發佈：2017-06-20

由於 con items name html png aid post work

urllib模塊中的方法

1.urllib.urlopen(url[,data[,proxies]])

打開一個url的方法，返回一個文件對象，然後可以進行類似文件對象的操作。本例試著打開google

>>> import urllib
>>> f = urllib.urlopen(‘http://www.google.com.hk/‘)
>>> firstLine = f.readline()   #讀取html頁面的第一行
>>> firstLine
‘<!doctype html><html itemscope="" itemtype="http://schema.org/WebPage"><head><meta content="/images/google_favicon_128.png" itemprop="image"><title>Google</title><script>(function(){\n‘

urlopen返回對象提供方法：

- read() , readline() ,readlines() , fileno() , close() ：這些方法的使用方式與文件對象完全一樣

- info()：返回一個httplib.HTTPMessage對象，表示遠程服務器返回的頭信息

- getcode()：返回Http狀態碼。如果是http請求，200請求成功完成;404網址未找到

- geturl()：返回請求的url

2.urllib.urlretrieve(url[,filename[,reporthook[,data]]])

urlretrieve方法將url定位到的html文件下載到你本地的硬盤中。如果不指定filename，則會存為臨時文件。

urlretrieve()返回一個二元組(filename,mine_hdrs)

臨時存放：

>>> filename = urllib.urlretrieve(‘http://www.google.com.hk/‘)
>>> type(filename)
<type ‘tuple‘>
>>> filename[0]
‘/tmp/tmp8eVLjq‘
>>> filename[1]
<httplib.HTTPMessage instance at 0xb6a363ec>

存為本地文件:

>>> filename = urllib.urlretrieve(‘http://www.google.com.hk/‘,filename=‘/home/dzhwen/python文件/Homework/urllib/google.html‘)
>>> type(filename)
<type ‘tuple‘>
>>> filename[0]
‘/home/dzhwen/python\xe6\x96\x87\xe4\xbb\xb6/Homework/urllib/google.html‘
>>> filename[1]
<httplib.HTTPMessage instance at 0xb6e2c38c>

3.urllib.urlcleanup()

清除由於urllib.urlretrieve()所產生的緩存

4.urllib.quote(url)和urllib.quote_plus(url)

將url數據獲取之後，並將其編碼，從而適用與URL字符串中，使其能被打印和被web服務器接受。

>>> urllib.quote(‘http://www.baidu.com‘)
‘http%3A//www.baidu.com‘
>>> urllib.quote_plus(‘http://www.baidu.com‘)
‘http%3A%2F%2Fwww.baidu.com‘

5.urllib.unquote(url)和urllib.unquote_plus(url)

與4的函數相反。

6.urllib.urlencode(query)

將URL中的鍵值對以連接符&劃分

這裏可以與urlopen結合以實現post方法和get方法：

GET方法：

>>> import urllib
>>> params=urllib.urlencode({‘spam‘:1,‘eggs‘:2,‘bacon‘:0})
>>> params
‘eggs=2&bacon=0&spam=1‘
>>> f=urllib.urlopen("http://python.org/query?%s" % params)
>>> print f.read()

POST方法：

>>> import urllib
>>> parmas = urllib.urlencode({‘spam‘:1,‘eggs‘:2,‘bacon‘:0})
>>> f=urllib.urlopen("http://python.org/query",parmas)
>>> f.read()

基本就這些，關於對象獲取的方法就不贅述了。

python urllib 庫

由於 con items name html png aid post work urllib模塊中的方法 1.urllib.urlopen(url[,data[,proxies]]) 打開一個url的方法，返回一個文件對象，然後可以進行類似文件對象的操作。本例試著打開go

python urllib庫

一個 err 局域網可選 html 完全 urllib2 www 本地文件 python2和python3中的urllib urllib提供了一個高級的 Web 通信庫，支持基本的 Web 協議，如 HTTP、FTP 和 Gopher 協議，同時也支持對本地文件的訪問。

python urllib庫使用

urllib是python中的內建庫，為從全球資訊網中抓取資料提供相關的介面。在使用python編寫爬蟲時經常會接觸到這個庫。下面介紹一下urllib庫中的一些方法及相應的例項。 urllib.urlopen(url[, data[, proxies]]) :

python—urllib庫的使用

Urllib庫 """ python 內建的HTTP請求庫 urllib.request 請求模組 urllib.error 異常處理模組 urllib.parse url解析模組 urllib.robotparser robots.txt 解析模組 """ # python2 im

python-urllib庫學習筆記

import urllib.request, urllib.parse ''' urllib常用的請求語句 ''' url = '' # 傳送請求 res = urllib.request.urlopen(url=url) # 讀取請求到的內容 res.read().de

Python爬蟲入門三之Urllib庫的基本使用

res 瀏覽器中必須答案文件的網頁 one .com 屏幕截圖 1.分分鐘扒一個網頁下來怎樣扒網頁呢？其實就是根據URL來獲取它的網頁信息，雖然我們在瀏覽器中看到的是一幅幅優美的畫面，但是其實是由瀏覽器解釋才呈現出來的，實質它是一段HTML代碼，加 JS、CSS

Python爬蟲入門：Urllib庫的基本使用

logs 模擬第一個 tps 出了訪問方式 post方式 %d 一段 1.分分鐘扒一個網頁下來怎樣扒網頁呢？其實就是根據URL來獲取它的網頁信息，雖然我們在瀏覽器中看到的是一幅幅優美的畫面，但是其實是由瀏覽器解釋才呈現出來的，實質它是一段HTML代碼，加 JS、

python爬蟲 urllib庫基本使用

afa 識別 urllib spa response aid gen odin pos 以下內容均為python3.6.*代碼學習爬蟲，首先有學會使用urllib庫，這個庫可以方便的使我們解析網頁的內容，本篇講一下它的基本用法解析網頁 #導入urllib from u

Python爬蟲學習筆記（一）——urllib庫的使用

scheme param https ade 網站 dmgr nor 分享圖片 out 前言我買了崔慶才的《Python3網絡爬蟲開發實戰》，趁著短學期，準備系統地學習下網絡爬蟲。在學習這本書的同時，通過博客摘錄並總結知識點，同時也督促自己每日學習。本書第一章是開發環境的

【Python爬蟲學習筆記2】urllib庫的基本使用

代理服務 cor proc 技術 origin car windows tpc -c urllib庫是python內置的實現HTTP請求的基本庫，通過它可以模擬瀏覽器的行為，向指定的服務器發送一個請求，並保存服務器返回的數據。 urlopen函數函數原型：urlopen(

Urllib庫：python內建的http請求庫

1、四個模組： request error parse robotparser 2、urlopen(url, data, timeout) 傳送請求 get請求無data； post請求有data 3、read() 獲取響應體的內容 4、Handl

python爬蟲urllib庫使用

urllib包括以下四個模組：　　1.request:基本的HTTP請求模組，可以用來模擬傳送請求。就像在瀏覽器裡輸入網址然後回車一樣，只需要給庫方法傳入URL以及額外的引數，就可以模擬實現這個過程。　　2.error：異常處理模組　　3.parse：提供了許多URL處理方法，如拆分、解析、合併等

python 標準庫 urllib

urllib.request.urlretrieve(url, filename=None) 將url所指向的網路檔案複製到本地。將返回一個tuple，元組()(filename，HTTPMessage)，其中filename是下載後的本地檔名，HTTPMessage包含了相關資訊。

Python：Urllib庫使用

import urllib response = urllib.request.urlopen("https://www.python.org") #返回響應的狀態碼 print(response.status) #返回響應的頭資訊 print(response.ge

Python爬蟲系列-Urllib庫詳解

Urllib庫詳解 Python內建的Http請求庫: * urllib.request 請求模組 * urllib.error 異常處理模組 * urllib.parse url解析模組 * urllib.robotparser robots.txt解析模組 #### 相比在python2基礎上的變化

Python爬蟲之Urllib庫的基本使用

狀態碼 chrom 異常處理 false 基本 sta col thead kit # get請求 import urllib.request response = urllib.request.urlopen("http://www.baidu.com") print(

Python爬蟲第三篇--Urllib庫

簡介 Python內建的HTTP請求庫 urllib.request 請求模組 urllib.error 異常處理模組 urllib.parse url 解析模組 urllib.robotparser robots.txt解析模組 urlopen

python爬蟲urllib庫詳解

什麼是Urllib Urllib是python內建的HTTP請求庫，中文文件如下：https://docs.python.org/3/library/urllib.html包括以下模組urllib.request 請求模組urllib.error 異常處理模組urllib.parse url解析模組urll

Python常用庫urllib中urllib.request模組使用詳解

1.urllib2和urllib庫的區別 Urllib庫是Python中的一個功能強大、用於操作URL，並在做爬蟲的時候經常要用到的庫。在Python2.x中，分為Urllib庫和Urllin2庫，P

python 網路爬蟲入門-Urllib庫的基本使用

學習來源：http://www.cnblogs.com/xin-xin/p/4297852.html 1.分分鐘扒一個網頁下來 import urllib2 response = urllib2.urlopen("http://www.baidu.com") print respon

python urllib 庫

urllib模塊中的方法

1.urllib.urlopen(url[,data[,proxies]])

2.urllib.urlretrieve(url[,filename[,reporthook[,data]]])

3.urllib.urlcleanup()

4.urllib.quote(url)和urllib.quote_plus(url)

5.urllib.unquote(url)和urllib.unquote_plus(url)

6.urllib.urlencode(query)

相關推薦