Python urllib.request物件案例解析

阿新 • • 發佈：2020-05-12

剛剛接觸爬蟲，基礎的東西得時時回顧才行，這麼全面的帖子無論如何也得厚著臉皮轉過來啊！

什麼是 Urllib 庫？

urllib 庫是 Python 內建的 HTTP 請求庫。urllib 模組提供的上層介面，使訪問 www 和 ftp 上的資料就像訪問本地檔案一樣。

有以下幾種模組：

1.urllib.request 請求模組

2. urllib.error 異常處理模組

3. urllib.parse url 解析模組

4. urllib.robotparser robots.txt 解析模組

Urllib 庫下的幾種模組基本使用如下：

urllib.request

關於 urllib.request： urllib.request 模組提供了最基本的構造 HTTP （或其他協議如 FTP）請求的方法，利用它可以模擬瀏覽器的一個請求發起過程。利用不同的協議去獲取 URL 資訊。它的某些介面能夠處理基礎認證（ Basic Authenticaton）、redirections （HTTP 重定向)、 Cookies (瀏覽器 Cookies）等情況。而這些介面是由 handlers 和 openers 物件提供的。

1.常用的方法有

　　read()==讀取檔案內容
　　geturl()==獲取請求url
　　getheaders()==獲取http請求頭資訊
　　getcode()==獲取狀態碼
　　readlines()==獲取一行

2.案例

#coding=utf-8
#import urllib.request
#=========response方法使用
#read()==讀取檔案內容
#geturl()==獲取請求url
#getheaders()==獲取http請求頭資訊
#getcode()==獲取狀態碼
#readlines()==獲取一行
#url="http://www.baidu.com";
#response = urllib.request.urlopen(url);
#=====案例1
# str = response.read().decode();#這樣通過decode轉換為utf8
# with open("baidu.html","w",encoding="utf8") as fp:
#   fp.write(str);
#=====案例2通過位元組流寫=預設通過read讀取的是位元組流
# with open("bai.html","wb") as fp:
#   fp.write(response.read()); 
#==使用位元組流讀取存圖片
# image_url='https://ss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=3772530225,1800402028&fm=26&gp=0.jpg';
# response = urllib.request.urlopen(image_url);
# with open("mv.jpg",'wb') as fp:
#   fp.write(response.read());
#案例3==使用內建函式讀取圖片
#image_url='https://ss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=3772530225,1800402028&fm=26&gp=0.jpg';
#urllib.request.urlretrieve(image_url,"chun.jpg");

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支援我們。

Python urllib.request物件案例解析

剛剛接觸爬蟲，基礎的東西得時時回顧才行，這麼全面的帖子無論如何也得厚著臉皮轉過來啊！

Python urllib request模組傳送請求實現過程解析

1.Request()的引數 import urllib.request request=urllib.request.Request(\'https://python.org\') response=urllib.request.urlopen(request)

Python OrderedDict的使用案例解析

這篇文章主要介紹了Python OrderedDict的使用案例,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python集合常見運算案例解析

本文例項講述了python集合常見運算。分享給大家供大家參考，具體如下： python生成不重複隨機數放在列表中的效率比較

python urllib爬蟲模組使用解析

前言網路爬蟲也稱為網路蜘蛛、網路機器人，抓取網路的資料。其實就是用Python程式模仿人點選瀏覽器並訪問網站，而且模仿的越逼真越好。一般爬取資料的目的主要是用來做資料分析，或者公司專案做資料測試，公司業務所

Python使用pyexecjs程式碼案例解析

針對現在大部分的網站都是使用js加密，js載入的，並不能直接抓取出來，這時候就不得不適用一些三方類庫來執行js語句

python:urllib:HTTPResponse物件的用法

不管是使用urllib.request.urlopen()方法，還是使用opener.open()方法，都返回同樣型別的HTTPResponse物件，用法總結如下:

python協程gevent案例爬取鬥魚圖片過程解析

分析分析網站尋找需要的網址用谷歌瀏覽器摁F12開啟開發者工具，然後開啟鬥魚顏值分類的頁面，如圖：

Python可變物件與不可變物件原理解析

一、原理可變物件：list dict set 不可變物件：tuple string int float bool 1. python不允許程式設計師選擇採用傳值還是傳引用。Python引數傳遞採用的肯定是“傳物件引用”的方式。實際上，這種方式相當於傳值和

Python小整數物件池和字串intern例項解析

is用於判斷兩個物件是否為同一個物件，具體來說是兩個物件在記憶體中的位置是否相同。

python中urllib.request和requests的使用及區別詳解

urllib.request 我們都知道，urlopen()方法能發起最基本對的請求發起，但僅僅這些在我們的實際應用中一般都是不夠的，可能我們需要加入headers之類的引數,那需要用功能更為強大的Request類來構建了

Python基於codecs模組實現檔案讀寫案例解析

codecs在讀取檔案時，發生錯誤： UnicodeDecodeError: \'utf-8\' codec can\'t decode byte 0xbe in position 0: invalid start byte

Python引數傳遞物件的引用原理解析

大家都知道在python中，一切皆物件，變數也不再具有型別，變數僅僅是物件的一個引用，我們通常用變數來測型別，通常測得就是被這個變數引用得物件的型別。

python建造者模式案例執行原理解析

建造者模式的適用範圍：想要建立一個由多個部分組成的物件，而且它的構成需要一步接一步的完成。只有當各個部分都完成了，這個物件才完整。建造者模式表現為複雜物件的建立與表現相分離，這樣，同一個過程就有不同的

python 爬蟲 02-urllib+request

1. urllib.request模組 1.1 版本 python2 ：urllib2、urllib python3 ：把urllib和urllib2合併,urllib.request

tornado之request物件解析

tornado之request物件解析 import tornado.ioloop import tornado.httpserver import tornado.options import tornado.web

【Python基礎程式設計212 ● 面向物件 ● 面向物件案例：烤紅薯】

---------Python基礎程式設計--------- Author : AI菌【內容講解】 1.__del__()是一個魔法方法,del前有兩個橫線，後也有兩個橫線2.這個方法，當物件被刪除時，會自動被呼叫

【Python基礎程式設計214 ● 面向物件 ● 面向物件案例：存放傢俱】

---------Python基礎程式設計--------- Author : AI菌【學習目標】 1.強化面向物件的設計能力，進一步理解類、屬性和方法2.強化方法引數self的理解。方法中的self可以獲取和修改屬性

Python urllib庫如何新增headers過程解析

對於請求一些網站，我們需要加上請求頭才可以完成網頁的抓取，不然會得到一些錯誤，無法返回抓取的網頁。下面，介紹兩種新增請求頭的方法。

通過案例解析python鴨子型別相關原理

首先Python不支援多型，也不用支援多型，python是一種多型語言，崇尚鴨子型別。

Python urllib.request物件案例解析

相關推薦