python爬蟲的urllib與requests的對比

阿新 • • 發佈：2018-12-31

關於爬蟲，python中就有很多相關的包，今天我們就來介紹一下urllib與requests的區別，以爬取百度翻譯為例，首先我們訪問百度翻譯，F12，瞭解到使用的方法為post，好了不多說了上程式碼

###urllib

from  urllib import request,parse
import json
if __name__ == '__main__':
    while True:
        baseurl = 'http://fanyi.baidu.com/sug'
        keyword = input('請輸入你要查詢的單詞：')
        data = {
            'kw': keyword
        }
        data = parse.urlencode(data).encode()  # 需要給資料編碼，現在data是bytes格式，
        #除錯用的的話可以輸入以下程式碼(已註釋）
        #data = parse.urlencode(data)
        #print(data)

        rsp = request.urlopen(baseurl, data=data)
        json_data = rsp.read().decode()#解碼後的資料是json格式，所以要import json
        #print(json_data)
        json_data = json.loads(json_data)
        for i in json_data['data']:
            print(i['k'], '---->', i['v'])

-------------------------------------------------------------------------------------------------------------------------------------------------------------

#####requests

import requests
if __name__ == '__main__':
    while True:
        baseurl = 'http://fanyi.baidu.com/sug'
        keyword = input('請輸入你要查詢的單詞：')
        data = {
            'kw': keyword
        }
        #這裡不用給data進行編碼
        #但是下面要指明post方法
        #rsp=requests.request('post',url=baseurl,data=data)
        #上下兩程式碼等價
        rsp = requests.post(url=baseurl, data=data)
        #而這裡也不用匯入 json模組，直接使用物件的json（）方法即可
        json_data = rsp.json()
        for i in json_data['data']:
            print(i['k'], '---->', i['v'])
總的來說，requests將urlib進行了更高階的封裝，不用人為的編碼解碼，將其自動化，

python爬蟲的urllib與requests的對比

關於爬蟲，python中就有很多相關的包，今天我們就來介紹一下urllib與requests的區別，以爬取百度翻譯為例，首先我們訪問百度翻譯，F12，瞭解到使用的方法為post，好了不多說了上程式碼 ###urllib from urllib import reque

1.0 -Python爬蟲-Urllib/Requests

0 爬蟲準備工作參考資料 python網路資料採集，圖靈工業出版精通Python爬蟲框架Scrapy，人民郵電出版社 Python3網路爬蟲 Scrapy官方教程前提知識 url http協議 web前端，h

從零開始寫Python爬蟲 --- 1.1 requests庫的安裝與使用

從零開始寫Python爬蟲 --- 1.1 requests庫的安裝與使用先來說說爬蟲的原理：爬蟲本質上是模擬人瀏覽資訊的過程，只不過他通過計算機來達到快速抓取篩選資訊的目的。所以我們想要寫一個爬蟲，最基本的就是要將我們需要抓取資訊的網頁原

python 爬蟲urllib基礎示例

urllib 爬蟲基礎環境使用python3.5.2 urllib3-1.22 下載安裝wget https://www.python.org/ftp/python/3.5.2/Python-3.5.2.tgztar -zxf Python-3.5.2.tgzcd Python-3.5.2/./

Python爬蟲-urllib的基本用法

quest resp lan roc 用法 rom handler baidu github from urllib import response,request,parse,error from http import cookiejar if __name__

Python爬蟲基礎與技巧

修改 request對象 enc 語言是我 res 加密 firefox int 基於Python2.71 基本抓取網頁get 方法import urllib2url = "http://www.baidu.com"response = urllib2

python爬蟲 urllib庫基本使用

afa 識別 urllib spa response aid gen odin pos 以下內容均為python3.6.*代碼學習爬蟲，首先有學會使用urllib庫，這個庫可以方便的使我們解析網頁的內容，本篇講一下它的基本用法解析網頁 #導入urllib from u

python爬蟲urllib庫使用

urllib包括以下四個模組：　　1.request:基本的HTTP請求模組，可以用來模擬傳送請求。就像在瀏覽器裡輸入網址然後回車一樣，只需要給庫方法傳入URL以及額外的引數，就可以模擬實現這個過程。　　2.error：異常處理模組　　3.parse：提供了許多URL處理方法，如拆分、解析、合併等

python 爬蟲proxy,BeautifulSoup+requests+mysql 爬取樣例

實現思路：由於反扒機制，所以需要做代理切換，去爬取，內容通過BeautifulSoup去解析，最後入mysql庫 1.在西刺免費代理網獲取代理ip，並自我檢測是否可用 2.根據獲取的可用代理ip去傳送requests模組的請求，帶上代理 3.內容入庫注：日

python爬蟲學習筆記-requests用法

python內建的urllib在某些高階應用時存在很多不方便的地方且功能似乎也沒有想象的那麼強大，於是更為強大第三方庫requests庫應運而生，有了它，cookies，代理，登陸操作都是簡化很多。首先確認安裝requests庫： pip install requests 1.類

Python爬蟲實戰之Requests+正則表示式爬取貓眼電影Top100

import requests from requests.exceptions import RequestException import re import json # from multiprocessing import Pool # 測試了下這裡需要自己新增頭部否則得不到網頁 hea

Python 爬蟲 urllib模組：get方式

本程式以爬取百度首頁為例格式：匯入urllib.request 開啟爬取的網頁: response = urllib.request.urlopen('網址') 讀取網頁程式碼: html = response.read() 列印:

Python 爬蟲 urllib模組：post方式

本程式以爬取 'http://httpbin.org/post' 為例格式：匯入urllib.request 匯入urllib.parse 資料編碼處理，再設為utf-8編碼: bytes(urllib.parse.urlenco

Python爬蟲--urllib

urllib包含模組： -urllib.request：開啟和讀取urls -urllib.error：包含urllib.request產生的常見的錯誤，使用try捕捉

python爬蟲urllib庫詳解

什麼是Urllib Urllib是python內建的HTTP請求庫，中文文件如下：https://docs.python.org/3/library/urllib.html包括以下模組urllib.request 請求模組urllib.error 異常處理模組urllib.parse url解析模組urll

python爬蟲#網路請求requests庫

中文文件 http://docs.python-requests.org/zh_CN/latest/user/quickstart.html requests庫雖然Python的標準庫中 urllib模組已經包含了平常我們使用的大多數功能，但是它的 API 使用起來讓人感覺不太好，而 Requests宣傳是

Python爬蟲就業與發展前景解析

關於爬蟲的技術要求：爬蟲掌握熟練的話，包括簡單的mysql語句、html和css簡單的知識以及最厲害的scrapy爬蟲框架，基本上就可以去嘗試海投一下爬蟲崗位。關於上面的問題，分兩部分來說。 1、爬蟲教程多：確實，因為只考慮爬

Python 爬蟲 --- urllib

-s 屬性 proc tpc urlopen fire res win mat 對於互聯網數據，Python 有很多處理網絡協議的工具，urllib 是很常用的一種。一、urllib.request，request 可以很方便的抓取 URL 內容。 urllib.req

Python爬蟲：使用requests庫下載大檔案

當使用requests的get下載大檔案/資料時，建議使用使用stream模式。當把get函式的stream引數設定成False時，它會立即開始下載檔案並放到記憶體中，如果檔案過大，有可能導致記憶體不足。當把get函式的stream引數設定成True時，它不

Python爬蟲開發與專案實戰 3: 初識爬蟲

3.1 網路爬蟲概述概念：按照系統結構和實現技術，大致可分：通用網路爬蟲、聚焦爬蟲、增量式爬蟲、深層爬蟲。實際的爬蟲系統通常是幾種技術的相結合實現的。搜尋引擎：屬於通用爬蟲，但存在一定的侷限性：

python爬蟲的urllib與requests的對比

相關推薦