Python中的requests模組

阿新 • • 發佈：2018-12-04

Python中的Requests模組

Requests模組是一個用於網路訪問的模組，類似的模組有urllib，urllib2，httplib，httplib2等，但由於其訪問http時的人性化，便於操作，深受人們喜歡。

在爬蟲中常使用的模組：

獲取網頁內容的----- urllib, requests

分析網頁常用的模組------ re, bs4(beautifulsoup4)

1. 例項引入

使用get方法獲得響應物件Response，我們可以利用這個物件得到我們想要的任何資訊。

# 例項引入
import requests
url = 'http://www.baidu.com'
response = requests.get(url)

print('1',response)
print('2',response.status_code)       # 獲得響應狀態碼
print('3',response.cookies)           # 獲得網頁cookies資訊
print('4',response.text)			  # 獲得網頁內容
print('5',type(response.text))        # 獲得網頁內容的型別

在這裡插入圖片描述

2.常見的請求方式

除了`get`方法之外。`Requests`還包括兩種請求方法`post`和`delete`方法。

import requests

response = requests.post('http://httpbin.org/post', data={'name' : 'xxxxxxx', 'age':18})
print(response.text)			
response = requests.delete('http://httpbin.org/delete', data={'name' : 'xxxxxxx'})
print(response.text)

由例子可知，`post`

方法請求引數是通過data引數來傳遞的。

在這裡插入圖片描述

`delete`方法也通過data引數來傳遞請求引數。

在這裡插入圖片描述

3.帶引數的`get`請求

get引數是以params關鍵字引數傳遞的

#帶引數的get請求
url1 = 'https://movie.douban.com/subject/4864908/comments?start=20&limit=20&sort=new_score&status=P'
import  requests
data = {
    'start': 20,
    'limit': 40,
    'sort': 'new_score',
    'status': 'P',
}
url = 'https://movie.douban.com/subject/4864908/comment'
response = requests.get(url, params=data)
print(response.url)

在這裡插入圖片描述

4.解析json格式

JSON(JavaScript Object Notation, JS 物件簡譜) 是一種輕量級的資料交換格式。它基於 ECMAScript (歐洲計算機協會制定的js規範)的一個子集，採用完全獨立於程式語言的文字格式來儲存和表示資料。簡潔和清晰的層次結構使得 JSON 成為理想的資料交換語言。易於人閱讀和編寫，同時也易於機器解析和生成，並有效地提升網路傳輸效率。

import requests
# ip = '8.8.8.8'
ip = input("請輸入查詢的IP：")
url = "http://ip.taobao.com/service/getIpInfo.php?ip=%s" %(ip)
response = requests.get(url)
content  = response.json()
print(content)
print(type(content))

在這裡插入圖片描述

5.獲取二進位制資訊

# 獲取二進位制資料
import requests
url = 'https://gss0.bdstatic.com/-4o3dSag_xI4khGkpoWK1HF6hhy/baike/w%3D268%3Bg%3D0/sign=4f7bf38ac3fc1e17fdbf8b3772ab913e/d4628535e5dde7119c3d076aabefce1b9c1661ba.jpg'
response = requests.get(url)
print(response.text)

with open('github.png', 'wb') as f:
    # response.text ： 返回字串的頁面資訊
    # response.content ： 返回bytes的頁面資訊
    f.write(response.content)

在這裡插入圖片描述

寫入影象中效果：

在這裡插入圖片描述

6.下載視訊

import requests
# url = 'https://gss0.bdstatic.com/-4o3dSag_xI4khGkpoWK1HF6hhy/baike/w%3D268%3Bg%3D0/sign=4f7bf38ac3fc1e17fdbf8b3772ab913e/d4628535e5dde7119c3d076aabefce1b9c1661ba.jpg'
url = "http://gslb.miaopai.com/stream/sJvqGN6gdTP-sWKjALzuItr7mWMiva-zduKwuw__.mp4"
response = requests.get(url)
with open('/tmp/learn.mp4', 'wb') as f:
    # response.text ： 返回字串的頁面資訊
    # response.content ： 返回bytes的頁面資訊
    f.write(response.content)

下載成功

在這裡插入圖片描述

7.新增headers資訊

在get引數中田間header資訊

import requests

url = 'http://www.cbrc.gov.cn/chinese/jrjg/index.html'
user_agent = 'Mozilla/5.0 (X11; Linux x86_64; rv:45.0) Gecko/20100101 Firefox/45.0'
headers = {
    'User-Agent': user_agent
}
response = requests.get(url, headers=headers)
print(response.text)
print(response.status_code)

使得之前需要使用好幾步urlopen方法的偽裝瀏覽器操作變得只需在`get`方法中加入header引數即可。

在這裡插入圖片描述

8.上傳檔案

import  requests
# 上傳的資料資訊(字典儲存)
data = {'file':open('github.png', 'rb')}
response = requests.post('http://httpbin.org/post', files=data)
print(response.text)

使用[http://httpbin.org/post]網站返回的值確定可上傳檔案
在這裡插入圖片描述

9.獲取cookie資訊

import  requests
# 上傳的資料資訊(字典儲存)
response = requests.get('http://www.csdn.net')
print(response.cookies)
for key, value in response.cookies.items():
    print(key + "=" + value)

在這裡插入圖片描述

10.讀取已經存在的cookie資訊訪問網址內容(會話維持)

import  requests
# 上傳的資料資訊(字典儲存)
# 設定一個cookie: name='westos'
s = requests.session()
response1 = s.get('http://httpbin.org/cookies/set/name/villa')
response2 = s.get('http://httpbin.org/cookies')
print(response2.text)

在這裡插入圖片描述

11.忽略證書驗證

由於很多網站在爬取時會碰到需要證書驗證的問題，在`get`方法中加入`verify=False`可忽略證書驗證

在沒有加入忽略引數時，即無法訪問

# 忽略證書驗證
import  requests
url = 'https://www.12306.cn'
response = requests.get(url)
print(response.status_code)
print(response.text)

在這裡插入圖片描述

新增忽略引數之後

# 忽略證書驗證
import  requests
url = 'https://www.12306.cn'
response = requests.get(url, verify=False)
print(response.status_code)
print(response.text)

在這裡插入圖片描述

12.代理設定(`proxies=proxy`)/設定超時間(`timeout=sec`)

# 代理設定/設定超時間
import requests

proxy = {
    'https': '171.221.239.11:808',
    'http': '218.14.115.211:3128'
}
response = requests.get('http://httpbin.org/get', proxies=proxy,  timeout=10)
print(response.text)

python中requests模組有些網站不能訪問解決方案

python學習中爬取網站視訊時由於python本身不能地址限制的原因，不能直接用response = requests.get(url)獲取到網頁原始碼，進而無法爬取網站資訊。我以貓眼網為例：訪問貓眼程式碼如下： import requests

Python中Requests模組的異常值處理

在我們用Python的requests模組進行爬蟲時，一個簡單高效的模組就是requests模組，利用get()或者post()函式，傳送請求。但是在真正的實際使用過程中，我們可能會遇到網路的各種變化，可能會導致請求過程發生各種未知的錯誤導致程式中斷，這就使

Python中requests庫模組和lxml模組安裝問題（windows下）

1.requests模組安裝：第一次匯入requests模組，會報mportError: No module named requests的錯。這就是沒有成功匯入requests模組。 2.lxml模組安裝問題： 1.進入http://www.lfd

python中multiprocessing模組之Pipe管道

原文地址，本文在原文基礎上添加了部分註釋。 multiprocessing.Pipe([duplex]) 方法返回2個連線物件(conn1, conn2),代表管道的兩端,預設duplex為True，是雙向通訊。如果duplex為False，則conn1只能用來接收訊息，conn2只能用來

python中requests的應用

方式一 response = requests.request(method, url, **kwargs) r = requests.request('GET', url, **kwargs) r = requests.request('HEAD', url, **kwargs) r = r

python中os模組的作用

簡介 OS模組簡單的來說它是一個Python的系統程式設計的操作模組，可以處理檔案和目錄這些我們日常手動需要做的操作。如果你希望你的程式能夠與平臺無關的話，這個模組是尤為重要的。常用函式和變數 os.sep可以取代作業系統特定的路徑分隔符。windows下為 “\” os.

Python中Matplotlib模組的簡單使用

目錄 Matplotlib pyplot類 pyplot.plot() 配置屬性 pyplot.subplot() Matplotlib Matplotlib 是 Python 2D 繪圖領域使用最廣泛的套件。它能讓使用者很輕鬆地將資料圖形化，並且提供多樣化的輸出格式

Python中Numpy模組的使用

目錄 NumPy ndarray物件 Numpy資料型別 Numpy陣列屬性 NumPy NumPy(Numerical Python) 是 Python 的一個擴充套件程式庫，支援大量的維度陣列與矩陣運算，此外也針對陣列運算提供大量的數學函式庫。Nupmy可用來儲存和處

Python中 Wxpy模組以及其監控

概述: 　　本文主要分享一下博主在學習wxpy 的過程中開發的一個小程式。博主在最近有一個監控報警的需求需要完成，然後剛好在學習wxpy 這個東西，因此很巧妙的將工作和學習聯絡在一起。　　博文中主要使用到的技術設計到Python，Redis，以及Java。涉及到的技術看

Python中logging模組

1、日誌級別日誌級別數值 Critical 50 Error 40 Warning 30 Info 20

Python中shodan模組的使用

關於shodan的安裝和使用，傳送門——> 滲透測試之Shodan的安裝和使用常用 Shodan 庫函式 shodan.Shodan(key) ：初始化連線API Shodan.count(query, facets=None)：返回查詢結果數量

python中requests的用法總結

requests是一個很實用的Python HTTP客戶端庫，編寫爬蟲和測試伺服器響應資料時經常會用到。可以說，Requests 完全滿足如今網路的需求本文全部來源於官方文件 http://docs.python-requests.org/en/master/ 安裝方式一

python 歷險記(五）—— python 中的模組

目錄前言基礎模組化程式設計模組化有哪些好處? 什麼是 python 中的模組？引入模組有幾種方式？模組的查詢順序模組中包含執行語句的情況用 dir() 函式來窺探模組 python 的內建模組有哪些？結語參考文件

python中socket模組詳解

socket模組簡介網路上的兩個程式通過一個雙向的通訊連線實現資料的交換，這個連線的一端稱為一個socket。socket通常被叫做“套接字”，用於描述IP地址和埠，是一個通訊鏈的控制代碼，可以用來實現不同虛擬機器或不同計算機之間的通訊。在Internet上的主機一般運行了多個服務

python中configparser模組的使用

configparser模組用於生成和修改常見配置文件，當前模組的名稱在 python 3.x 版本中變更為 configparser。首先要寫一個如下所示的配置檔案： [DEFAULT] serveraliveinterval = 45 compression = yes c

Python中 json模組基礎功能小結

json支援的資料型別：int, bool, str, list, dict, Null；不支援的資料型別有:set,函式等； json 的優勢，相對其他序列化資料模組，json將資料序列化為字元存入檔案後的內容易讀易懂，且可以和通行很多語言互動資料，給不同語言的程式設計師之間互通資料提供了極大的便利性；

Python中xlrd模組使用

安裝xlrd 該模組需要自行安裝，直接使用pip安裝就能安裝簡單使用測試使用的表格 1、開啟表格檔案並獲取所有sheet名稱 >>> rb = xlrd.open_workbook(r'E:\py-test\tests.xls') >>

Python中collections模組的用法

在內建資料型別（dict、list、set、tuple）的基礎上，collections模組提供了幾個額外的資料型別： namedtuple：生成可以使用名字來訪問元素內容的tuple，通常用來增強程式碼的可讀性，在訪問一些tuple型別的資料時尤其好用. deque

Python中inspect模組的一些認識

學習python時遇到了inspect模組的使用，不甚瞭解，在此簡要的認識一下。 inspect模組主要提供了四種用處：對是否是模組，框架，函式等進行型別檢查。獲取原始碼獲取類或函式的引數資訊解析堆疊這裡我不詳細的敘述這四種用法，噹噹講一

python 中 seaborn 模組畫熱度圖

https://seaborn.pydata.org/generated/seaborn.heatmap.html#seaborn.heatmap 使用seaborn這個模組畫熱度圖，其中mask引數決定了畫那一塊兒。mask矩陣的大小和資料矩陣的大小是一直的，其中0表示fal

Python中的requests模組