Python爬蟲設定ip代理過程解析

阿新 • • 發佈：2020-07-21

1、get方式：如何為爬蟲新增ip代理，設定Request header（請求頭）

import urllib 
import urllib.request
import urllib.parse
import random
import time
from fake_useragent import UserAgent
ua = UserAgent()
url = "http://www.baidu.com"
########################################################
'''
設定ip代理
iplist = [ '127.0.0.1:80']  #可自行上網找一些代理
proxy_support = urllib.request.ProxyHandler({'http':random.choice(iplist)}) #也可以設定為https，要看你的代理支不支援
opener = urllib.request.build_opener(proxy_support)
'''
########################################################
'''無ip代理'''
opener = urllib.request.build_opener()

'''f12檢視請求頭新增即可，不一定都需要全新增↓↓↓'''
opener.addheaders = [('Host','newtab.firefoxchina.cn'),('User-Agent',ua.random),('Accept-Encoding','deflate,br'),('Accept','text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8'),('Accept-Language','zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2'),('Connection','keep-alive'),('Upgrade-Insecure-Requests',1),('Cookie','__gads=ID=138080209be66bf8:T=1592037395:S=ALNI_Ma-g9wHmfxFL4GCy9veAjJrJRsNmg; Hm_lvt_dd4738b5fb302cb062ef19107df5d2e4=1592449208,1592471447,1592471736,1594001802; uid=rBADnV7m04mi8wRJK3xYAg=='),]
urllib.request.install_opener(opener)
while True:
  try:
    response = urllib.request.urlopen(url)
    break
  except Exception as e:
    print("錯誤資訊：" + str(e))
    time.sleep(3)
html = response.read().decode("utf-8")
print(html)

2、post方式新增載荷（此處是打比方），修改urllib.request.install_opener(opener)以下的程式碼即可

urllib.request.install_opener(opener)
# data = {}    #當頁面提交資料是有載荷但是載荷內容為空時，必須以data = {}傳參，不然無法獲取網頁資料
data = {'_csrf':'請把','collection-name':'載荷的引數','description':'以這種形式','_csrf':'裝載'
    }
data = urllib.parse.urlencode(data).encode('utf-8')
req = urllib.request.Request(url,data)
while True:
  try:
    response = urllib.request.urlopen(req)
    break
  except Exception as e:
    print("錯誤資訊：" + str(e))
    time.sleep(3)
html = response.read().decode("utf-8")

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支援我們。

Python爬蟲設定ip代理過程解析

1、get方式：如何為爬蟲新增ip代理，設定Request header（請求頭） import urllib import urllib.request

Python 爬蟲之設定ip代理，設定User-Agent，設定請求頭，設定post載荷

1、get方式：如何為爬蟲新增ip代理，設定Request header（請求頭） import urllib import urllib.request

python redis 批量設定過期key過程解析

這篇文章主要介紹了python redis 批量設定過期key過程解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python selenium爬蟲實現定時任務過程解析

現在需要啟動一個selenium的爬蟲，使用火狐驅動+多執行緒，大家都明白的，現在電腦管家顯示CPU佔用率20%，啟動selenium後不停的開啟瀏覽器+多執行緒，

怎樣使用python爬蟲獲得免費代理ip

爬蟲一直是python使用的一個重要部分，而許多網站也為此做了許多反爬措施，其中爬蟲訪問過於頻繁直接封ip地址也作為一種“傷敵一千，自損八百”的方法被許多網站採用，代理ip便可以防止這種情況出現。

python Jupyter執行時間例項過程解析

這篇文章主要介紹了python Jupyter執行時間例項過程解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

基於Python檢測動態物體顏色過程解析

本篇文章將通過圖片對比的方法檢查視訊中的動態物體，並將其中會動的物體定位用cv2矩形框圈出來。本次專案可用於樹莓派或者微控制器追蹤做一些思路參考。尋找動態物體也可以用來監控是否有人進入房間等等場所的監控。

python文字轉語音實現過程解析

這篇文章主要介紹了python文字轉語音實現過程解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

PYTHON實現SIGN簽名的過程解析

sign簽名是用於提供給外部(第三方)呼叫的介面，呼叫方需要提供正確的appkey鑰匙才能呼叫，確保了介面的安全性。

python實現廣度優先搜尋過程解析

廣度優先搜尋適用範圍：無權重的圖，與深度優先搜尋相比，深度優先搜尋法佔記憶體少但速度較慢，廣度優先搜尋算法佔記憶體多但速度較快

python實現WebSocket服務端過程解析

一種類似Flask開發的WebSocket-Server服務端框架，適用python3.X 1、安裝模組Pywss pip install pywss

python打包成so檔案過程解析

這篇文章主要介紹了python打包成so檔案過程解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

用python寫測試資料檔案過程解析

這篇文章主要介紹了用python寫測試資料檔案過程解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python 動態遷移solr資料過程解析

前言上專案的時候，遇見一次需求，需要把線上的其中一個 collection 裡面的資料遷移到另外一個collection下，於是就百度了看到好多文章，其中大部分都是使用匯入的方法，沒有找到線上資料的遷移方法。於是寫了pyth

Python語言異常處理測試過程解析

這篇文章主要介紹了Python語言異常處理測試過程解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Java獲取客戶端真實IP地址過程解析

這篇文章主要介紹了Java獲取客戶端真實IP地址過程解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python3 Scrapy爬蟲框架ip代理配置的方法

什麼是Scrapy？　　Scrapy是一個為了爬取網站資料，提取結構性資料而編寫的應用框架，非常出名，非常強悍。所謂的框架就是一個已經被集成了各種功能（高效能非同步下載，佇列，分散式，解析，持久化等）的具有很強

opencv python Canny邊緣提取實現過程解析

這篇文章主要介紹了opencv python Canny邊緣提取實現過程解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python異常處理try except過程解析

這篇文章主要介紹了python異常處理try except過程解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python自動化unittest yaml使用過程解析

這篇文章主要介紹了python自動化unittest yaml使用過程解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python爬蟲設定ip代理過程解析

相關推薦