【python】py35中使用requests庫爬https協議下的網站

阿新 • • 發佈：2018-12-24

使用requests庫可以非常簡單地爬https協議下的網站：

import requests
url='https://www.baidu.com/'
r = requests.get(url,verify=False)
r.encoding = 'utf-8'
print(r.text)

而當爬取TLSv1或TLSv1.1網站時，這樣的程式碼就會報錯
於是我們需要使用HTTPAdapter定製requests引數：

#-*- coding:utf-8 -*-
import re
import requests
from requests.adapters import HTTPAdapter
from 
 requests.packages.urllib3.poolmanager import PoolManager
import ssl
import os
class MyAdapter(HTTPAdapter):
    def init_poolmanager(self, connections, maxsize, block=False):
        self.poolmanager = PoolManager(num_pools=connections,
                                      maxsize=maxsize,
                                      block= 
block,
                                      ssl_version=ssl.PROTOCOL_TLSv1)#這裡定義了ssl協議版本
s = requests.Session()
s.mount('https://', MyAdapter())

def downloadImage(netPath,localPath,imageName):#netPath=網路全路徑,localPath=本地資料夾路徑,imageName=圖片檔名
    #檢測當前路徑的有效性
    if not os.path.isdir(localPath):
        os. 
makedirs(localPath)
    ok=0
    while(ok==0):
        try:
            r=s.get(netPath,timeout=10)
            ok=1
        except:
            print("連線超時")
    if(r.status_code==200):
        fp = open(localPath+'\\'+imageName, 'wb')
        fp.write(r.content)
        fp.close()
        return 1
    else:
        return 0

這樣就可以通過定製HTTPAdapter實現爬取TLSv1或TLSv1.1的網站。

【python】py35中使用requests庫爬https協議下的網站

使用requests庫可以非常簡單地爬https協議下的網站： import requests url='https://www.baidu.com/' r = requests.get(url,verify=False) r.encoding = 'utf-8' print(r.t

python35中使用requests庫爬https協議下的網站

使用requests庫可以非常簡單地爬https協議下的網站： import requests url='https://www.baidu.com/' r = requests.get(url,verify=False) r.encoding = 'utf-8

【python接口自動化-requests庫】【一】requests庫安裝

col python blog http 技術 install python-re .org 自動化 1.概念　　requests 是用Python語言編寫，基於 urllib，采用 Apache2 Licensed 開源協議的 HTTP 庫。它比 urllib 更加方便

【python接口自動化-requests庫】【三】優化重構requests方法

函數 pre 說明數據 div src native 數值我們一、重構post請求方法　　上一張講了如何使用requests庫發送post請求，但是有時候，我們寫腳本，不可能這麽簡單，代碼完全不可復用，重復工作，那我們是不是可以想象，把我們的get，post請求，分

【Python】python3中urllib爬蟲開發

urlopen 狀態碼 tco processor span agent cond urllib 聲明以下是三種方法 ①First Method 最簡單的方法 ②添加data,http header 使用Request對象 ③CookieJar import urllib

【python】json中字典key不可為數值型

pre size color code 不可 bsp 存在 clas 問題遇到了一個很詭異的錯誤。寫一個字典，存入json文件。之後讀出判斷是否存在key。結果驚奇的發現，同一個key居然存在兩次。原因：json會將數值key轉換為unicode 結論：使用json

【Python】for中嵌套if使用

super print sleep span bdr time links 1.9 btn 1.9選課中心前兩頁課程名稱打印到固定系統文件夾的某個csv文件中。 1 #-*- coding: UTF-8 -*- 2 #coding==utf-8 3 #from se

【Python】xpath中為什麽粘貼進去代碼後老報錯？如何在定位元素的時候準確找到定位切入點？

ctrl+ 試用不能 -s 如何 ont mage F12 ctr 1. xpath後（）中雙引號("")裏面不能套用雙引號(""),把裏面的雙引號改成單引號(‘‘)報錯就沒有了。 2.如何在定位元素的時候準確找到定位切入點？要巧妙運用F12，確定要定位的頁面元素

【python】Numpy中stack()，hstack()，vstack()函數詳解

一起 int pan 控制意思 name 體會你們如何轉自 https://blog.csdn.net/csdn15698845876/article/details/73380803 這三個函數有些相似性，都是堆疊數組，裏面最難理解的應該就是stack()函數了，

【python】詳解pandas庫的pd.merge_ordered與pd.merge_asof

merge_ordered: 函式允許組合時間序列和其他有序資料。特別是它有一個可選的fill_method關鍵字來填充/插入缺失的資料。 import pandas as pd left = pd.DataFrame({'k': ['K0', 'K1', 'K1'

【python】詳解pandas庫的pd.merge函式

本篇詳細說明merge的應用，join 和concatenate的拼接方法的與之相似。 pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False

【python】詳解pymongo庫的使用

1、連線mongodb，建立client 傳入 ip 值或者 localhost ,埠是27017 import pymongo from pymongo import MongoClient client = MongoClient() #連線到本地 client = Mong

【Python】Windows中Python直譯器下載安裝及安裝細節

Python直譯器下載官網地址: https://www.python.org/ 選擇適合自己的版本 Python直譯器安裝第一步：選擇install Now，會安裝在預設路徑很深的位置。不建議選擇。選擇第二個安裝，勾選安裝到環境變數path

【python】詳解pandas庫的df.merge函式

本篇詳細說明merge的應用，join 和concatenate的拼接方法的與之相似。 pd.merge(left, right, how='inner', on=None, left_on=None,

【Python】PyCharm中matplotlib.pyplot.imshow()無法繪圖

問題描述在利用Anaconda3 + PyCharm 2018 實現神經網路的實踐中，涉及到一個根據畫素陣列繪製圖像的實踐，如下所示（這裡只需要關心image_array即可，對源資料的預處理可忽略）： # coding=utf-8 # author: BebDong # 10

【python】numpy中的tile函式

tile函式在看機器學習實戰這本書時，遇到numpy.tile(A,B)函式，愣是沒看懂怎麼回事，裝了numpy模組後，實驗了幾把，原來是這樣子：重複A，B次，這裡的B可以時int型別也可以是遠組型別。 >>> import num

【python】離線安裝第三方庫

Anaconda 搜尋bz2安裝包： https://anaconda.org/ 某些以-C指定源安裝的包可能需要登陸下載bz2檔案並執行命令： conda install --use-local *.bz2 pip 搜尋whl安裝包：https://pypi.o

【Python】numpy 中的 copy 問題詳解

這篇文章本是我在 segmentfault 上的一個回答，但是越來越覺得有必要單獨拿出來，畢竟這個問題挺常見的。具體可參看 numpy 官方文件。正文 numpy關於copy有三種情況，完全不復制

【python】詳解numpy庫與pandas庫axis=0，axis= 1軸的用法

對資料進行操作時，經常需要在橫軸方向或者數軸方向對資料進行操作，這時需要設定引數axis的值： axis = 0 代表對橫軸操作，也就是第0軸； axis = 1 代表對縱軸操作，也就是第1軸；

【python】pytorch中如何使用DataLoader對資料集進行批處理

第一步：我們要建立torch能夠識別的資料集型別（pytorch中也有很多現成的資料集型別，以後再說）。首先我們建立兩個向量X和Y，一個作為輸入的資料，一個作為正確的結果：隨後我們需要把X和Y組成一個完整的資料集，並轉化為pytorch能

【python】py35中使用requests庫爬https協議下的網站

相關推薦