scrapy-redis 之處理異常

阿新 • • 發佈：2018-12-24

今天心情不好不想多打字自己看註釋吧

 1 from scrapy.http import HtmlResponse
 2 from twisted.internet import defer
 3 from twisted.internet.error import TimeoutError, DNSLookupError, \
 4     ConnectionRefusedError, ConnectionDone, ConnectError, \
 5     ConnectionLost, TCPTimedOutError
 6 from twisted.web.client import 
 ResponseFailed
 7 from scrapy.core.downloader.handlers.http11 import TunnelError
 8 
 9 
10 class ProcessAllExceptionMiddleware(object):
11     ALL_EXCEPTIONS = (defer.TimeoutError, TimeoutError, DNSLookupError,
12                       ConnectionRefusedError, ConnectionDone, ConnectError,
13                       ConnectionLost, TCPTimedOutError, ResponseFailed,
 
14                       IOError, TunnelError)
15 
16     def process_response(self, request, response, spider):
17         # 捕獲狀態碼為40x/50x的response
18         if str(response.status).startswith('4') or str(response.status).startswith('5'):
19             # 隨意封裝，直接返回response，spider程式碼中根據url==''來處理response 

20             response = HtmlResponse(url=str(response.status), status=200)
21             return response
22         # 其他狀態碼不處理
23         return response
24 
25     def process_exception(self, request, exception, spider):
26         # 捕獲幾乎所有的異常
27         if isinstance(exception, self.ALL_EXCEPTIONS):
28             # 在日誌中列印異常型別
29             print('Got exception: %s' % (exception))
30             # 隨意封裝一個response，返回給spider
31             response = HtmlResponse(url='exception')
32             return response
33         # 打印出未捕獲到的異常
34         print('not contained exception: %s' % exception)

然後根據返回的url不同就可以在spider中進行各種處理了

scrapy-redis 之處理異常

今天心情不好不想多打字自己看註釋吧 1 from scrapy.http import HtmlResponse 2 from twisted.internet import defer 3 from twisted.internet.error import TimeoutEr

Scrapy Pipeline之處理CPU密集型或阻塞型操作

Twisted框架的reactor適合於處理短的、非阻塞的操作。但是如果要處理一些複雜的、或者包含阻塞的操作又該怎麼辦呢？Twisted提供了執行緒池來在其他的執行緒而不是主執行緒（Twisted的reactor執行緒）中執行慢的操作——使用reactor.ca

玩轉python爬蟲之URLError異常處理

bsp 無法識別 pac 使用 cin lai 網絡處理方式地址這篇文章主要介紹了python爬蟲的URLError異常處理，詳細探尋一下URL\HTTP異常處理的相關內容，通過一些具體的實例來分析一下，非常的簡單，但是卻很實用，感興趣的小夥伴們可以參考一下本節

scrapy基礎知識之 Scrapy-Redis分布式策略：

空間 spider head spi 指紋負責 edi all redis Scrapy-Redis分布式策略：假設有四臺電腦：Windows 10、Mac OS X、Ubuntu 16.04、CentOS 7.2，任意一臺電腦都可以作為 Master端或 Slave

Python基礎之finally異常處理

不知道發生 try range 異常處理輸出完全例如 nbsp #try...finally 無論是否異常都執行finally#例如實現不管是否異常都輸出一串字符串‘‘‘try: print ifinally: print "不管上面是否異常，我必須輸出

requests庫之請求異常處理

git pri name requests poi mail esp ons https 利用requests發出請求時可能會發生異常，requests中有一個exception庫用來區分這些異常。 http協議是基於tcp/ip協議的，tcp/ip三次握手，因此可以在請求

python高級之scrapy-redis

int art sts {} param 本質 opened div pipe 目錄： scrapy-redis組件 scrapy-redis配置示例一、scrapy-redis組件 1、scrapy-redis簡介： scrapy-redis是一個基於redis

SpringMVC之全域性異常處理 ——統一返回格式（自定義異常）

SpringMVC之全域性異常處理老規矩開篇咱們先介紹一下背景因當前APP越來越流行，或是提供的第三方介面等等都需要你來統一返回格式。這個時候問題就來了，很多時候系統的異常以及為了程式碼的可讀性我們必然會抽出很多的間接層（例如資料格式校驗、資料有效性校驗等），一層層的retur

SpringBoot初始教程之統一異常處理(三)

SpringBoot初始教程之統一異常處理(三) 1.介紹在日常開發中發生了異常，往往是需要通過一個統一的異常處理處理所有異常，來保證客戶端能夠收到友好的提示。SpringBoot在頁面發生異常的時候會自動把請求轉到/error，SpringBoot內建了一個BasicErr

Python pip install之SSL異常處理

異常內容： C:\Users\ccwant>pip install requests Collecting requests Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))

python高階之scrapy-redis

目錄： scrapy-redis元件 scrapy-redis配置示例一、scrapy-redis元件 1、scrapy-redis簡介： scrapy-redis是一個基於redis的scrapy元件，通過它可以快速實現簡單分散式爬蟲程式，該元件本

(五) RabbitMQ實戰教程(面向Java開發人員)之RabbitMQ異常處理

RabbitMQ異常處理使用JAVA客戶端整合RabbitMQ進行的許多操作都會丟擲異常，我們可以自定義異常處理器進行處理，比如我們希望在RabbitMQ消費訊息失敗時記錄一條日誌，又或者在訊息消費失敗時傳送一則通知等操作 RabbitMQ Jav

Java Web 學習筆記之十一：RestEasy統一處理異常

JBoss RestEasy框架配置異常統一處理前提利用JBoss restEasy框架搭建的restful java web後臺應用希望通過統一的方式對restful介面丟擲的異常進行

swift詳解之十-------------異常處理、型別轉換 ( Any and AnyObject )

異常處理、型別轉換 ( Any and AnyObject ) 注：本文為作者傾心整理，希望對大家有所幫助！ 1、錯誤處理（異常處理） swift 提供第一類錯誤支援，包括在執行時丟擲，捕獲，傳送和控制可回收錯誤。在swift中，

SpringBoot進階之統一異常處理（含原始碼）

淺談異常處理在J2EE專案的開發中，不管是對底層的資料庫操作過程，還是業務層的處理過程，還是控制層的處理過程，都不可避免會遇到各種可預知的、不可預知的異常需要處理。每個過程都單獨處理異常，系統的程式碼耦合度高，工作量大且不好統一，維護的工作量也很大。

Python爬蟲入門五之URLError異常處理

大家好，本節在這裡主要說的是URLError還有HTTPError，以及對它們的一些處理。 1.URLError 首先解釋下URLError可能產生的原因：網路無連線，即本機無法上網連線不到特定的伺服器伺服器不存在在程式碼中，我們需要用try-except語句來包

CSharp學習筆記之七異常處理

namespace throw語句的應用演示 { class Program { static void Main(string[] args) { Console.WriteLine("throw語句的應用---除法運算");

SpringBoot之統一異常處理

我們在做Web應用的時候，請求處理過程中發生錯誤是非常常見的情況。 Spring Boot提供了一個預設的對映：/error，當處理中丟擲異常之後，會轉到該請求中處理，並且該請求有一個全域性的錯誤頁面用來展示異常內容。 Spring Boot中實現了預設的erro

C#之系統異常處理機制

在系統開發過程中，BUG和異常產生是無處不在的，但是需要我們去做的就是不斷去發掘異常、修改異常。這篇文章主要談談我在系統中解決異常的幾種方法： 1.控制檯程式產生的異常；在大多數的控制檯程式中，運用最多的就是 try{ Action(); 捕捉異常 } cat

AspectJ——切入點語法（2）之捕獲異常處理上的連線點

捕獲異常處理上的連線點在Java中丟擲異常時，會將其向上傳遞給呼叫鏈，直到它被try/catch塊中的catch語句處理，或者它到達Java執行庫並在控制檯上引發一條出錯的訊息。如果捕獲到Java異常，就會把該異常作為一個物件傳遞給相應的catch語句，在其

scrapy-redis 之處理異常

相關推薦