1. 程式人生 > >scrapy 爬取資料遞歸回掉出錯 錯誤日誌【Filtered offsite request to】

scrapy 爬取資料遞歸回掉出錯 錯誤日誌【Filtered offsite request to】

爬取zol 網站圖片,無法抓取.

在 setting.py 檔案中 設定 日誌 記錄等級 

LOG_LEVEL= 'DEBUG'

LOG_FILE ='log.txt'

檢視日誌 發現報

2015-11-07 14:43:43+0800 [meizitu] DEBUG: Filtered offsite request to 'bbs.zol.com.cn': <GET http://bbs.zol.com.cn/dcbbs/d14_134253.html>

這條日誌記錄有點奇怪 果斷上網百度 ,找到答案 


官方對這個的解釋,是你要request的地址和allow_domain裡面的衝突,從而被過濾掉。可以停用過濾功能。

yield Request(url, callback=self.parse_item, dont_filter=True)