scrapyd部署爬蟲遇到的問題

阿新 • • 發佈：2019-01-18

1.windows下 scrapyd-deploy無後綴檔案不能啟動：

執行命令pip install scrapy-client，安裝完成後，在虛擬環境的scripts中會出現scrapyd-deploy無後綴檔案，這個scrapyd-deploy無後綴檔案是啟動檔案，在Linux系統下可以執行，在windows下是不能執行的，所以我們需要編輯一下使其在windows可以執行。

這裡寫圖片描述

新建一個scrapyd-deploy.bat檔案，右鍵選擇編輯，輸入以下配置，注意：兩個路徑之間是空格
@echo off
“E:\Envs\py2Scrapy\Scripts\python.exe” “E:\Envs\py2Scrapy\Scripts\scrapyd-deploy” %*

2.執行 scrapy list 命令的時候出現錯誤

執行 scrapy list 命令的時候很有可能出現錯誤，如果是python無法找到scrapy專案，需要在scrapy專案裡的settings.py配置檔案裡設定成python可識別路徑
將當前專案的一級目錄TotalSpider目錄新增到python可以識別目錄中

BASE_DIR = os.path.dirname(os.path.abspath(os.path.dirname(__file__)))
sys.path.insert(0, os.path.join(BASE_DIR, “TotalSpider”))

這裡寫圖片描述

3.遠端計算機拒絕

如果錯誤提示，什麼遠端計算機拒絕，說明你的scrapy專案有連結遠端計算機，如連結資料庫或者elasticsearch(搜尋引擎)之類的，需要先將連結伺服器啟動

4.windows下打包失敗

這裡寫圖片描述

不用管，多提交幾次，直到你的egg資料夾中有專案即可。然後重啟服務，就可以去開啟爬蟲。

5.啟動爬蟲後出現TypeError‘_job’錯誤

這裡寫圖片描述

這是因為在用scrapyd啟動爬蟲是，會向爬蟲類中傳入一個關鍵字引數
{‘_job’: ‘14241fc2c93d11e7b7be000c29464af7’}
在啟動的時候生成有一個jobid的，而傳進去的就是這個
這裡寫圖片描述

爬蟲類新增

def 
 __init__(self,**kwargs):
super(ProductSpider, self).__init__(self, **kwargs)

另外，需新增str函式，否則也會報錯

def __str__(self):
return “ProductSpider”

scrapyd部署爬蟲遇到的問題

1.windows下 scrapyd-deploy無後綴檔案不能啟動：

2.執行 scrapy list 命令的時候出現錯誤

3.遠端計算機拒絕

4.windows下打包失敗

5.啟動爬蟲後出現TypeError‘_job’錯誤

Scrapyd部署爬蟲檔案

win10如何使用scrapyd部署爬蟲

scrapyd部署爬蟲專案

ubuntu下scrapyd部署爬蟲專案

如何使用scrapyd部署爬蟲專案

python之Scrapyd部署爬蟲專案（虛擬環境）

scrapyd部署爬蟲專案所需配置

詳述Scrapyd部署爬蟲專案

scrapyd部署爬蟲遇到的問題

基於Python的-scrapyd部署爬蟲流程

scrapyd 部署爬蟲專案

scrapyd部署分散式爬蟲

python分散式爬蟲scrapyd部署以及gerapy的使用流程

scrapyd部署（遠端管理爬蟲專案）

scrapyd分散式爬蟲部署

使用selenium+谷歌瀏覽器在centeos7無GUI部署爬蟲cookie更新

mac 系統編寫的 scpayd部署爬蟲 sh指令碼伺服器上報錯：syntax error: unexpected end of file / no active project\n\nUnknown

jenkins 自動打包部署爬蟲專案

scrapy入門教程()部署爬蟲專案

部署爬蟲

scrapyd部署爬蟲遇到的問題

1.windows下 scrapyd-deploy無後綴檔案不能啟動：

2.執行 scrapy list 命令的時候出現錯誤

3.遠端計算機拒絕

4.windows下打包失敗

5.啟動爬蟲後出現TypeError‘_job’錯誤

相關推薦