詳述Scrapyd部署爬蟲專案

阿新 • • 發佈：2019-01-08

Scrapyd部署爬蟲專案

部落格目的：本部落格介紹瞭如何安裝和配置Scrapyd，以部署和執行Scrapy spider。

Scrapyd簡介 : Scrapyd是一個部署和執行Scrapy spider的應用程式。它使您能夠使用JSON API部署（上載）專案並控制其spider。

部署步驟：

1. 新建虛擬環境(方便管理)，在虛擬環境中安裝scrapy專案需要使用到的包

mkvirtualenv --python=C:\python27\scripts\python.exe scrapySpider 新建虛擬環境

進入虛擬環境使用pip將所需包安裝完成

開啟命令列工具執行pip install scrapyd（1.1.1）

等待安裝完成後輸入scrapyd 啟動 scrapy 服務

瀏覽器輸入127.0.0.1:6800 即可檢視

2. 如果連線成功先關閉服務，自己在非C盤下新建一個資料夾，名稱自定義如:scrapydTest

然後進入該資料夾，shift+右鍵開啟命令列工具，輸入scrapyd執行，執行完成後會新建一個dbs空資料夾，用來存放爬蟲專案的資料檔案

3. 安裝scrapyd-client模組。scrapyd-client模組是專門打包scrapy爬蟲專案到scrapyd服務中的，進入虛擬環境，執行命令pip install scrapyd-client==1.1.0，安裝完成後，在虛擬環境的scripts中會出現scrapyd-deploy無後綴檔案，這個scrapyd-deploy無後綴檔案是啟動檔案，在Linux系統下可以遠行，在windows下是不能執行的，所以我們需要編輯一下使其在windows可以執行

新建一個scrapyd-deploy.bat檔案，右鍵選擇編輯，輸入以下配置，注意：兩個路徑之間是空格，一定要使用雙引號。單引號的話會錯誤。

4. 進入虛擬環境，進入到你的爬蟲專案中，進入帶有scrapy.cfg檔案的目錄，執行scrapyd-deploy，測試scrapyd-deploy是否可以執行，如果出現以下則正常

5. 開啟爬蟲專案中的scrapy.cfg檔案，這個檔案就是給scrapyd-deploy使用的

將url這行程式碼解掉註釋，並且給設定你的部署名稱

6. 再次執行scrapyd-deploy -l 啟動服務，可以看到設定的名稱

7.開始打包前，執行一個命令：scrapy list ，這個命令執行成功說明可以打包了，如果沒執行成功說明還有工作沒完成

注意執行 scrapy list 命令的時候很有可能出現錯誤，如果是python無法找到scrapy專案，需要在scrapy專案裡的settings.py配置檔案裡設定成python可識別路徑

# 將當前專案的一級目錄TotalSpider目錄新增到python可以識別目錄中

BASE_DIR = os.path.dirname(os.path.abspath(os.path.dirname(__file__)))

sys.path.insert(0, os.path.join(BASE_DIR, “ivsky_spider”))

如果錯誤提示，什麼遠端計算機拒絕，說明你的scrapy專案有連結遠端計算機，如連結資料庫或者elasticsearch(搜尋引擎)之類的，需要先將連結伺服器啟動

執行 scrapy list 命令返回了爬蟲名稱說明一切ok了，如下圖

8. 到此我們就可以開始打包scrapy專案到scrapyd了，用命令結合scrapy專案中的scrapy.cfg檔案設定來打包

執行打包命令： scrapyd-deploy 部署名稱 -p 專案名稱

如：scrapyd-deploy wj -p TotalSpider

如下顯示錶示scrapy專案打包成功

如果出現

版本不對，建議安裝pip install scrapyd==1.1.1，直到你的egg資料夾中有專案即可

curl http://localhost:6800/schedule.json -d project=專案名稱 -d spider=爬蟲名稱

執行後，如果出現

則爬蟲執行成功

可以去網頁中127.0.0.1:6800檢視爬蟲執行狀態

停止爬蟲

curl http://localhost:6800/cancel.json -d project=scrapy專案名稱 -d job=執行ID

刪除scrapy專案

注意：一般刪除scrapy專案，需要先執行命令停止專案下在遠行的爬蟲

curl http://localhost:6800/delproject.json -d project=scrapy專案名稱

檢視有多少個scrapy專案在api中

檢視指定的scrapy專案中有多少個爬蟲

curl http://localhost:6800/listspiders.json?project=scrapy專案名稱

總結幾個請求url

1、獲取狀態

http://127.0.0.1:6800/daemonstatus.json

2、獲取專案列表

http://127.0.0.1:6800/listprojects.json

3、獲取專案下已釋出的爬蟲列表

http://127.0.0.1:6800/listspiders.json?project=myproject

4、獲取專案下已釋出的爬蟲版本列表

http://127.0.0.1:6800/listversions.json?project=myproject

5、獲取爬蟲執行狀態

http://127.0.0.1:6800/listjobs.json?project=myproject

6、啟動伺服器上某一爬蟲（必須是已釋出到伺服器的爬蟲）

http://127.0.0.1:6800/schedule.json （post方式，data={"project":myproject,"spider":myspider}）

7、刪除某一版本爬蟲

http://127.0.0.1:6800/delversion.json

（post方式，data={"project":myproject,"version":myversion}）

8、刪除某一工程，包括該工程下的各版本爬蟲

https://github.com/DormyMo/SpiderKeeper

一個基於flask後臺框架寫的scrapy爬蟲監控小專案,有興趣的同學看看

詳述Scrapyd部署爬蟲專案

Scrapyd部署爬蟲專案部落格目的：本部落格介紹瞭如何安裝和配置Scrapyd，以部署和執行Scrapy spider。 Scrapyd簡介 : Scrapyd是一個部署和執行Scrapy spide

scrapyd部署爬蟲專案

功能：它就相當於是一個伺服器，用於將自己本地的爬蟲程式碼，打包上傳到伺服器上，讓這個爬蟲在伺服器上執行，可以實現對爬蟲的遠端管理。(遠端啟動爬蟲，遠端關閉爬蟲，遠端檢視爬蟲的一些日誌。) 1.服務端Scrapd的安裝:Pip install scrapyd（版本

ubuntu下scrapyd部署爬蟲專案

scrapyd部署爬蟲的優勢： 1、方便監控爬蟲的實時執行狀態，也可以通過介面呼叫開發自己的監控爬蟲的頁面 2、方便統一管理，可以同時啟動或關閉多個爬蟲 3、擁有版本控制，如果爬蟲出現了不可逆的錯誤，可以通過介面恢復到之前的任意版本注意：在安裝scrapyd之前要確保你的環境能夠執行scrapy（無論整合

如何使用scrapyd部署爬蟲專案

功能：相當於一個伺服器，用於將自己本地的爬蟲程式碼，打包上傳到伺服器上，讓這個爬蟲在伺服器上執行，可以實現對爬蟲的遠端管理。(遠端啟動爬蟲、關閉爬蟲、檢視爬蟲的一些日誌) 1.scrapyd的安裝：在cmd中，輸入指令：pip install scrapyd

python之Scrapyd部署爬蟲專案（虛擬環境）

1、新建虛擬環境(方便管理)，在虛擬環境中安裝scrapy專案需要使用到的包進入虛擬環境使用pip將所需包安裝完成 2、開啟命令列工具執行pip install scrapyd 3、輸入scrapyd啟動scrapyd服務，在瀏覽器輸入127.0.0

scrapyd部署爬蟲專案所需配置

scrapyd部署爬蟲專案 1，安裝scrapy包 pip install scrapyd 在終端輸入scrapyd 檢視是否成功所在埠為6800即為成功（建議不要將這個關掉，後面需要這個服務，關掉會連線不到主機）在瀏覽器上輸入127.0

scrapyd 部署爬蟲專案

1.cmd進入虛擬環境下載scrapyd,即pip install scrapyd,安裝完成後輸入scrapyd，啟動scrapyd服務在瀏覽器輸入127.0.0.1：6800 即可檢視 2. 如果連線成功先關閉服務，自己在非C盤下新建一個資料夾，名稱自定義如:sc

Scrapyd部署爬蟲檔案

Scrapyd部署爬蟲專案 1、開啟命令列工具執行“pip install scrapyd” 2、安裝成功啟動scrapyd服務 3、瀏覽器輸入127.0.0.1:6800即可檢視 4、連線成功後在非c盤目錄下新建一個資料夾，shift加右鍵開啟命令列工具，輸入scra

win10如何使用scrapyd部署爬蟲

win10如何使用scrapyd部署爬蟲官方文件：http://scrapyd.readthedocs.io/en/stable/ scrapy爬蟲寫好後，一般需要用命令列執行。scrapyd部署能夠在網頁端檢視正在執行的任務，也能新建爬蟲任務，和終止爬蟲任務。優點：

jenkins 自動打包部署爬蟲專案

最近因工作需要，負責看護公司的生產環境，有16臺生產服務節點，所以必須得引入自動化管理工具，不然我可不得累死啊。本文記錄一下在使用Jenkins釋出過程的整個過程。 1.啟動Jenkins服務 2.登陸網頁 3.配置

scrapy入門教程()部署爬蟲專案

scrapyd部署爬蟲專案 1、scrapyd介紹它就相當於是一個伺服器，用於將自己本地的爬蟲程式碼，打包上傳到伺服器上，讓這個爬蟲在伺服器上執行，可以實現對爬蟲的遠端管理(遠端啟動爬蟲，遠端關閉爬蟲，遠端檢視爬蟲的一些日誌等)。 2、scrapyd安裝

scrapyd部署爬蟲遇到的問題

1.windows下 scrapyd-deploy無後綴檔案不能啟動：執行命令pip install scrapy-client，安裝完成後，在虛擬環境的scripts中會出現scrapyd-deploy無後綴檔案，這個scrapyd-deploy無後綴檔案

基於Python的-scrapyd部署爬蟲流程

1. 開啟命令視窗,新建一個虛擬環境:Mkvirtualenv --python=D:\python36\python.exe 虛擬環境名2. 安裝scrapy專案中所需要的包:例如pip install scrapy如果缺少win32 要進行pip install pywi

如何通過 Scrapyd + ScrapydWeb 簡單高效地部署和監控分散式爬蟲專案

需求分析初級使用者：只有一臺開發主機能夠通過 Scrapyd-client 打包和部署 Scrapy 爬蟲專案，以及通過 Scrapyd JSON API 來控制爬蟲，感覺命令列操作太麻煩，希望能夠通過瀏覽器直接部署和執行專案專業使用者：

scrapyd部署（遠端管理爬蟲專案）

1. 需要安裝scrapyd=1.2.0 scrapyd-client=1.2.0a1 首先進入虛擬環境 2. 啟動scrapyd服務 3. 配置爬蟲專案： 4.開始向scrapyd中部署檢視當前可用於部署到scrapyd 服務

手動部署scrapy爬蟲專案到Scrapyd服務

建議使用虛擬環境，原因在於（1）可以在系統的Python直譯器中避免包的混亂和版本的衝突（2）保持全域性直譯器的乾淨整潔，使其只作為建立更多虛擬環境的源。（3）不需要管理員許可權啟動scrapyd服務，就會在當前工作目錄下儲存所部署的專案以及資料，為了管理方便，一般自己建立一個資料夾。使用scrapyd-cl

如何簡單高效地部署和監控分散式爬蟲專案

需求分析初級使用者：只有一臺開發主機能夠通過 Scrapyd-client 打包和部署 Scrapy 爬蟲專案，以及通過 Scrapyd JSON API 來控制爬蟲，感覺命令列操作太麻煩，希望能夠通過瀏覽器直接部署和執行專案專業使用者：有 N 臺雲主

如何簡單高效地部署和監控分散式爬蟲專案？菜鳥來教你！

初級使用者：只有一臺開發主機能夠通過 Scrapyd-client 打包和部署 Scrapy 爬蟲專案，以及通過 Scrapyd JSON API 來控制爬蟲，感覺命令列操作太麻煩，希望能夠通過瀏覽器直接部署和執行專案專業使用者：有

python下使用scrapy-redis模組分散式爬蟲的爬蟲專案部署詳細教程————————gerapy

1.使用gerapy進行分散式爬蟲管理準備工作：首先將你使用scrapy-redis寫的分散式爬蟲全部完善模組準備：安裝： pip install pymongo【依賴模組】 pip install gerapy 2.在本地建立部署專案的資料夾

關於scrapyd爬蟲專案命令多種使用方法與請求

關於對scrapyd爬蟲使用命令幾種方式（cmd命令列，cmder工具，通過py檔案請求網址得到請求） 1，命令列關於命令列的操作無需多言，基本操作，大概如下在爬蟲專案檔案下使用命令 2，cmder 首先下載cmder，並開啟cmder.exe 此

詳述Scrapyd部署爬蟲專案

Scrapyd部署爬蟲專案

部落格目的： 本部落格介紹瞭如何安裝和配置Scrapyd，以部署和執行Scrapy spider。

Scrapyd簡介 : Scrapyd是一個部署和執行Scrapy spider的應用程式。它使您能夠使用JSON API部署（上載）專案並控制其spider。

部署步驟：

相關推薦

部落格目的：本部落格介紹瞭如何安裝和配置Scrapyd，以部署和執行Scrapy spider。