pycharm下開啟、執行並除錯scrapy爬蟲程式
阿新 • • 發佈:2019-02-19
-
首先得有一個Scrapy專案,我在Desktop上新建一個Scrapy的專案叫test,在Desktop目錄開啟命令列,鍵入命令:
scrapy startproject test1
目錄結構如下:
-
開啟Pycharm,選擇open
-
選擇專案,ok
-
開啟如下介面之後,按alt + 1, 開啟project 面板
-
在test1/spiders/,資料夾下,新建一個爬蟲spider.py, 注意程式碼中的
name="dmoz"
。這個名字後面會用到。 -
在test1目錄和scrapy.cfg同級目錄下面,新建一個begin.py檔案(便於理解可以寫成main.py),注意箭頭2所指的名字和第5步中的
name='dmoz'
from scrapy import cmdline
cmdline.execute("scrapy crawl dmoz".split())
- 1
- 2
- 3
- 1
- 2
- 3
7. 上面把檔案搞定了,下面要配置一下pycharm了。點選Run->Edit Configurations
8. 新建一個執行的python模組
9. Name:改成spider; script:選擇剛才新建的那個begin.py檔案;Working Direciton:改成自己的工作目錄
10. 至此,大功告成了,點選下圖,右上角的按鈕就能運行了。
除錯
可以在其他程式碼中設定斷點,就可以debug執行
Paste_Image.png
轉載1:http://www.jianshu.com/p/f85120fcbca0
轉載2:http://blog.csdn.net/wangsidadehao/article/details/52911746