1. 程式人生 > >pycharm下開啟、執行並除錯scrapy爬蟲程式

pycharm下開啟、執行並除錯scrapy爬蟲程式

  1. 首先得有一個Scrapy專案,我在Desktop上新建一個Scrapy的專案叫test,在Desktop目錄開啟命令列,鍵入命令:scrapy startproject test1 


    1 

    目錄結構如下: 

    1 
    1 
    1 
  2. 開啟Pycharm,選擇open 


    1 
  3. 選擇專案,ok 

    1
  4. 開啟如下介面之後,按alt + 1, 開啟project 面板 

    1
    2 
  5. 在test1/spiders/,資料夾下,新建一個爬蟲spider.py, 注意程式碼中的name="dmoz"。這個名字後面會用到。 

    1
  6. 在test1目錄和scrapy.cfg同級目錄下面,新建一個begin.py檔案(便於理解可以寫成main.py),注意箭頭2所指的名字和第5步中的name='dmoz'

     名字是一樣的。

    from scrapy import cmdline

    cmdline.execute("scrapy crawl dmoz".split())
  • 1
  • 2
  • 3
  • 1
  • 2
  • 3
1

7. 上面把檔案搞定了,下面要配置一下pycharm了。點選Run->Edit Configurations
1

8. 新建一個執行的python模組 
1

9. Name:改成spider; script:選擇剛才新建的那個begin.py檔案;Working Direciton:改成自己的工作目錄 
1
10. 至此,大功告成了,點選下圖,右上角的按鈕就能運行了。 
1
除錯

可以在其他程式碼中設定斷點,就可以debug執行


Paste_Image.png

轉載1:http://www.jianshu.com/p/f85120fcbca0

轉載2:http://blog.csdn.net/wangsidadehao/article/details/52911746