1. 程式人生 > >爬蟲之Scrapy

爬蟲之Scrapy

uci linu feed cnblogs rtp sip lib 展示 project

一、scrapy安裝配置

Linux
      pip3 install scrapy
 
 
Windows
      a. pip3 install wheel
      b. 下載twisted http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted
      c. 進入下載目錄,執行 pip3 install Twisted?17.1.0?cp35?cp35m?win_amd64.whl
      d. pip3 install scrapy
      e. 下載並安裝pywin32:https://sourceforge.net/projects/pywin32/files/

  

二、創建並運行scrapy

1. scrapy startproject 項目名稱
   - 在當前目錄中創建中創建一個項目文件(類似於Django)
 
2. scrapy genspider [-t template] <name> <domain>
   - 創建爬蟲應用
   如:
      scrapy gensipider -t basic oldboy oldboy.com
      scrapy gensipider -t xmlfeed autohome autohome.com.cn
   PS:
      查看所有命令:scrapy gensipider -l
      查看模板命令:scrapy gensipider -d 模板名稱
 
3. scrapy list
   - 展示爬蟲應用列表
 
4. scrapy crawl 爬蟲應用名稱
   - 運行單獨爬蟲應用

  

爬蟲之Scrapy