爬蟲之Scrapy
阿新 • • 發佈:2017-08-31
uci linu feed cnblogs rtp sip lib 展示 project
一、scrapy安裝配置
Linux pip3 install scrapy Windows a. pip3 install wheel b. 下載twisted http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted c. 進入下載目錄,執行 pip3 install Twisted?17.1.0?cp35?cp35m?win_amd64.whl d. pip3 install scrapy e. 下載並安裝pywin32:https://sourceforge.net/projects/pywin32/files/
二、創建並運行scrapy
1. scrapy startproject 項目名稱 - 在當前目錄中創建中創建一個項目文件(類似於Django) 2. scrapy genspider [-t template] <name> <domain> - 創建爬蟲應用 如: scrapy gensipider -t basic oldboy oldboy.com scrapy gensipider -t xmlfeed autohome autohome.com.cn PS: 查看所有命令:scrapy gensipider -l 查看模板命令:scrapy gensipider -d 模板名稱 3. scrapy list - 展示爬蟲應用列表 4. scrapy crawl 爬蟲應用名稱 - 運行單獨爬蟲應用
爬蟲之Scrapy