爬蟲scrapy框架安裝使用
阿新 • • 發佈:2018-06-06
目錄結構 spi 創建 信息 目錄 結構 win 框架 命令
安裝: pip install scrapy
安裝可能會出現問題,此時需要下載一個依賴包
在 這個網站: https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted
下載對應版本,,註意,,python3.6 adm64位對應
pip install 文件的完成路徑
安裝成功後
開始使用:
創建項目:scrapy startproject 項目名
目錄結構如下:
生成爬蟲文件:終端cd進入到 first目錄下
執行命令:scrapy genspider 文件名(name) 網站網址(url)
運行爬蟲:終端cd到spiders目錄下
執行命令:scrapy crawl name
在此過程會遇到一些問題
(1)需要安裝pywin32
(2)需要配置setting文件
(a)把True改為False,不遵從robots協議
(b)創建頭部信息
現在可以執行了
爬蟲scrapy框架安裝使用