1. 程式人生 > >scrapy爬蟲框架簡單例項

scrapy爬蟲框架簡單例項

宣告:初學scrapy,總結學習內容。

目錄

四、測試

一、安裝scrapy

pip install scrapy 

二、建立工程

scrapy startproject mySpider                 #建立scrapy工程
cd mySpider                                  #進入工程目錄
scrapy genspider itcast "www.itcast.cn"      #建立爬蟲(spider名不能與project名相同)

三、編寫程式碼 

3.1 item檔案編寫

items用於儲存欄位的定義。即爬取的內容存與item類中。

3.1 spider檔案編寫

3.2 pipeline檔案編寫

pipeline檔案用於儲存到檔案中。

3.3 setting檔案修改

其他配置暫且不用修改,只修改pipeline配置。

四、測試

scrapy crawl itcast                        #執行爬蟲