1. 程式人生 > >scrapy爬蟲的編寫步驟

scrapy爬蟲的編寫步驟

pipeline 就是 爬蟲框架 下一個 網頁 落地 框架 name path

scrapy的步驟:
a.編寫item,爬取的各個屬性
b.編寫spider,name 要和 scrapy crawl xxspider一致,裏面編寫parse的信息,就是xpath獲取item的各個信息。同時獲取下一個要爬取的url放入url_set()隊列
c.pipeline,item的數據落地
d.setting的設置

4. 手寫一個爬蟲框架:
1.下載網頁
2.過濾網頁
3.數據落地

5. 手寫一個建議爬蟲的方法
1.下載網頁
2.獲取網頁相關數據
3.數據落地
4.獲取下一頁地址
5.循環

scrapy爬蟲的編寫步驟