1. 程式人生 > >scrapy與requests的理解與爬蟲優化想法

scrapy與requests的理解與爬蟲優化想法

requests, scrapy區別,優缺點?

requests:是一個HTTP的框架,可以用來做爬蟲, scrapy:是一個專業做爬蟲的框架

優點:

requsts:定製靈活,上手十分簡單 scrapy:一般定製靈活,深度定製困難

缺點:

requsts:併發性考慮不足,效能較差 scrapy:併發性好,效能較高

關於爬蟲的優化的想法:

考慮多程序+分散式叢集 如果的單程序,會出現I/O阻塞,多程序可以高效的利用CPU,減少網路阻塞。 分散式可以提高爬取效率。 採用scrapy-redsi分散式框架,還可以採用scrapy+佇列的分散式框架