1. 程式人生 > >scrapy爬取多頁資料

scrapy爬取多頁資料

初始化一個專案

初始化一個專案

新建一個爬蟲檔案

新建一個newsList.py檔案

要爬取的網頁

這裡寫圖片描述
- 在a標籤上右鍵 copy >>> copy xPath 複製到剪下板的是如下內容
/html/body/div[2]/div[2]/div[1]/div[4]/ul/li[2]/a

獲取所有的需要爬取的頁面url

這裡寫圖片描述

  • scrapy runspider getNews.py -o newsData.json

編寫解析函式

這裡寫圖片描述

  • scrapy runspider getNews.py -o newsData.json
    這裡寫圖片描述