1. 程式人生 > >python爬蟲(四)---scrapy框架之騰訊招聘專案實戰

python爬蟲(四)---scrapy框架之騰訊招聘專案實戰

目的:功能就是翻頁請求

步驟:如下

在這裡插入圖片描述


爬取職位名,職位連結等

在這裡插入圖片描述
 職位名:
 職位詳情連結:
 職位類別:
 人數:
 地點:
 釋出時間:
在這裡插入圖片描述

在這裡插入圖片描述


下一步驟:寫爬蟲 :tencent.py檔案寫

在這裡插入圖片描述

在這裡插入圖片描述

方法一:

在這裡插入圖片描述
在這裡插入圖片描述

或者這樣寫
在這裡插入圖片描述
在這裡插入圖片描述


獲取職位名

在這裡插入圖片描述


獲取連結

在這裡插入圖片描述

在這裡插入圖片描述
在這裡插入圖片描述


再傳給管道:

在這裡插入圖片描述

在這裡插入圖片描述


設定settings函式

在這裡插入圖片描述


開始翻頁(提取第二頁的連結)

在這裡插入圖片描述
以上只是構建了請求但是沒有發出去請求,因此需要用yield
在這裡插入圖片描述


排錯一:
因為有的沒有類別,所以要判斷:
在這裡插入圖片描述


排錯二:
在這裡插入圖片描述

方法二:用scrapy提取連結
在這裡插入圖片描述


總結:一個專案的大致流程

在這裡插入圖片描述