1. 程式人生 > >爬取twitter的思路

爬取twitter的思路

  1. 第一次訪問獲得max-position,然後模擬構造ajax請求,陸續獲得後文內容
  2. 直接訪問頁面請求資料時候,第一個max-position資料無法獲得,通過在follwing&followers&tweets&replies等之間切換時,發現是通過ajax請求獲得的資料,可以獲得第一次請求的max-position引數…
  3. 過程就是,模擬登陸(selenium),將cookies傳給requests,使用requests傳送ajax請求,獲得資料,解析資料…