1. 程式人生 > >騰訊宜出行數據無人值守抓取

騰訊宜出行數據無人值守抓取

騰訊 動態 最終 需要 請求 抓取 點擊 ref 提示

騰訊宜出行的熱力圖數據抓取有以下幾個難點:

1)需要登錄抓取。

2)會話時效性短,Cookie中有JS動態產生的驗證參數。

3)一個賬號每天只能發送Ajax請求120次左右,超過就會提示“訪問過於頻繁,請明天再來”。

4)返回的Ajax數據經緯度數據有加密,Count值也被做了手腳。

綜合上述難點,鯤之鵬的技術人員最終采用Selenium + Firefox的方式實現了無人值守模式抓取:

1)支持賬號列表,能夠自動登錄賬號;

2)在賬號被封時(一個賬號一天只能訪問120次左右)能夠自動切換新的(下一個)賬號;

3)自動解密經緯度數據並轉化為WGS84坐標,自動還原Count值。

點擊查看演示視頻:https://showmore.com/zh/u/ktchgyu

騰訊宜出行數據無人值守抓取