1. 程式人生 > >利用python抓取搜狗指數學習筆記

利用python抓取搜狗指數學習筆記

1.搜狗指數

強調下:搜狗指數抓取真的很簡單、很簡單、很簡單,大家一定不要被嚇到,哈哈哈哈。

搜狗指數是一個指數指標,能夠反應出來每天人們搜尋的趨向,每天都有搜尋變化表以及隨機搜尋內容。

本來打算爬取百度指數,但是百度的反爬蟲做的很好,均要解析圖片,因此先以搜狗進行學習,後續進行百度指數爬取。

先看一下搜狗關鍵詞主介面

進入開發者模式:XHR出現連結,剛開始點開是沒有的,可以點一下PC,再點選整體就會有了,

點選這個連結:出現如下圖JSON格式介面,直接解析這個頁面就可以

2.搜狗指數爬蟲code

3.爬蟲結果

驚不驚喜,意不意外,就這樣就把資料解析出來了,哈哈哈哈

4.報錯處理

如果不加這段,會報錯ascii錯誤,是因為urlopen不能解析包含漢子的連結,因此需要轉換

url = request.quote(start_url, safe=string.printable)