python3.6.4爬取裁判文書網----------基本js逆向解析----玉米都督
阿新 • • 發佈:2018-11-09
如果您覺得我的文章對您有用,請您給我一個關注,您的每一個關注都是對我極大的支援,我也會極大的提高產出效率,To_share_code
裁判文書網:http://wenshu.court.gov.cn/
這個政府網站垃圾慢,需要耐心
ps: 其實沒必要關心js函式的內部細節,只要找到函式的輸入輸出點就可以了。
萬變不離其宗,只要在 輸入、輸出的地方下斷點,得到處理的結果,就算函式再複雜也不用怕。
隨便搜尋一個關鍵字:捆綁交易糾紛
彈出很多條判決資料
這樣的一般是在 js 或者XHR中,, 開啟chrome,除錯, 果不其然:::
沒有假資料, 繼續下一步.
看一下這個post 請求的 ajax form data :
其中 vl5x guid 像是加密的 所以我們需要找到這兩個引數是怎麼加密的 硬肛起來!!!!!
ctrl+shift+f 全域性搜尋 : vl5x
我們看到 getKey() guid1分別是兩個加密引數的value
找到getKey()
:淺顯易懂 return result (真是親民的反爬蟲,愛你!!!)
再看guid1:
...emmmmmmmmmmmm
搞定!!!!!!!!!!!!!
另外還有詳情頁ID 下會分解,
總之 這個網站適合js反爬入門