1. 程式人生 > >火車頭採集器 採集https網站 以及網站cookie 避免 蜘蛛 爬蟲 程式等

火車頭採集器 採集https網站 以及網站cookie 避免 蜘蛛 爬蟲 程式等

火車頭採集器 採集https網站

並不是想象中的困難,有時https網站只是用了這個加密協議,但是事實上的資料並沒有加密,所以仍然可以採集。

如果確實有困難的可以通過,http分析軟體來確認地址,如HttpAnalyzerStdV7,分析真實訪問地址。

網站中的cookie,需要用正式瀏覽器獲得,建議是ie瀏覽器,軟體相容性好。

同時為了避免 蜘蛛 爬蟲 程式等,模擬瀏覽器選擇真實的ie,否則只能採集到錯誤資訊