1. 程式人生 > >一些反爬機制

一些反爬機制

    寫爬蟲的時候總結出部分反爬機制:

(1)U-A校驗模式

    當你在家用瀏覽器上網的時候,每次傳送請求時請求頭會自動攜帶瀏覽器引數還有系統引數給伺服器。從而讓伺服器知道這是一個人啊!一次來作為反爬機制的一種。

(2)限制訪問頻率

    正常人瀏覽網站點選速度有多少?機器訪問快多了,短時間傳送幾百個請求。這時候伺服器檢測到後就可以通過設定一個速度去封IP,例如一分鐘訪問200次就封鎖IP

(3)設定驗證碼

    很多朋友都不明白為什麼要驗證碼?我小時候想了這個問題很久很久,自從學了爬蟲才明白,這東西真的是為了驗證我是一個人在上網而生得。這種方法就讓爬蟲更加困難了。

(4)通過賬號限制

    通過登入才可以瀏覽網站。

以上幾種是一大部分反爬機制,至於如何對這些操作進行破解,爬蟲與反爬蟲與反反爬蟲與反反反爬蟲..........的鬥爭是無窮無盡的。後續會慢慢寫上這些反爬機制的應對方式與實際操作!