1. 程式人生 > 其它 >winserver中通過IIS配置篩選規則遮蔽蜘蛛、爬蟲非法抓取

winserver中通過IIS配置篩選規則遮蔽蜘蛛、爬蟲非法抓取

一、IIS7版本以上,部署篩選規則:

1、 此功能可以攔截IIS日誌對應欄位中符合內容的訪問請求,或只允許符合內容的來源請求訪問站點。

2、 示例如下:(標頭參考二)

此例中的有來源中帶有“Bing Spider”內容的訪問請求都將被IIS所拒絕。

二、IIS日誌相應欄位解釋:

1、 IIS日誌欄位示例:

#Software: Microsoft Internet Information Services 10.0

#Version: 1.0

#Date: 2021-10-14 00:00:00

#Fields: date time s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) cs(Referer) sc-status sc-substatus sc-win32-status time-taken

2021-10-14 00:00:00 192.168.10.23 GET /Orders/NewsList/13087 - 80 - 122.112.219.229 Mozilla/5.0+(Macintosh;+Intel+Mac+OS+X+10.6;+rv:2.0.1)+Gecko/20100101+Firefox/4.0.1 - 403 503 5 30

其中字首定義:

s- 伺服器操作

c- 客戶端操作

cs- 客戶端到伺服器的操作

sc- 伺服器到客戶端的操作

2、 日誌各欄位含義:

序號

欄位

欄位含義

格式及示例

備註

1

date

日期

2021-10-14

請求發生的日期。

2

time

時間

11:33:25

請求發生的時間

3

s-sitename

服務名

W3SVC2

客戶端所訪問的站點的Internet服務和例項的號碼。

4

s-computername

伺服器名

baiinfo-web001

部署站點的伺服器名稱。

5

s-ip

伺服器IP

192.168.10.23

生成日誌的伺服器IP地址。

6

cs-method

方法

GET/POST

客戶端試圖執行的操作。

7

cs-uri-stem

URL

/Orders/NewsList/13087

請求訪問的頁面

8

cs-uri-query

字串

categoryID=187&ProductID=775

客戶端正在嘗試執行的查詢語句。(查詢請求中?後的字串)

9

s-port

8080

客戶端連線的伺服器埠。

10

cs-username

-

通過身份驗證的使用者格式“域\使用者名稱”;

匿名使用者,是一個連線字元“-”

11

c-ip

客戶端IP

122.112.219.229

真實的客戶端IP(中間IP已過濾)

12

cs-version

協議

HTTP/1.1

客戶端使用的協議。

13

cs(User-Agent)

使用者代理

Mozilla/5.0+(Macintosh;+Intel+Mac+OS+X+10.6;+rv:2.0.1)+Gecko/20100101+Firefox/4.0.1

在客戶端使用的瀏覽器。

14

cs(Cookie)

Cookie

Session=…….

傳送或接收的Cookie內容(如果有)

15

cs(Referer)

引用站點

http://www.baiinfo.cn/

使用者訪問的前一個站點。

16

cs-host

主機

http://www.baiinfo.cn/

顯示主機頭的內容,域名或IP都可。

17

sc-status

返回狀態

200、404

IIS的訪問操作反饋狀態,詳情百度。

18

sc-substatus

子協議

0

HTTP的子協議狀態。

19

sc-win32-status

系統狀態

0

Windows系統服務狀態反饋。

20

sc-bytes

傳送位元組

503

伺服器傳送到客戶端的位元組數。

21

cs-bytes

接受位元組

5

伺服器接收到的位元組數。

22

time-taken

用時總長

30

傳送和接收操作總用時長(毫秒)。