1. 程式人生 > >HTTP常見的狀態碼有哪些?

HTTP常見的狀態碼有哪些?

想了解網站與搜尋引擎的對話,那就要去分析網站日誌,這裡就需要去了解常見HTTP狀態碼有哪些?HTTP狀態碼是伺服器與客戶端之間交流資訊的語言,最大的意義是通過HTTP狀態碼去了解搜尋爬蟲對網站的爬取情況,一般網站日誌中最常見的狀態碼為404、200,蜘蛛爬取的記錄為404則表示訪問了一個錯誤頁面:

203.158.19.251 – - [24/May/2011:16:25:45 +0800] “GET /manage/eWebEditor/admin_login.asp HTTP/1.0″ 404 981 “-” “Mozilla/4.0″

如果記錄痕跡為200則表示正常抓取了一個頁面:

203.158.19.251 – - [24/May/2011:03:59:45 +0800] “GET / HTTP/1.0″ 200 7228 “-” “Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)”

200 7228代表蜘蛛正常抓取了7228個位元組,

以上是從本電商圈部落格日誌中擷取的一段程式碼,一般網站日誌中的HTTP狀態碼都代表什麼呢?HTTP狀態碼及說明如下:

1**:請求收到,繼續處理
2**:操作成功收到,分析、接受
3**:完成此請求必須進一步處理
4**:請求包含一個錯誤語法或不能完成
5**:伺服器執行一個完全有效請求失敗

100——客戶必須繼續發出請求
101——客戶要求伺服器根據請求轉換HTTP協議版本

200——伺服器成功返回網頁
201——提示知道新檔案的URL
202——接受和處理、但處理未完成
203——返回資訊不確定或不完整
204——請求收到,但返回資訊為空
205——伺服器完成了請求,使用者代理必須復位當前已經瀏覽過的檔案


206——伺服器已經完成了部分使用者的GET請求

300——請求的資源可在多處得到
301——刪除請求資料
302——在其他地址發現了請求資料
303——建議客戶訪問其他URL或訪問方式
304——客戶端已經執行了GET,但檔案未變化
305——請求的資源必須從伺服器指定的地址得到
306——前一版本HTTP中使用的程式碼,現行版本中不再使用
307——申明請求的資源臨時性刪除

400——錯誤請求,如語法錯誤
401——請求授權失敗
402——保留有效ChargeTo頭響應
403——請求不允許
404——請求的網頁不存在
405——使用者在Request-Line欄位定義的方法不允許
406——根據使用者傳送的Accept拖,請求資源不可訪問
407——類似401,使用者必須首先在代理伺服器上得到授權


408——客戶端沒有在使用者指定的餓時間內完成請求
409——對當前資源狀態,請求不能完成
410——伺服器上不再有此資源且無進一步的參考地址
411——伺服器拒絕使用者定義的Content-Length屬性請求
412——一個或多個請求頭欄位在當前請求中錯誤
413——請求的資源大於伺服器允許的大小
414——請求的資源URL長於伺服器允許的長度
415——請求資源不支援請求專案格式
416——請求中包含Range請求頭欄位,在當前請求資源範圍內沒有range指示值,請求也不包含If-Range請求頭欄位
417——伺服器不滿足請求Expect頭欄位指定的期望值,如果是代理伺服器,可能是下一級伺服器不能滿足請求

500——伺服器產生內部錯誤
501——伺服器不支援請求的函式
502——伺服器暫時不可用,有時是為了防止發生系統過載
503——伺服器超時過載或暫停維修
504——關口過載,伺服器使用另一個關口或服務來響應使用者,等待時間設定值較長
505——伺服器不支援或拒絕支請求頭中指定的HTTP版本

    在整個SEO過程中最常見的HTTP狀態碼為200 - 404 – 503,如果網站出了什麼問題或想了解網站的收錄抓取情況則對比以上常見HTTP狀態碼來對網站日誌分析,很多時候通過HTTP狀態碼就可以看到伺服器與客戶端之間的資訊交換情況,一般當網站收錄、排名正常時也沒必要經常去檢視。