1. 程式人生 > >HTTP權威指南讀後感

HTTP權威指南讀後感

 本文是我花了大概一個月的時間讀完《HTTP權威指南》一書,所做的高度總結,具體細節部分還是要參考書中內容。

 通覽此書,主要講了兩個內容,一是HTTP報文,二是HTTP連線。其他所有內容包括伺服器,代理,快取,安全,編碼,重定向等等內容都是圍繞二者展開的。

 全書在內容上分為五部分,第一部分是HTTP:web的基礎,概述HTTP報文和連線。第二部分是HTTP結構,講了HTTP的各種元件,包括web伺服器(apache,Niginx,MS-IIS),代理,快取,整合點:閘道器、隧道及中繼,web機器人(爬蟲)。第三部分是識別、認證和安全,主要是Cookie機制,基本認證和摘要認證,HTTPS。第四部分是實體、編碼和國際化,MIME型別,字元編碼和轉碼。第五部分是內容釋出與分發,包括web主機託管(如阿里雲),重定向與負載均衡,日誌記錄。

實現HTTP連線的兩個終端分別是瀏覽器(chrome,IE,safari,firefox等)和web伺服器(apache,Niginx,MS-IIS)。資訊的載體是HTTP報文,分為HTTP請求報文和HTTP響應報文。報文分為三部分組成,一是起始行,然後是頭部域,最後是主體。起始行用來表示發起什麼請求或者返回什麼響應,頭部域描述HTTP連線或者主體的元資訊,這也是控制HTTP連線的部分,主體就是攜帶資料的部分。請求報文起始行格式:方法   路徑 HTTP版本,如GET /images/branding/product/ico/googleg_lodp.ico HTTP/1.1。響應報文起始行格式: HTTP版本 響應狀態數字碼 響應狀態文字解釋 ,如HTTP/1.1 200 OK。請求方法,標準中定義了GET,POST,OPTIONS,DELETE,HEADER等等,但是真正伺服器能夠支援的最多的是GET和POST方法。關注下GET和POST方法的區別,面試被問到了。響應報文返回的響應狀態描述了伺服器接受HTTP請求後所做出的應答狀態,分為五種,1xx表示資訊,2xx表示成功,3xx表示重定向,4xx表示請求錯誤,5xxx表示伺服器錯誤。HTTP版本從0.9,1.0,1.1等,它描述了客戶端和伺服器資訊交流所使用的語言,理論上來說,是向後相容的。這種變化跟IPv4和IPv6應該是一樣的。

接下來是頭部域,分為請求頭部域和響應頭部域。

HTTP Request Header 請求頭

Header 解釋 示例
Accept 指定客戶端能夠接收的內容型別 Accept: text/plain, text/html
Accept-Charset 瀏覽器可以接受的字元編碼集。 Accept-Charset: iso-8859-5
Accept-Encoding 指定瀏覽器可以支援的web伺服器返回內容壓縮編碼型別。 Accept-Encoding: compress, gzip
Accept-Language 瀏覽器可接受的語言 Accept-Language: en,zh
Accept-Ranges 可以請求網頁實體的一個或者多個子範圍欄位 Accept-Ranges: bytes
Authorization HTTP授權的授權證書 Authorization: Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ==
Cache-Control 指定請求和響應遵循的快取機制 Cache-Control: no-cache
Connection 表示是否需要持久連線。(HTTP 1.1預設進行持久連線) Connection: close
Cookie HTTP請求傳送時,會把儲存在該請求域名下的所有cookie值一起傳送給web伺服器。 Cookie: $Version=1; Skin=new;
Content-Length 請求的內容長度 Content-Length: 348
Content-Type 請求的與實體對應的MIME資訊 Content-Type: application/x-www-form-urlencoded
Date 請求傳送的日期和時間 Date: Tue, 15 Nov 2010 08:12:31 GMT
Expect 請求的特定的伺服器行為 Expect: 100-continue
From 發出請求的使用者的Email From: [email protected]
Host 指定請求的伺服器的域名和埠號 Host: www.zcmhi.com
If-Match 只有請求內容與實體相匹配才有效 If-Match: “737060cd8c284d8af7ad3082f209582d”
If-Modified-Since 如果請求的部分在指定時間之後被修改則請求成功,未被修改則返回304程式碼 If-Modified-Since: Sat, 29 Oct 2010 19:43:31 GMT
If-None-Match 如果內容未改變返回304程式碼,引數為伺服器先前傳送的Etag,與伺服器迴應的Etag比較判斷是否改變 If-None-Match: “737060cd8c284d8af7ad3082f209582d”
If-Range 如果實體未改變,伺服器傳送客戶端丟失的部分,否則傳送整個實體。引數也為Etag If-Range: “737060cd8c284d8af7ad3082f209582d”
If-Unmodified-Since 只在實體在指定時間之後未被修改才請求成功 If-Unmodified-Since: Sat, 29 Oct 2010 19:43:31 GMT
Max-Forwards 限制資訊通過代理和閘道器傳送的時間 Max-Forwards: 10
Pragma 用來包含實現特定的指令 Pragma: no-cache
Proxy-Authorization 連線到代理的授權證書 Proxy-Authorization: Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ==
Range 只請求實體的一部分,指定範圍 Range: bytes=500-999
Referer 先前網頁的地址,當前請求網頁緊隨其後,即來路 Referer: http://www.zcmhi.com/archives/71.html
TE 客戶端願意接受的傳輸編碼,並通知伺服器接受接受尾加頭資訊 TE: trailers,deflate;q=0.5
Upgrade 向伺服器指定某種傳輸協議以便伺服器進行轉換(如果支援) Upgrade: HTTP/2.0, SHTTP/1.3, IRC/6.9, RTA/x11
User-Agent User-Agent的內容包含發出請求的使用者資訊 User-Agent: Mozilla/5.0 (Linux; X11)
Via 通知中間閘道器或代理伺服器地址,通訊協議 Via: 1.0 fred, 1.1 nowhere.com (Apache/1.1)
Warning 關於訊息實體的警告資訊 Warn: 199 Miscellaneous warning

HTTP Responses Header 響應頭

Header 解釋 示例
Accept-Ranges 表明伺服器是否支援指定範圍請求及哪種型別的分段請求 Accept-Ranges: bytes
Age 從原始伺服器到代理快取形成的估算時間(以秒計,非負) Age: 12
Allow 對某網路資源的有效的請求行為,不允許則返回405 Allow: GET, HEAD
Cache-Control 告訴所有的快取機制是否可以快取及哪種型別 Cache-Control: no-cache
Content-Encoding web伺服器支援的返回內容壓縮編碼型別。 Content-Encoding: gzip
Content-Language 響應體的語言 Content-Language: en,zh
Content-Length 響應體的長度 Content-Length: 348
Content-Location 請求資源可替代的備用的另一地址 Content-Location: /index.htm
Content-MD5 返回資源的MD5校驗值 Content-MD5: Q2hlY2sgSW50ZWdyaXR5IQ==
Content-Range 在整個返回體中本部分的位元組位置 Content-Range: bytes 21010-47021/47022
Content-Type 返回內容的MIME型別 Content-Type: text/html; charset=utf-8
Date 原始伺服器訊息發出的時間 Date: Tue, 15 Nov 2010 08:12:31 GMT
ETag 請求變數的實體標籤的當前值 ETag: “737060cd8c284d8af7ad3082f209582d”
Expires 響應過期的日期和時間 Expires: Thu, 01 Dec 2010 16:00:00 GMT
Last-Modified 請求資源的最後修改時間 Last-Modified: Tue, 15 Nov 2010 12:45:26 GMT
Location 用來重定向接收方到非請求URL的位置來完成請求或標識新的資源 Location: http://www.zcmhi.com/archives/94.html
Pragma 包括實現特定的指令,它可應用到響應鏈上的任何接收方 Pragma: no-cache
Proxy-Authenticate 它指出認證方案和可應用到代理的該URL上的引數 Proxy-Authenticate: Basic
refresh 應用於重定向或一個新的資源被創造,在5秒之後重定向(由網景提出,被大部分瀏覽器支援) Refresh: 5; url= http://www.zcmhi.com/archives/94.html
Retry-After 如果實體暫時不可取,通知客戶端在指定時間之後再次嘗試 Retry-After: 120
Server web伺服器軟體名稱 Server: Apache/1.3.27 (Unix) (Red-Hat/Linux)
Set-Cookie 設定Http Cookie Set-Cookie: UserID=JohnDoe; Max-Age=3600; Version=1
Trailer 指出頭域在分塊傳輸編碼的尾部存在 Trailer: Max-Forwards
Transfer-Encoding 檔案傳輸編碼 Transfer-Encoding:chunked
Vary 告訴下游代理是使用快取響應還是從原始伺服器請求 Vary: *
Via 告知代理客戶端響應是通過哪裡傳送的 Via: 1.0 fred, 1.1 nowhere.com (Apache/1.1)
Warning 警告實體可能存在的問題 Warning: 199 Miscellaneous warning
WWW-Authenticate 表明客戶端請求實體應該使用的授權方案 WWW-Authenticate: Basic

URI (universal resource identifier) 包括URL(universal resource locator) 以及URN (universal resource name).當前應用的是URL,未來的應用方向是URN。URL 的格式 scheme://Host/path.

HTTP連線是建立在TCP連線的基礎上的,計算機網路的知識高速我們計算機網路是採用TCP/IP協議簇,是分層的,HTTP位於上層的應用層,TCP位於下層的傳輸層。TCP連線是可靠性連線,這是HTTP可靠性傳輸的基礎。TCP連線的特性影響HTTP的傳輸,為了提高HTTP的傳輸效率,人們提出了並行連線,持久化連線,管道化連線等概念。所謂並行連線,一個網頁總是由多個MIME物件組成的,而每次請求只能請求一個物件,為了能夠更快的載入網頁,客戶端即瀏覽器可以同時發起對一個伺服器的請求,同時請求多個物件。持久化連線時因為開啟和關閉一個TCP連線需要耗費大量時間和資源(TCP三次握手),而我們建立連線時同一個網頁是針對同一個伺服器的,為了減少時延,建立持久化連線,可以在同一個TCP連線上傳輸多個物件。管道化連線,TCP為了保證資料的可靠性建立了每個包收到接收端的ACK後才發下一個包,而管道化連線使得一端在沒有收到ACK時也可以傳送多個包,這同樣也提高了傳輸效率。