第9章 應用層(4)_超文字傳輸協議HTTP
5. 超文字傳輸協議HTTP
5.1 統一資源定位符URL
(1)URL的一般形式:<協議>://<主機>:<埠>/<路徑>
①協議後面必須寫上“://”,不能省略;
②主機是指該主機在因特網上的域名或IP地址;
③埠和路徑有時候可以省略。
(2)舉例
①HTTP的URL一般形式:http://<主機>:<埠>/<路徑>。其中埠預設為80,通常可省略。
②FTP的URL一般形式:ftp:// <主機>:<埠>/<路徑>。其中埠號預設為21。如ftp://user:[email protected]
5.2 絕對路徑和相對路徑
(1)絕對路徑(URL):為檔案提供完全的路徑,包括使用的協議,如http、ftp和rtsp等。如http://www.sohu.com,ftp://202.136.254.1。當連結到其他網站資源時,必須使用絕對路徑。
(2)相對路徑:指向站點資料夾之內的檔案(或資料夾)。只要是同一網站之下的,即使不在同一個目錄之下,相對路徑也非常合適。
①如果連結到同一目錄下,則只需要輸入要連結文件的名稱。
②要連結到下一級目錄中的檔案,只需先輸入目錄名,然後加“/”再輸入檔名。
③如果要連結到上一級目錄中的檔案,則先輸入“../”,再輸入目錄名、檔名。
(3)根路徑:相對於網站的根目錄。以斜槓開頭,然後是資料夾名,最後寫檔名。如“/dir/file1.txt”
5.3 HTTP協議版本
(1)http1.0和http1.1的比較
①由於Web站點訪問量大,為了提高系統的效率,HTTP1.0規定瀏覽器與服務只保持短暫連線,瀏覽器的每次請求都需要與伺服器建立一個tcp連線。這也造成一些效能上的缺陷。比如,當一個包含許多影象的網頁檔案(如大量的<img>標籤),每下載一個影象檔案都必須單獨建立一個tcp連線,那怕影象檔案很小也如此。由於頻繁建立和關閉tcp連線會嚴重影響伺服器的效能。
②http1.1支援持續連線
(2)http1.1持續連線的兩種工作方式
①非流水線方式的特點:客戶在收到前一個響應後才能發出下一個請求。因此在TCP連線建立後,客戶每訪問一次物件都要用去一個往返時間RTT。如果要下載的檔案很多,伺服器在傳送完一個物件後,其TCP連線就處理空閒狀態,浪費了伺服器資源。
②流水線方式的特點:客戶在收到http的響應報文 就能夠接著傳送新的請求報文。於是一個接一個的請求報文到達伺服器後,伺服器就可以連線發回響應報文。這種方式使TCP連線的空閒時間減少,提高了文件的下載效率。因此,下載速度比非流水線的快很多。
5.4 HTTP的請求報文和響應報文
(1)請求報文(從客戶端向伺服器傳送的請求報文)
①由於http是面向文字的,因此在報文中的每個欄位都是一些ASCII碼串,通常以\r\n結束。
②http請求報文由三部分組成:A.開始行。主要用於區別是請求報文還是響應服文。B.首部行,用來說明瀏覽器、伺服器或報文主體的一些資訊。首部可以多行,也可以不使用。每一行都以“回車”和“換行”結束。整個部分行結束,還要有一個“回車”和“換行”。C.實體主體。在請求報文中一般不用這個欄位,而響應報文中也可能沒有這個欄位。
③“請求行”的“Request Method”共有8方法(見上圖)。用來表示對“Request URI”指定的資源的不同操作方式,注意方法名是區別大小寫的!
(2)響應報文(從伺服器到客戶端的應答)
①響應報文的第1行是狀態行:包括http版本、狀態碼以及解釋狀態碼的簡單短語等三項內容。
②狀態碼(Status Code)共5大類33種
狀態碼 |
含義 |
1xx |
表示通知資訊。如請求收到了或正在進行處理 |
2xx |
表示成功。如接受或知道了 |
3xx |
表示重定向。如要完成請求還必須採取進一步的行動 |
4xx |
表示客戶端的錯誤。如請求中有錯誤的語法或不能完成 |
5xx |
表示伺服器的差錯。如伺服器失效無法完成請求 |
5.5 Cookie
(1)Cookie簡介:
①由於http是一種無狀態的協議。為了記錄資訊,當客戶端請求伺服器時,如果伺服器記錄需要記錄該使用者的狀態,就使用response向客戶端瀏覽器頒發一個Cookie,客戶端瀏覽器會把Cookie儲存起來。
②當瀏覽器再次請求該網站時,瀏覽器把請求的網址連同該Cookie一同提交給伺服器。伺服器會檢查該Cookie,還可以根據需要修改Cookie的內容。
(2)Cookie的匯出和匯入
①匯出:瀏覽126郵箱,選擇“十天內免登入”。然後“檔案”→“匯入和匯出”→“匯出Cookie” →指定儲存位置
②匯入:在另一臺計算機上,開啟瀏覽器→“檔案”→“匯入和匯出”→“匯入Cookie”,然後開啟126郵箱,該網站自動讀取Cookie並自動登入。
(3)Cookie安全(刪除Cookie):“Internet選項”→“常規”→“刪除Cookie”
5.6 通過代理伺服器訪問網站
(1)代理伺服器應用場景
①使用代理伺服器,繞過防火牆封鎖。由於國內防火牆攔截了到某些國外網站(如B)的流量。但國外有很多Web代理伺服器(如C),國內使用者可以設定瀏覽器使用國外的代理伺服器,然後再去訪問這些網站就能成功。
②提高內網使用者的訪問速度。代理伺服器可以快取使用者訪問過的內容,當其他使用者再訪問相同的URL時,由代理伺服器從快取中找到要訪問的資訊,傳給使用者,從而提高訪問速度。
③隱藏真實IP。有些網站的論壇會記錄發貼人的IP地址,可以使用代理伺服器去訪問,這樣網站只會記錄代理的地址,從而隱藏自己的IP。
(2)架設Web代理伺服器
①將Win2003虛擬機器架設成Web代理伺服器:執行CCProxy軟體。(注意本機IP:192.16.80.20,執行該軟體後預設會在808埠監聽客戶端連線)
②通常代理伺服器有兩個網絡卡,一個連線Internet,一個連線內網。連線內網的網絡卡為內網計算機上網的代理地址。(本實驗Web代理伺服器就一個網絡卡,因此需要指定哪個地址可以作為代理地址,方法是CCProxy→“帳戶” →在“允許範圍”中選擇“允許所有”)。
(3)測試代理
①xp機上指定使用代理伺服器:開啟IE→“工具”→“Internet選項”→“連線”選項卡→“區域網設定”→在“代理伺服器”中填入IP和埠(如上面的IP:192.168.80.20,埠808)
②瀏覽網站。然後用netstat -an檢視,就可以看到只有和Web代理建立的TCP連線了。也可以在Win2003的代理服務軟體的“監控”中看到這些資訊。