捕捉HTTP資料，解析Request header

阿新 • • 發佈：2018-11-14

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow

也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

HTTP Request header

當今web程式的開發技術真是百家爭鳴，ASP.NET, PHP, JSP，Perl, AJAX 等等。無論Web技術在未來如何發展，理解Web程式之間通訊的基本協議相當重要, 因為它讓我們理解了Web應用程式的內部工作. 本文將對HTTP協議進行詳細的例項講解，內容較多，希望大家耐心看。也希望對大家的開發工作或者測試工作有所幫助。使用Fiddler工具非常方便地捕獲HTTP Request和HTTP Response, 關於Fiddler工具的用法，請看我另一篇部落格[

Fiddler 教程]

閱讀目錄

什麼是HTTP協議

協議是指計算機通訊網路中兩臺計算機之間進行通訊所必須共同遵守的規定或規則，超文字傳輸協議(HTTP)是一種通訊協議，它允許將超文字標記語言(HTML)文件從Web伺服器傳送到客戶端的瀏覽器

目前我們使用的是HTTP/1.1 版本

Web伺服器，瀏覽器,代理伺服器

當我們開啟瀏覽器，在位址列中輸入URL，然後我們就看到了網頁。原理是怎樣的呢？

實際上我們輸入URL後，我們的瀏覽器給Web伺服器傳送了一個Request, Web伺服器接到Request後進行處理，生成相應的Response，然後傳送給瀏覽器，瀏覽器解析Response中的HTML,這樣我們就看到了網頁，過程如下圖所示

我們的Request 有可能是經過了代理伺服器，最後才到達Web伺服器的。

過程如下圖所示

代理伺服器就是網路資訊的中轉站，有什麼功能呢？

1. 提高訪問速度，大多數的代理伺服器都有快取功能。

2. 突破限制，也就是FQ了

3. 隱藏身份。

URL詳解

URL(Uniform Resource Locator) 地址用於描述一個網路上的資源, 基本格式如下

schema://host[:port#]/path/.../[?query-string][#anchor]

scheme 指定低層使用的協議(例如：http, https, ftp)

host HTTP伺服器的IP地址或者域名

port# HTTP伺服器的預設埠是80，這種情況下埠號可以省略。如果使用了別的埠，必須指明，例如 http://www.cnblogs.com:8080/

path 訪問資源的路徑

query-string 傳送給http伺服器的資料

anchor- 錨

URL 的一個例子

http://www.mywebsite.com/sj/test/test.aspx?name=sviergn&x=true#stuff

Schema:                 http
host:                   www.mywebsite.com
path:                   /sj/test/test.aspx
Query String:           name=sviergn&x=true
Anchor:                 stuff

HTTP協議是無狀態的

http協議是無狀態的，同一個客戶端的這次請求和上次請求是沒有對應關係，對http伺服器來說，它並不知道這兩個請求來自同一個客戶端。為了解決這個問題， Web程式引入了Cookie機制來維護狀態.

HTTP訊息的結構

先看Request 訊息的結構, Request 訊息分為3部分，第一部分叫Request line, 第二部分叫Request header, 第三部分是body. header和body之間有個空行，結構如下圖

第一行中的Method表示請求方法,比如"POST","GET", Path-to-resoure表示請求的資源， Http/version-number 表示HTTP協議的版本號

當使用的是"GET" 方法的時候， body是為空的

比如我們開啟部落格園首頁的request 如下

GET http://www.cnblogs.com/ HTTP/1.1
Host: www.cnblogs.com

抽象的東西，難以理解，老感覺是虛的，所謂眼見為實, 實際見到的東西，我們才能理解和記憶。我們今天用Fiddler，實際的看看Request和Response.

下面我們開啟Fiddler 捕捉一個部落格園登入的Request 然後分析下它的結構, 在Inspectors tab下以Raw的方式可以看到完整的Request的訊息，如下圖

我們再看Response訊息的結構, 和Request訊息的結構基本一樣。同樣也分為三部分,第一部分叫Response line, 第二部分叫Response header，第三部分是body. header和body之間也有個空行, 結構如下圖

HTTP/version-number表示HTTP協議的版本號， status-code 和message 請看下節[狀態程式碼]的詳細解釋.

我們用Fiddler 捕捉一個部落格園首頁的Response然後分析下它的結構, 在Inspectors tab下以Raw的方式可以看到完整的Response的訊息，如下圖

Get和Post方法的區別

Http協議定義了很多與伺服器互動的方法，最基本的有4種，分別是GET,POST,PUT,DELETE. 一個URL地址用於描述一個網路上的資源，而HTTP中的GET, POST, PUT, DELETE就對應著對這個資源的查，改，增，刪4個操作。我們最常見的就是GET和POST了。GET一般用於獲取/查詢資源資訊，而POST一般用於更新資源資訊.

我們看看GET和POST的區別

1. GET提交的資料會放在URL之後，以?分割URL和傳輸資料，引數之間以&相連，如EditPosts.aspx?name=test1&id=123456. POST方法是把提交的資料放在HTTP包的Body中.

2. GET提交的資料大小有限制（因為瀏覽器對URL的長度有限制），而POST方法提交的資料沒有限制.

3. GET方式需要使用Request.QueryString來取得變數的值，而POST方式通過Request.Form來獲取變數的值。

4. GET方式提交資料，會帶來安全問題，比如一個登入頁面，通過GET方式提交資料時，使用者名稱和密碼將出現在URL上，如果頁面可以被快取或者其他人可以訪問這臺機器，就可以從歷史記錄獲得該使用者的賬號和密碼.

狀態碼

Response 訊息中的第一行叫做狀態行，由HTTP協議版本號，狀態碼，狀態訊息三部分組成。

狀態碼用來告訴HTTP客戶端,HTTP伺服器是否產生了預期的Response.

HTTP/1.1中定義了5類狀態碼，狀態碼由三位數字組成，第一個數字定義了響應的類別

1XX 提示資訊 - 表示請求已被成功接收，繼續處理

2XX 成功 - 表示請求已被成功接收，理解，接受

3XX 重定向 - 要完成請求必須進行更進一步的處理

4XX 客戶端錯誤 - 請求有語法錯誤或請求無法實現

5XX 伺服器端錯誤 - 伺服器未能實現合法的請求

看看一些常見的狀態碼

200 OK

最常見的就是成功響應狀態碼200了，這表明該請求被成功地完成，所請求的資源傳送回客戶端

如下圖，開啟部落格園首頁

302 Found

重定向，新的URL會在response 中的Location中返回，瀏覽器將會自動使用新的URL發出新的Request

例如在IE中輸入， http://www.google.com. HTTP伺服器會返回302， IE取到Response中Location header的新URL, 又重新發送了一個Request.

304 Not Modified

代表上次的文件已經被快取了，還可以繼續使用，

例如開啟部落格園首頁, 發現很多Response 的status code 都是304

提示：　如果你不想使用本地快取可以用Ctrl+F5 強制重新整理頁面

400 Bad Request 客戶端請求與語法錯誤，不能被伺服器所理解

403 Forbidden 伺服器收到請求，但是拒絕提供服務

404 Not Found

請求資源不存在（輸錯了URL）

比如在IE中輸入一個錯誤的URL， http://www.cnblogs.com/tesdf.aspx

500 Internal Server Error 伺服器發生了不可預期的錯誤

503 Server Unavailable 伺服器當前不能處理客戶端的請求，一段時間後可能恢復正常

使用Fiddler 能很方便的檢視Reques header, 點選Inspectors tab ->Request tab-> headers 如下圖所示.

header 有很多，比較難以記憶，我們也按照Fiddler那樣把header 進行分類，這樣比較清晰也容易記憶。

Cache 頭域

If-Modified-Since

作用：把瀏覽器端快取頁面的最後修改時間傳送到伺服器去，伺服器會把這個時間與伺服器上實際檔案的最後修改時間進行對比。如果時間一致，那麼返回304，客戶端就直接使用本地快取檔案。如果時間不一致，就會返回200和新的檔案內容。客戶端接到之後，會丟棄舊檔案，把新檔案快取起來，並顯示在瀏覽器中.

例如：If-Modified-Since: Thu, 09 Feb 2012 09:07:57 GMT

例項如下圖

If-None-Match

作用: If-None-Match和ETag一起工作，工作原理是在HTTP Response中新增ETag資訊。當用戶再次請求該資源時，將在HTTP Request 中加入If-None-Match資訊(ETag的值)。如果伺服器驗證資源的ETag沒有改變（該資源沒有更新），將返回一個304狀態告訴客戶端使用本地快取檔案。否則將返回200狀態和新的資源和Etag. 使用這樣的機制將提高網站的效能

例如: If-None-Match: "03f2b33c0bfcc1:0"

例項如下圖

Pragma

作用：防止頁面被快取，在HTTP/1.1版本中，它和Cache-Control:no-cache作用一模一樣

Pargma只有一個用法，例如： Pragma: no-cache

注意: 在HTTP/1.0版本中，只實現了Pragema:no-cache, 沒有實現Cache-Control

Cache-Control

作用: 這個是非常重要的規則。這個用來指定Response-Request遵循的快取機制。各個指令含義如下

Cache-Control:Public 可以被任何快取所快取（）

Cache-Control:Private 內容只快取到私有快取中

Cache-Control:no-cache 所有內容都不會被快取

還有其他的一些用法，我沒搞懂其中的意思，請大家參考其他的資料

Client 頭域

作用：瀏覽器端可以接受的媒體型別,

例如： Accept: text/html 代表瀏覽器可以接受伺服器回發的型別為 text/html 也就是我們常說的html文件,

如果伺服器無法返回text/html型別的資料,伺服器應該返回一個406錯誤(non acceptable)

萬用字元 * 代表任意型別

例如 Accept: */* 代表瀏覽器可以處理所有型別,(一般瀏覽器發給伺服器都是發這個)

Accept-Encoding：

作用：瀏覽器申明自己接收的編碼方法，通常指定壓縮方法，是否支援壓縮，支援什麼壓縮方法（gzip，deflate），（注意：這不是隻字元編碼）;

例如： Accept-Encoding: gzip, deflate

Accept-Language

作用：瀏覽器申明自己接收的語言。

語言跟字符集的區別：中文是語言，中文有多種字符集，比如big5，gb2312，gbk等等；

例如： Accept-Language: en-us

User-Agent

作用：告訴HTTP伺服器，客戶端使用的作業系統和瀏覽器的名稱和版本.

我們上網登陸論壇的時候，往往會看到一些歡迎資訊，其中列出了你的作業系統的名稱和版本，你所使用的瀏覽器的名稱和版本，這往往讓很多人感到很神奇，實際上，伺服器應用程式就是從User-Agent這個請求報頭域中獲取到這些資訊User-Agent請求報頭域允許客戶端將它的作業系統、瀏覽器和其它屬性告訴伺服器。

例如： User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C; InfoPath.2; .NET4.0E)

Accept-Charset

作用：瀏覽器申明自己接收的字符集，這就是本文前面介紹的各種字符集和字元編碼，如gb2312，utf-8（通常我們說Charset包括了相應的字元編碼方案）；

例如：

Cookie/Login 頭域

Cookie:

作用：最重要的header, 將cookie的值傳送給HTTP 伺服器

Entity頭域

Content-Length

作用：傳送給HTTP伺服器資料的長度。

例如： Content-Length: 38

Content-Type

作用：

例如：Content-Type: application/x-www-form-urlencoded

Miscellaneous 頭域

Referer:

作用：提供了Request的上下文資訊的伺服器，告訴伺服器我是從哪個連結過來的，比如從我主頁上鍊接到一個朋友那裡，他的伺服器就能夠從HTTP Referer中統計出每天有多少使用者點選我主頁上的連結訪問他的網站。

例如: Referer:http://translate.google.cn/?hl=zh-cn&tab=wT

Transport 頭域

Connection

例如：　Connection: keep-alive 當一個網頁開啟完成後，客戶端和伺服器之間用於傳輸HTTP資料的TCP連線不會關閉，如果客戶端再次訪問這個伺服器上的網頁，會繼續使用這一條已經建立的連線

例如： Connection: close 代表一個Request完成後，客戶端和伺服器之間用於傳輸HTTP資料的TCP連線會關閉，當客戶端再次傳送Request，需要重新建立TCP連線。

Host（傳送請求時，該報頭域是必需的）

作用: 請求報頭域主要用於指定被請求資源的Internet主機和埠號，它通常從HTTP URL中提取出來的

例如: 我們在瀏覽器中輸入：http://www.guet.edu.cn/index.html

瀏覽器傳送的請求訊息中，就會包含Host請求報頭域，如下：

Host：http://www.guet.edu.cn

此處使用預設埠號80，若指定了埠號，則變成：Host：指定埠號

HTTP Response header

同樣使用Fiddler 檢視Response header, 點選Inspectors tab ->Response tab-> headers 如下圖所示

我們也按照Fiddler那樣把header 進行分類，這樣比較清晰也容易記憶。

Cache頭域

Date

作用: 生成訊息的具體時間和日期

例如：　Date: Sat, 11 Feb 2012 11:35:14 GMT

Expires

作用: 瀏覽器會在指定過期時間內使用本地快取

例如: Expires: Tue, 08 Feb 2022 11:35:14 GMT

Vary

作用：

例如: Vary: Accept-Encoding

Cookie/Login 頭域

P3P

作用: 用於跨域設定Cookie, 這樣可以解決iframe跨域訪問cookie的問題

例如: P3P: CP=CURa ADMa DEVa PSAo PSDo OUR BUS UNI PUR INT DEM STA PRE COM NAV OTC NOI DSP COR

Set-Cookie

作用：非常重要的header, 用於把cookie 傳送到客戶端瀏覽器，每一個寫入cookie都會生成一個Set-Cookie.

例如: Set-Cookie: sc=4c31523a; path=/; domain=.acookie.taobao.com

Entity頭域

ETag

作用: 和If-None-Match 配合使用。（例項請看上節中If-None-Match的例項）

例如: ETag: "03f2b33c0bfcc1:0"

Last-Modified:

作用：用於指示資源的最後修改日期和時間。（例項請看上節的If-Modified-Since的例項）

例如: Last-Modified: Wed, 21 Dec 2011 09:09:10 GMT

Content-Type

作用：WEB伺服器告訴瀏覽器自己響應的物件的型別和字符集,

例如:

Content-Type: text/html; charset=utf-8

Content-Type:text/html;charset=GB2312

Content-Type: image/jpeg

Content-Length

指明實體正文的長度，以位元組方式儲存的十進位制數字來表示。在資料下行的過程中，Content-Length的方式要預先在伺服器中快取所有資料，然後所有資料再一股腦兒地發給客戶端。

例如: Content-Length: 19847

Content-Encoding

WEB伺服器表明自己使用了什麼壓縮方法（gzip，deflate）壓縮響應中的物件。

例如：Content-Encoding：gzip

Content-Language

作用： WEB伺服器告訴瀏覽器自己響應的物件的語言者

例如： Content-Language:da

Miscellaneous 頭域

Server:

作用：指明HTTP伺服器的軟體資訊

例如:Server: Microsoft-IIS/7.5

X-AspNet-Version:

作用：如果網站是用ASP.NET開發的，這個header用來表示ASP.NET的版本

例如: X-AspNet-Version: 4.0.30319

X-Powered-By:

作用：表示網站是用什麼技術開發的

例如： X-Powered-By: ASP.NET

Transport頭域

Connection

例如： Connection: close 代表一個Request完成後，客戶端和伺服器之間用於傳輸HTTP資料的TCP連線會關閉，當客戶端再次傳送Request，需要重新建立TCP連線。

Location頭域

Location

作用：用於重定向一個新的位置, 包含新的URL地址

例項請看304狀態例項

HTTP協議是無狀態的和Connection: keep-alive的區別

無狀態是指協議對於事務處理沒有記憶能力，伺服器不知道客戶端是什麼狀態。從另一方面講，開啟一個伺服器上的網頁和你之前開啟這個伺服器上的網頁之間沒有任何聯絡

HTTP是一個無狀態的面向連線的協議，無狀態不代表HTTP不能保持TCP連線，更不能代表HTTP使用的是UDP協議（無連線）

從HTTP/1.1起，預設都開啟了Keep-Alive，保持連線特性，簡單地說，當一個網頁開啟完成後，客戶端和伺服器之間用於傳輸HTTP資料的TCP連線不會關閉，如果客戶端再次訪問這個伺服器上的網頁，會繼續使用這一條已經建立的連線

Keep-Alive不會永久保持連線，它有一個保持時間，可以在不同的伺服器軟體（如Apache）中設定這個時間

給我老師的人工智慧教程打call！http://blog.csdn.net/jiangjunshow

捕捉HTTP資料，解析Request header

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

前臺傳過來的json資料，解析request

/** * 解析前臺獲得的互動資料 * @param request * @return * @throws IOException */ public static JSONObject getJsonObject(HttpServletRequest re

Java傳送Http請求，解析html返回

宣告：本文系JavaEye網站釋出的原創部落格文章，未經作者書面許可，嚴禁任何網站轉載本文，否則必將追究法律責任！今天是2008年7月7日星期一，下午一直在學校做個人開始頁面。因為離不開google的翻譯，所以想把google的翻譯整合到我的開始頁面中來，於是乎就遇到了一個

接受第三方介面返回的json資料，解析轉換成Javabean

我的微信端專案使用到了json 資料傳輸格式，在這記錄一下，剛開始時是一臉的懵逼。通過HttpClientUtils.post()工具類傳送json資料，使用字串String接受返回的json資料。 String res=HttpClientUtils.po

iOS 伺服器返回NSData資料，解析為null

通常情況下，使用下面的方法都能接收到伺服器資料都能正常解析為NSDictionary（responseObject為伺服器返回的二進位制資料） NSDictionary * dicJson = [NSJSONSerialization JSONObject

Python 獲取介面資料，解析JSON,寫入檔案

用於練手的例子，從國家氣象局介面上獲取JSON資料，將它寫入檔案中，並解析JSON；總的來說，在程式碼量上，python程式碼量要比java少很多。而且python看起來更直觀一些；以下是程式碼： import types import urllib2 import j

關於java 傳送http json資料格式請求時，伺服器端如何接收json資料並解析

一般情況下，傳送http請求時content-tye是application/x-www-form-urlencoded格式，而這樣的格式會以鍵值對的形似被封裝，至於是在瀏覽器傳送的時候被封裝的還是在伺服器端被封裝的我還不太清楚。但是我的猜測是在瀏覽器傳送請求的時候在客戶端

Http獲取Json資料，並用Gson解析

對於http訪問伺服器獲取json資料，每個專案中都需要用到的，json解析，個人覺得簡單的用jsonobject就可以了，但是遇到介面多的專案，資料量比較大用gson比較方便，減去你很大的負擔。為自己寫部落格，也是一個好習慣（好記性不如亂筆頭）下載gson-xx.j

http post request header is too large ，請求頭太長

在專案中找到servers 展開找到server.xml，編輯：在此處加上：<Connector connectionTimeout="20000" port="8080" protocol="HTTP/1.1" redirectPort="8443" maxH

Java資料介面編寫簡單例子，Java Json解析，服務端介面輸出Json資料，客戶端通過HTTP獲取介面Json資料

實現效果實現原因目前主流的CS結構，資料都是通過RESTful風格介面形式呈現，不管是桌面級應用程式還是手機端，介面是我們獲取資料的大多數選擇，主流資料介面呈現形式主要是Json和Xml，後者目前基本漸行漸遠。Json的輕量級和可讀型成為了大多數公司及個人

使用HttpClient傳送http請求，並解析從伺服器端返回的資料

使用Apache的httpclient包可以模擬HTTP請求的傳送， get和post均可以。最方便的地方就是請求struts等web框架進行測試，省去了做測試頁面的差事。import java.io.IOException; import java.io.InputStr

火狐瀏覽器訪問網站出現 HTTP Error 400. The request is badly formed.錯誤，怎麽解決

def dbm cot row ufw glm rpi peb orb 　　今天在訪問某個網站時，出現一個“HTTP Error 400. The request is badly formed.”錯誤，那麽應該如何解決呢？ 1、問題描述：　　用火狐瀏覽網站出現“”H

跨域問題，Request header field XXXXX is not allowed by Access-Control-Allow-Headers 的問題

允許 span 一個 cti requested action soa ted tom <httpProtocol> <customHeaders> <add name="Access-Control-Allow-Ori

Python爬蟲通過替換http request header來欺騙瀏覽器實現登錄

kit 5.0 目的 user ima blog 界面 chrom num 以豆瓣為例，訪問https://www.douban.com/contacts/list 來查看自己關註的人，要登錄才能查看。如果用requests.get()方法獲取這個http，沒登錄只能

Swift: 用Alamofire做http請求，用ObjectMapper解析JSON

not tis ati obj 有意 objects 映射 loaddata api 演示樣例代碼看最後。跟不上時代的人突然間走在了時代的前列，果然有別樣的風景

信息: Error parsing HTTP request header Note: further occurrences of HTTP header parsing errors will be logged at DEBUG level.

-s 報錯所在 url 提交出現問題 clas 進行一行 Error parsing HTTP request header 最近在做一個SpringMvc項目的時候報錯，錯誤如下：信息: Error parsing HTTP request header N

捕捉HTTP資料，解析Request header

HTTP Request header

什麼是HTTP協議

Web伺服器，瀏覽器,代理伺服器

URL詳解

HTTP協議是無狀態的

HTTP訊息的結構

Get和Post方法的區別

狀態碼

Cache 頭域

Client 頭域

Cookie/Login 頭域

Entity頭域

Miscellaneous 頭域

Transport 頭域

HTTP Response header

Cache頭域

Cookie/Login 頭域

Entity頭域

Miscellaneous 頭域

Transport頭域

Location頭域

HTTP協議是無狀態的和Connection: keep-alive的區別

給我老師的人工智慧教程打call！http://blog.csdn.net/jiangjunshow

相關推薦