1. 程式人生 > >POST上傳檔案

POST上傳檔案

原文:https://blog.csdn.net/xiaojianpitt/article/details/6856536

POST上傳檔案

最早的HTTP POST是不支援檔案上傳的,給程式設計開發帶來很多問題。但是在1995年,ietf出臺了rfc1867,也就是《RFC 1867 -Form-based File Upload in HTML》,用以支援檔案上傳。所以Content-Type的型別擴充了multipart/form-data用以支援向伺服器傳送二進位制資料。因此傳送post請求時候,表單屬性enctype共有二個值可選,這個屬性管理的是表單的MIME編碼:

①application/x-www-form-urlencoded(預設值)
②multipart/form-data
其實form表單在你不寫enctype屬性時,也預設為其添加了enctype屬性值,預設值是enctype=“application/x- www-form-urlencoded”.
原文:

https://blog.csdn.net/xiaojianpitt/article/details/6856536

表單如下:

<form method="post"action="http://w.sohu.com/t2/upload.do" enctype=”multipart/form-data”>

         <inputtype="text" name="desc">

         <inputtype="file" name="pic">
</form>

HTTP請求如下:

POST /t2/upload.do HTTP/1.1

User-Agent: SOHUWapRebot

Accept-Language: zh-cn,zh;q=0.5

Accept-Charset: GBK,utf-8;q=0.7,*;q=0.7

Connection: keep-alive

Content-Length: 60408

Content-Type:multipart/form-data; boundary=ZnGpDtePMx0KrHh_G0X99Yef9r8JZsRJSXC

Host: w.sohu.com



--ZnGpDtePMx0KrHh_G0X99Yef9r8JZsRJSXC

Content-Disposition: form-data;name="desc"

Content-Type: text/plain; charset=UTF-8

Content-Transfer-Encoding: 8bit



[......][......][......][......]...........................

--ZnGpDtePMx0KrHh_G0X99Yef9r8JZsRJSXC

Content-Disposition: form-data;name="pic"; filename="photo.jpg"

Content-Type: application/octet-stream

Content-Transfer-Encoding: binary



[圖片二進位制資料]

--ZnGpDtePMx0KrHh_G0X99Yef9r8JZsRJSXC--

我們來分析下資料,第一個空行之前自然還是HTTP header,之後則是Entity,而此時的Entity也比之前要複雜一些。根據RFC 1867定義,我們需要選擇一段資料作為“分割邊界”( boundary屬性),這個“邊界資料”不能在內容其他地方出現,一般來說使用一段從概率上說“幾乎不可能”的資料即可。 不同瀏覽器的實現不同,例如火狐某次post的 boundary=---------------------------32404670520626 , opera為boundary=----------E4SgDZXhJMgNE8jpwNdOAX ,每次post瀏覽器都會生成一個隨機的30-40位長度的隨機字串,瀏覽器一般不會遍歷這次post的所有資料找到一個不可能出現在資料中的字串,這樣代價太大了。一般都是隨機生成,如果你遇見boundary值和post的內容一樣,那樣的話這次上傳肯定失敗,不過我建議你去買彩票,你太幸運了。Rfc1867這樣說明{A boundary is selected that does not occur in any of the data. (This selection is sometimes done probabilisticly.)}。

選擇了這個邊界之後,瀏覽器便把它放在Content-Type 裡面傳遞給伺服器,伺服器根據此邊界解析資料。下面的資料便根據boundary劃分段,每一段便是一項資料。(每個field被分成小部分,而且包含一個value是"form-data"的"Content-Disposition"的頭部;一個"name"屬性對應field的ID,等等,檔案的話包括一個filename)

IE和Chrome在filename的選擇策略上有所不同,前者是檔案的完整路徑,而後者則僅僅是檔名。
資料內容以兩條橫線結尾,並同樣以一個換行結束。在網路協議中一般都以連續的CR、LF(即\r、\n,或0x0D、Ox0A)字元作為換行,這與Windows的標準一致。如果您使用其他作業系統,則需要考慮它們的換行符。

參考:https://www.jianshu.com/p/8712b7cce467
https://developer.mozilla.org/zh-CN/docs/Web/HTTP/Basics_of_HTTP/MIME_types