response.setHeader()的用法
response.setHeader()下載中文檔名亂碼問題 收藏 1. HTTP訊息頭
(1)通用資訊頭
即能用於請求訊息中,也能用於響應資訊中,但與被傳輸的實體內容沒有關係的資訊頭,如Data,Pragma
主要: Cache-Control , Connection , Data , Pragma , Trailer , Transfer-Encoding , Upgrade
(2)請求頭
用於在請求訊息中向伺服器傳遞附加資訊,主要包括客戶機可以接受的資料型別,壓縮方法,語言,以及客戶計算機上保留的資訊和發出該請求的超連結源地址等.
主要: Accept , Accept-Encoding , Accept-Language , Host ,
(3)響應頭
用於在響應訊息中向客戶端傳遞附加資訊,包括服務程式的名稱,要求客戶端進行認證的方式,請求的資源已移動到新地址等.
主要: Location , Server , WWW-Authenticate(認證頭)
(4)實體頭
用做實體內容的元資訊,描述了實體內容的屬性,包括實體資訊的型別,長度,壓縮方法,最後一次修改的時間和資料的有效期等.
主要: Content-Encoding , Content-Language , Content-Length , Content-Location , Content-Type
(4)擴充套件頭
主要:Refresh, Content-Disposition
2. 幾個主要頭的作用
(1)Content-Type的作用
該實體頭的作用是讓伺服器告訴瀏覽器它傳送的資料屬於什麼檔案型別。
例如:當Content-Type 的值設定為text/html和text/plain時,前者會讓瀏覽器把接收到的實體內容以HTML格式解析,後者會讓瀏覽器以普通文字解析.
(2)Content-Disposition 的作用
當Content-Type 的型別為要下載的型別時 , 這個資訊頭會告訴瀏覽器這個檔案的名字和型別。
在講解這個內容時,張老師同時講出瞭解決中文檔名亂碼的解決方法,平常想的是使用getBytes() , 實際上應使用email的附件名編碼方法對檔名進行編碼,但IE不支援這種作法(其它瀏覽器支援) , 使用javax.mail.internet.*包的MimeUtility.encodeWord("中文.txt")的方法進行編碼。
Content-Disposition擴充套件頭的例子:
<%@ page pageEncoding="GBK" contentType="text/html;charset=utf-8" import="java.util.*,java.text.*" %>
<%=DateFormat.getDateTimeInstance(DateFormat.SHORT, DateFormat.SHORT, Locale.CHINA).format(new Date())
%>
<%
response.setHeader("Content-Type","video/x-msvideo");
response.setHeader("Content-Disposition", "attachment;filename=aaa.doc");
%>
Content-Disposition中指定的型別是檔案的副檔名,並且彈出的下載對話方塊中的檔案型別圖片是按照檔案的副檔名顯示的,點儲存後,檔案以filename的值命名,儲存型別以Content中設定的為準。
注意:在設定Content-Disposition頭欄位之前,一定要設定Content-Type頭欄位。
(3)Authorization頭的作用
Authorization的作用是當客戶端訪問受口令保護時,伺服器端會發送401狀態碼和WWW-Authenticate響應頭,要求客戶機使用Authorization來應答。
例如:
<%@ page pageEncoding="GBK" contentType="text/html;charset=utf-8" import="java.util.*,java.text.*" %>
<%=DateFormat.getDateTimeInstance(DateFormat.SHORT, DateFormat.SHORT, Locale.CHINA).format(new Date())
%>
<%
response.setStatus(401);
response.setHeader("WWW-Authenticate", "Basic realm=/"Tomcat Manager Application/"");
%>
3.如何實現檔案下載
要實現檔案下載,我們只需要設定兩個特殊的相應頭,它們是什麼頭?如果檔名帶中文,該如何解決?
兩個特殊的相應頭:
----Content-Type: application/octet-stream
----Content-Disposition: attachment;filename=aaa.zip
例如:
response.setContentType("image/jpeg");response.setHeader("Content- Disposition","attachment;filename=Bluehills.jpg");
如果檔案中filename引數中有中文,則就會出現亂碼。
解決辦法:
(1)MimeUtility.encodeWord("中文.txt");//現在版本的IE還不行
(2)new String("中文".getBytes("GB2312"),"ISO8859- 1");//實際上這個是錯誤的
4. 測試並分析檔名亂碼問題
response.setHeader()下載中文檔名亂碼問題
response.setHeader("Content-Disposition", "attachment; filename=" + java.net.URLEncoder.encode(fileName, "UTF-8"));
下載的程式裡有了上面一句,一般在IE6的下載提示框上將正確顯示檔案的名字,無論是簡體中文,還是日文。不過當時確實沒有仔細測試檔名為很長的中文檔名的情況。現如今經過仔細測試,發現文字只要超過17個字,就不能下載了。分析如下:
一. 通過原來的方式,也就是先用URLEncoder編碼,當中文文字超過17個時,IE6 無法下載檔案。這是IE的bug,參見微軟的知識庫文章 KB816868 。原因可能是IE在處理 Response Header 的時候,對header的長度限制在150位元組左右。而一個漢字編碼成UTF-8是9個位元組,那麼17個字便是153個位元組,所以會報錯。而且不跟字尾也不對.
二. 解決方案:將檔名編碼成ISO8859-1是有效的解決方案,程式碼如下:
response.setHeader( "Content-Disposition", "attachment;filename=" + new String( fileName.getBytes("gb2312"), "ISO8859-1" ) );
在確保附件檔名都是簡體中文字的情況下,那麼這個辦法確實是最有效的,不用讓客戶逐個的升級IE。如果臺灣同胞用,把gb2312改成big5就行。但現在的系統通常都加入了 國際化的支援,普遍使用UTF-8。如果檔名中又有簡體中文字,又有繁體中文,還有日文。那麼亂碼便產生了。另外,在上Firefox (v1.0-en)下載也是亂碼。
三. 參看郵件中的中文附件名的形式,用outlook新建一個帶有中文附件的郵件,然後看這個郵件的原始碼,找到:
Content-Disposition: attachment;
filename="=?gb2312?B?0MK9qCDOxLG+zsS1tS50eHQ=?="
用這個filename原理上就可以顯示中文名附件,但是現在IE並不支援,Firefox是支援的。嘗試使用 javamail 的MimeUtility.encode()方法來編碼檔名,也就是編碼成 =?gb2312?B?xxxxxxxx?= 這樣的形式,並從 RFC1522 中找到對應的標準支援。
折中考慮,結合了一、二的方式,程式碼片斷如下:
String fileName = URLEncoder.encode(atta.getFileName(), "UTF-8");
/*
*/
if (fileName.length() > 150) {
String guessCharset = xxxx
//根據request的locale 得出可能的編碼,中文作業系統通常是gb2312
fileName = new String(atta.getFileName().getBytes(guessCharset), "ISO8859-1");
}
response.setHeader("Content-Disposition", "attachment; filename=" + fileName);
編碼轉換的原理:
首先在源程式中將編碼設定成GB2312字元編碼,然後將源程式按Unicode編碼轉換成位元組碼載入到記憶體中(java載入到記憶體中的位元組碼都是Unicode編碼),然後按GB2312編碼獲得中文字串的位元組陣列,然後生成按ISO8859-1編碼形式的Unicode字串(這時的4個位元組就變成了8個位元組,高位位元組補零),
java培訓 北京java培訓 java培訓班 java就業培訓 java培訓機構 軟體培訓 最好的java培訓
當在網路中傳輸時,因為setHeader方法中的字元只能按ISO8859-1傳輸,所以這時候就又把Unicode字元轉換成了ISO8859-1的編碼傳到瀏覽器(就是把剛才高位補的零全去掉),這時瀏覽器接收到的ISO8859-1碼的字元因為符合GB2312編碼,所以就可以顯示中文了。
5. jsp翻譯成class時的編碼問題
記事本中程式碼塊1:
<%=
"a中文".length()
%>
程式碼塊2:
<%@ page pageEncoding="gbk"%>
<%=
"a中文".length()
%>
為什麼上面的輸出值為5,改成下面的則輸出3?
因為上面的程式碼沒有新增該檔案的編碼說明 , WEB應用程式在將jsp翻譯成class檔案時 , 把該字串的內容按預設的儲存方式指定的編碼ASCII碼來算的,在UTF-8中,原ASCII字元佔一個位元組,漢字佔兩個位元組,對應兩個字元,長度就變成了5 , 而下面的是GBK編碼, 一個漢字和一個英文都對應一個字元,得到結果就為3.
]
response.setHeader(...)檔名中有空格的時候
String fileName = StringUtils.trim(file.getName());
String formatFileName = encodingFileName(name);//在後面定義方法encodingFileName(String fileName); response.setHeader("Content-Disposition", "attachment; filename=" + formatFileName );
//處理檔名中出現的空格
//其中%20是空格在UTF-8下的編碼
public static String encodingFileName(String fileName) { String returnFileName = ""; try { returnFileName = URLEncoder.encode(fileName, "UTF-8"); returnFileName = StringUtils.replace(returnFileName, "+", "%20"); if (returnFileName.length() > 150) { returnFileName = new String(fileName.getBytes("GB2312"), "ISO8859-1"); returnFileName = StringUtils.replace(returnFileName, " ", "%20"); } } catch (UnsupportedEncodingException e) { e.printStackTrace(); if (log.isWarnEnabled()) { log.info("Don't support this encoding ..."); } } return returnFileName; }