SpringMVC之StringHttpMessageConverter引出的客戶端伺服器端之間的亂碼過程分析

阿新 • • 發佈：2019-01-18

繼續上一篇文章遺留的亂碼問題，引出從客戶端資料到伺服器端的亂碼和伺服器端資料到客戶端的亂碼。

先說明下配置：
web.xml,還是最簡單的配置
Java程式碼

<!DOCTYPE web-app PUBLIC
"-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN"
"http://java.sun.com/dtd/web-app_2_3.dtd" >
<web-app>
<display-name>Archetype Created Web Application</display-name>
<servlet>
<servlet-name>mvc</servlet-name>
<servlet-class>org.springframework.web.servlet.DispatcherServlet</servlet-class>
<load-on-startup>1</load-on-startup>
</servlet>
<servlet-mapping>
<servlet-name>mvc</servlet-name>
<url-pattern>/*</url-pattern>
</servlet-mapping>
</web-app>

mvc-servlet.xml配置：
Java程式碼

<?xml version="1.0" encoding="UTF-8" ?>
<beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:mvc="http://www.springframework.org/schema/mvc"

xmlns:util="http://www.springframework.org/schema/util" xmlns:context="http://www.springframework.org/schema/context"
xsi:schemaLocation="http://www.springframework.org/schema/beans
http://www.springframework.org/schema/beans/spring-beans-3.1.xsd
http://www.springframework.org/schema/mvc
http://www.springframework.org/schema/mvc/spring-mvc-3.1.xsd
http://www.springframework.org/schema/util
http://www.springframework.org/schema/util/spring-util-2.0.xsd
http://www.springframework.org/schema/context
http://www.springframework.org/schema/context/spring-context-3.2.xsd">
<mvc:annotation-driven/>
<bean class="com.lg.mvc.StringAction"/>
<bean name="/index" class="com.lg.mvc.HomeAction"></bean>
<bean class="org.springframework.web.servlet.view.freemarker.FreeMarkerConfigurer">
<property name="templateLoaderPath" value="/WEB-INF/views" />
<property name="defaultEncoding" value="utf-8" />
<property name="freemarkerSettings">
<props>
<prop key="locale">zh_CN</prop>
</props>
</property>
</bean>
<bean class="org.springframework.web.servlet.view.freemarker.FreeMarkerViewResolver">
<property name="suffix" value=".html" />
<property name="contentType" value="text/html;charset=utf-8" />
<property name="requestContextAttribute" value="request" />
<property name="exposeRequestAttributes" value="true" />
<property name="exposeSessionAttributes" value="true" />
</bean>
</beans>

先說說伺服器端資料到客戶端的亂碼：
第一種情況：
Java程式碼

@Controller
public class StringAction {
@ResponseBody
@RequestMapping(value="/string",method=RequestMethod.GET)
public String testMessageConverter(String name){
return "中國";
}
}

當訪問 http://localhost:8080/string?name=aaa時，瀏覽器看到的是亂碼：

分析過程：
有了上一篇文章的知識，便可以知道原因。首先由RequestMappingHandlerAdapter來排程執行，由於是@ResponseBody，所以從所有的已註冊的HandlerMethodReturnValueHandler中找到了@ResponseBody的支持者RequestResponseBodyMethodProcess。然後就是根據客戶端Accept欄位指定的多個content-type和伺服器端指定的content-type進行比較配對，選出最合適的一個content-type。此時@RequestMapping中並沒有為produces指定相應的content-type，所以會獲取所有的已註冊的HttpMessageConverter所支援的content-type作為伺服器端指定的content-type。在本工程中最終會選出text/html作為最終的content-type,伺服器端資料要以text/html形式寫入response的body中。有了返回值的型別為String和content-type為text/html，然後就是從已註冊的HttpMessageConverter中找到一個支援這兩者的HttpMessageConverter，然後就找到了StringHttpMessageConverter，它有兩個建構函式，一個可以指定字符集，當你什麼都沒有指定時，預設使用ISO-8859-1。在將返回值"中國"以text/html形式寫入response的body中時，StringHttpMessageConverter先從上述所選出的content-type（即text/html）中嘗試獲取字符集，若獲取不到，則使用自己預設的ISO-8859-1,最終的寫入程式碼為：StreamUtils.copy(s, charset, outputMessage.getBody());
s就是返回值"中國"，charset就為StringHttpMessageConverter預設的ISO-8859-1，造成了編碼方式不對，同時ISO-8859-1是不支援中文的，所以就出現了亂碼。對以上過程還不清楚的，可以看上一篇文章的介紹。

在整個伺服器端資料返回到瀏覽器的過程中，涉及到三次編碼。

第一次：java檔案以什麼編碼存放在硬碟中，目前我的工程全部使用UTF-8編碼方式，所以程式中的中國是以UTF-8形式編碼的

第二次：中國這個字串是以什麼編碼方式轉換成位元組陣列的，由於未指定@RequestMapping的produces屬性，同時也未給StringHttpMessageConverter指定編碼方式，最終‘中國’這個
字串是以ISO-8859-1形式轉換成位元組陣列的

第三次：資料傳送給瀏覽器後，瀏覽器接收到一堆位元組陣列，瀏覽器又是以什麼編碼方式來解碼的。

這樣才能保證不會亂碼，首先java檔案是以UTF-8形式儲存的，然後指定StringHttpMessageConverter或者@RequestMapping的produces的編碼方式為UTF-8，最後發給瀏覽器的header中的content-type也為UTF-8，這樣才不會亂碼。

針對本工程：
解決方案一：
指定@RequestMapping的produces為"text/html;charset=UTF-8"即可解決亂碼。
首先"中國"是以UTF-8編碼的方式存在硬碟中，即硬碟中儲存的是'-28 -72 -83;-27 -101 -67'，然後又指定了response的content-type為"text/html;charset=UTF-8",此時StringHttpMessageConverter可以從這個content-type讀取到編碼方式，便不再採用預設的編碼方式ISO-8859-1。執行"中國".getBytes("UTF-8")（即為上述所寫的位元組陣列）將這些位元組陣列寫人response的body中，同時設定response的content-type為produces的值即text/html;charset=UTF-8，瀏覽器拿到這個content-type便知道以UTF-8形式來解碼這些位元組陣列，便又得到的'中國'。你也可以設定瀏覽器以GBK編碼方式來解碼這些位元組陣列，必然又會出現亂碼。所以上述三個過程的編碼都統一才會保證不會亂碼。也就是你可以全部指定上述三個過程的編碼全是GBK，仍然不會亂碼。出現亂碼必然是上述三個過程的編碼不一致造成的。

解決方案二：
指定StringHttpMessageConverter的編碼方式為UTF-8,如下：
Java程式碼

<mvc:annotation-driven>
<mvc:message-converters>
<bean class="org.springframework.http.converter.StringHttpMessageConverter">
<constructor-arg value="UTF-8"/>
</bean>
</mvc:message-converters>
</mvc:annotation-driven>

它背後的內容先暫不解釋，下一篇文章再介紹。這裡只是在StringHttpMessageConverter構造時，傳入一個UTF-8的字符集進去，會呼叫如下建構函式：
Java程式碼

/**
* A constructor accepting a default charset to use if the requested content
* type does not specify one.
*/
public StringHttpMessageConverter(Charset defaultCharset) {
super(new MediaType("text", "plain", defaultCharset), MediaType.ALL);
this.defaultCharset = defaultCharset;
this.availableCharsets = new ArrayList<Charset>(Charset.availableCharsets().values());
}

這樣就更該了StringHttpMessageConverter的預設字符集編碼為UTF-8。但是這樣做有一個問題就是並沒有為content-type的字符集設定為UTF-8。看如下程式碼：
Java程式碼

/**
* This implementation delegates to {@link #getDefaultContentType(Object)} if a content
* type was not provided, calls {@link #getContentLength}, and sets the corresponding headers
* on the output message. It then calls {@link #writeInternal}.
*/
@Override
public final void write(final T t, MediaType contentType, HttpOutputMessage outputMessage)
throws IOException, HttpMessageNotWritableException {
final HttpHeaders headers = outputMessage.getHeaders();
if (headers.getContentType() == null) {
MediaType contentTypeToUse = contentType;
if (contentType == null || contentType.isWildcardType() || contentType.isWildcardSubtype()) {
contentTypeToUse = getDefaultContentType(t);
}
if (contentTypeToUse != null) {
headers.setContentType(contentTypeToUse);
}
}
if (headers.getContentLength() == -1) {
Long contentLength = getContentLength(t, headers.getContentType());
if (contentLength != null) {
headers.setContentLength(contentLength);
}
}
if (outputMessage instanceof StreamingHttpOutputMessage) {
StreamingHttpOutputMessage streamingOutputMessage =
(StreamingHttpOutputMessage) outputMessage;
streamingOutputMessage.setBody(new StreamingHttpOutputMessage.Body() {
@Override
public void writeTo(final OutputStream outputStream) throws IOException {
writeInternal(t, new HttpOutputMessage() {
@Override
public OutputStream getBody() throws IOException {
return outputStream;
}
@Override
public HttpHeaders getHeaders() {
return headers;
}
});
}
});
}
else {
writeInternal(t, outputMessage);
outputMessage.getBody().flush();
}
}

關鍵是執行順序，先是根據request的Accept指定的content-type和@RequestMapping的produces指定的content-type，或者是所有的HttpMessageConverter所支援的content-type選出一個最合適的content-type，最終選出為text/html，然後將它作為contentType引數傳入上面的方法中，接下來就在設定header的content-type，根據程式碼最終會設定content-type為text/html但是不含字符集編碼，然後才是呼叫StringHttpMessageConverter的寫入方法，將中國以StringHttpMessageConverter的編碼集UTF-8轉換成位元組陣列寫入resposne的body中。
此時，返回給瀏覽器的content-type欄位並沒有指定編碼集，它將以它預設的方式來解碼。
如下content-type並沒有編碼方式，而方案一的content-type是有編碼方式的

如果瀏覽器的預設編碼為UTF-8則不會顯示亂碼，如果為GBK則會顯示亂碼。可以用chrome瀏覽器進行測試：
設定chrome瀏覽器的預設編碼方式如下：
工具-》設定-》高階設定-》自定義字型

至此就說完了伺服器端傳送資料到瀏覽器這一過程中的亂碼問題。然後接下來就要說瀏覽器客戶端傳資料到伺服器端顯示過程中的亂碼問題。

StringAction新加一個方法如下：
Java程式碼

@ResponseBody
@RequestMapping(value="/test",method=RequestMethod.GET)
public String testClient(String name){
System.out.println(name);
return "abc";
}

此時先不用管伺服器端返回給瀏覽器的亂碼問題，只關注瀏覽器端傳送給伺服器端的資料，在伺服器端是否能打印出正常資料。
訪問http://localhost:8080/test?name=中國，伺服器端的列印情況為：

出現了亂碼。
首先分析下整個過程涉及到幾次編碼：

第一次：當你輸入http://localhost:8080/test?name=中國的時候，瀏覽器將以什麼樣的編碼方式將中國轉化成位元組陣列，這稱為URL編碼

第二次：當瀏覽器傳送請求時，伺服器是以請求的content-type來解析請求資料的，當瀏覽器請求沒有指定content-type時，伺服器又是採用什麼樣的編碼來解析的

亂碼的本質：這兩次編碼方式不一致

針對第一個過程，當你僅僅在瀏覽器上輸入http://localhost:8080/test?name=中國來訪問時，不同的瀏覽器會採用不同編碼方式來將中國轉換成位元組陣列。比如說chrome瀏覽器始終以UTF-8的編碼形式將中國轉換成位元組陣列。而目前我的IE瀏覽器則是以GBK的編碼方式來轉換的，你可以找一找如何設定瀏覽器的這些行為，本文不再說明。正是由於上述不同瀏覽器的不同處理情況，導致了可能用chrome傳送伺服器端正常，IE傳送則亂碼的現象。

針對第二個過程：由於我們未指定request的content-type，伺服器來解析這些位元組陣列，它到底採用什麼樣的方式來解析呢，不同的伺服器應該有不同的策略，並且可以進行設定。如Tomcat伺服器，預設採用的是ISO-8859-1，你可以修改Tomcat的conf/server.xml檔案來修改Tomcat的預設編碼解析方式。

這裡的tomcat版本是7，在tomcat8中已修訂，不存在這個亂碼問題

情況分析完了，針對我的工程就要解決這一亂碼問題。
首先我使用chrmoe瀏覽器傳送http://localhost:8080/test?name=中國，它預設以UTF-8形式傳送給伺服器，我的tomcat伺服器沒有更改預設的編碼，即仍是採用ISO-8859-1來解析那些沒有指定content-type的請求。
中國經過chrome瀏覽器的以UTF-8形式的編碼變為-》%E4%B8%AD%E5%9B%BD，然後此請求沒有指定content-type，所以tomcat將採用ISO-8859-1來解碼，然後肯定就出現了亂碼。

解決方式一：方法引數name是tomcat用ISO-8859-1解碼出來的，我們需要再把它仍按照ISO-8859-1編碼回去得到瀏覽器傳過來的原始位元組陣列，這些位元組陣列就是chrome以UTF-8形式將中國編碼的，所以我們只需要將這些位元組陣列以UTF-8方式再解碼一次，就可以得到正常的資料了。其實就是撤銷掉tomcat的解碼操作，還原瀏覽器傳過來的原始位元組陣列，然後再按照瀏覽器的編碼方式來解碼這些位元組陣列，程式碼如下：

然而這種方式，只能針以UTF-8形式編碼資料的瀏覽器，對於IE仍是亂碼，若將程式碼改為以GBK來編碼原始資料則IE是正常的，chrome則出問題：
Java程式碼

@ResponseBody
@RequestMapping(value="/test",method=RequestMethod.GET)
public String testClient(String name) throws UnsupportedEncodingException{
System.out.println(new String(name.getBytes("ISO-8859-1"),"GBK"));
return "abc";
}

解決方式二：就是更改伺服器的預設編碼配置，如tomcat，在conf/server.xml檔案中
使用URIEncoding='UTF-8'。這個設定是針對url中的請求引數的編碼的就是針對?name='中國'這種引數的編碼
Java程式碼

<Connector port="8080" protocol="HTTP/1.1"
connectionTimeout="20000"
redirectPort="8443" URIEncoding='UTF-8'/>

仍是上述問題，對於chrome是正常的，但對IE就亂碼。由於chrome是以UTF-8編碼的，伺服器又是以UTF-8解碼的，所以正常。對於IE，IE是以GBK編碼的，伺服器仍採用UTF-8來解碼肯定出現亂碼。對於chrome如下：

至此瀏覽器傳送資料到伺服器亂碼，伺服器傳送資料到瀏覽器亂碼的兩個過程的原理都說完了。不知道你是否完全理解了，有沒有信心去幫助別人解決亂碼問題。

SpringMVC之StringHttpMessageConverter引出的客戶端伺服器端之間的亂碼過程分析

SpringMVC之StringHttpMessageConverter引出的客戶端伺服器端之間的亂碼過程分析

python網路程式設計（TCP客戶端/伺服器端實現）

GCM(谷歌雲推送)客戶端伺服器端開發全指南（伺服器篇）

GCM(谷歌雲推送)客戶端伺服器端開發全指南（客戶端）

Java6學習筆記64——UDP客戶端/伺服器端

客戶端伺服器端資料同步策略一

從0開始編寫一個應用（android端+小程式端+伺服器端）第二步專案經理完成邏輯圖。（上：產品經理的思考）

從0開始編寫一個應用（android端+小程式端+伺服器端）第二步專案經理完成邏輯圖。（下：產品細節思考後的實現邏輯圖）

android上傳檔案至伺服器（android端+伺服器端）

（九）springmvc之json的數據請求（客戶端發送json數據到服務端）

C#程式設計 socket程式設計之tcp伺服器端和客戶端

C#程式設計 socket程式設計之udp伺服器端和客戶端

libevent學習之三：簡單的伺服器和客戶端

Android客戶端+mysql+springmvc伺服器端實現登陸的小案例

極光推送之伺服器端向android等客戶端推送例項

Zookeeper之Zookeeper底層客戶端架構實現原理（轉載）

搭建backup服務器rsyncdaemon服務模式之二rsync客戶端配置

python之模仿ssh客戶端

基於windows的簡單伺服器端和客戶端

DataTables的伺服器端（SpringMVC）分頁模式

SpringMVC之StringHttpMessageConverter引出的客戶端伺服器端之間的亂碼過程分析

相關推薦