Tomcat下byte[]轉String出現亂碼問題
阿新 • • 發佈:2019-01-05
Java Web課程老師給我們發了一份實驗指導書,上面有一個示例程式是這樣的:
<%@ page contentType="text/html;charset=gb2312"%>
<%!
public String codeToString(String str)
{//處理中文字串的函式
String s=str;
try
{
byte tempB[]=s.getBytes("ISO-8859-1");
s=new String(tempB);
return s;
}
catch(Exception e)
{
return s;
}
}
%>
<html>
<head>
<title>接收新使用者註冊</title>
</head>
<body>
這是新使用者註冊所提交的資料:
<br>
使用者名稱是:<%=codeToString(request.getParameter("username"))%><br>
密碼是:<%=codeToString(request.getParameter("userpassword"))%><br>
性別是:<%=codeToString(request.getParameter("sex" ))%><br>
出生年月是:<%=request.getParameter("year")+request.getParameter("month")+request.getParameter("day")%><br>
電子郵箱是:<%=request.getParameter("email")%><br>
家庭住址是:<%=codeToString(request.getParameter("address"))%><br>
</body>
</html>
就是接收表單資訊,然後顯示。但是在頁面顯示的時候,引數是中文的部分出現了亂碼。
然後上網查了原因,在這裡總結一下:
我們知道:tomcat預設的編碼格式是ISO-8859-1,是一種不相容中文的編碼格式。
我們使用request.getParameter()方法接收表單資訊或是資料庫的資訊的時候屬於一種後臺操作,所以我們的時候也要使用ISO-8859-1的格式去接收(如果是其他編碼格式,則會出現亂碼,如果省略後面的編碼格式,編碼格式為作業系統預設的編碼格式),所以byte tempB[]=s.getBytes("ISO-8859-1");
這一句並沒有錯,錯就錯在s=new String(tempB);
沒有顯式指明轉換的編碼格式,而是使用預設的編碼格式,即作業系統預設的編碼格式,伺服器系統一般為英文系統,所以系統預設的編碼格式是無法解析中文的。把它改為s=new String(tempB,"utf-8")
即可。