1. 程式人生 > >Tomcat下byte[]轉String出現亂碼問題

Tomcat下byte[]轉String出現亂碼問題

Java Web課程老師給我們發了一份實驗指導書,上面有一個示例程式是這樣的:

<%@ page contentType="text/html;charset=gb2312"%>
<%!
public String codeToString(String str)
{//處理中文字串的函式
  String s=str;
  try
    {
    byte tempB[]=s.getBytes("ISO-8859-1");
    s=new String(tempB);
    return s;
}
catch(Exception e)
{
  return s;
}
}
%>
<html> <head> <title>接收新使用者註冊</title> </head> <body> 這是新使用者註冊所提交的資料: <br> 使用者名稱是:<%=codeToString(request.getParameter("username"))%><br> 密碼是:<%=codeToString(request.getParameter("userpassword"))%><br> 性別是:<%=codeToString(request.getParameter("sex"
))%>
<br> 出生年月是:<%=request.getParameter("year")+request.getParameter("month")+request.getParameter("day")%><br> 電子郵箱是:<%=request.getParameter("email")%><br> 家庭住址是:<%=codeToString(request.getParameter("address"))%><br> </body> </html>

就是接收表單資訊,然後顯示。但是在頁面顯示的時候,引數是中文的部分出現了亂碼。
然後上網查了原因,在這裡總結一下:
我們知道:tomcat預設的編碼格式是ISO-8859-1,是一種不相容中文的編碼格式。
我們使用request.getParameter()方法接收表單資訊或是資料庫的資訊的時候屬於一種後臺操作,所以我們的時候也要使用ISO-8859-1的格式去接收(如果是其他編碼格式,則會出現亂碼,如果省略後面的編碼格式,編碼格式為作業系統預設的編碼格式),所以byte tempB[]=s.getBytes("ISO-8859-1");這一句並沒有錯,錯就錯在s=new String(tempB);沒有顯式指明轉換的編碼格式,而是使用預設的編碼格式,即作業系統預設的編碼格式,伺服器系統一般為英文系統,所以系統預設的編碼格式是無法解析中文的。把它改為s=new String(tempB,"utf-8") 即可。