java下輸出中文的一點研究

阿新 • • 發佈：2018-11-16

網上或者大部分書上都說Java中輸出中文使用FileReader類就可以了，但是當你讀取一箇中文文件時，你會發現，除了亂碼，還是亂碼。究其原因，這其實是檔案流讀取時使用的編碼方式和檔案本身編碼方式不同,造成讀取出來檔案亂碼。還有一個細節，當你使用read()直接讀取字元輸出時，無論如何都是讀不出中文的。關於這類問題，給出兩種解決方案：

一、使用BufferedReader類包裝一下FileReader類，然後使用BufferedReader::readLine()方法讀取一行的String,然後用這個String再去構造一個新的String輸出，具體如下：

FileReader f = new 
 FileReader("test.txt");
BufferedReader is = new BufferedReader(f);
String str = null;
while((str = is.readLine()) != null){
System.out.println(new String(str.getBytes("GBK","utf-8"));
}

這樣就能輸出大概正確的中文了。為什麼說是大概呢？因為它可能還會有“？？？”或者其他一些糟心的符號。因此這種方法並不完美。另一種方法如下：

二、使用FileInputStream類讀取檔案，然後使用InputStreamReader類來封裝，最後再使用BufferdReader來讀取一行：

FileInputStream f = new FileInputStream("test.txt");
InputStreamReader is = new InputStreamReader(f,"utf-8");
BufferedReader ret = nrew BufferedReader(is);

String str = null;

while((str = ret.readLine()) != null){
System.out.println(str);
}

使用這種方法就能完美顯示中文，而沒有亂碼。但是要求中文文字使用utf-8編碼。

另外，還有一種編碼是utf-8-BOM編碼，這種編碼和utf-8不一樣，他在檔案開頭有三個位元組的識別符號，如下圖第一行：

ef bb bf 就是檔案識別符號，上圖中第一行是utf-8-BOM的“我是陳宇翔”的十六進位制編碼，第二行是utf-8的“我是陳宇翔”的十六進位制編碼。我們發現，第一行的後十五個位元組和第二行完全一樣。所以當你使用utf-8-BOM的文件，而使用utf-8方式去讀取時，輸出的第一個字元會是亂碼。同時我們還發現，utf-8編碼的中文字元是三位元組的。

java下輸出中文的一點研究

java下輸出中文的一點研究

Android Studio解決Java程序輸出中文亂碼

Linux中java log輸出中文亂碼

Linux下java程式碼log4j日誌輸出中文出現亂碼，中文全部變成問號，解決辦法

關於在eclipse下java程式從控制檯輸入輸出中文亂碼問題

win10下使用vscode除錯python輸出中文亂碼的解決辦法

LINUX下CPU Load Average的一點研究

log4cplus：如何在windows下使用log4cplus以UTF-8編碼輸出中文

java輸入輸出14：IO流（位元組流讀寫中文）

windows下java環境變數的一點心得

VS2015,UNICODE字符集下printf,cout列印CString,與TRACE輸出中文除錯

java語言輸出金額x的中文大寫形式字串

cmd下sql輸出中文亂碼

python2.7下不能正常輸出中文陣列某個元素的解決辦法

java 輸入輸出流和File簡單解析（附android中文亂碼問題解決）

easyui-combobox下拉框滾動條不顯示&Java中的中文排序

解決Django框架下輸出文字亂碼，但是在Mysql中是中文的問題

JAVA學習中的一點小發現：LinkedList中.poll()方法在輸出時使用應注意的小點

關於win終端下python輸出中文亂碼問題

java下執行DOS命令，讀取輸出

java下輸出中文的一點研究

相關推薦