Java FileInputStream讀中文亂碼問題解決方案
阿新 • • 發佈:2020-10-30
1、前提
以讀取編碼是GBK的檔案為案例,檔案內容只有中文和中文符號
2、原因
FileInputStream讀中文亂碼是因為一箇中文對應兩個位元組儲存(負數),也就是說,讀取對應中文的位元組數應該是偶數; 而英文對應一個位元組儲存。FileInputStream每次讀取一個數組長度的位元組時,讀取的中文位元組數可能是奇數,也就是隻讀到中文的一半位元組,出現亂碼。
3、解決方法
一次讀取所有位元組,此方法不靠譜,因為不確定總位元組數。
在輸出時進行判斷,遍歷陣列判斷負數的個數,如果是奇數,說明讀取到中文的一半位元組,對陣列進行擴容再輸出;否則正常輸出
4、程式碼案例
package 第二題; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; import java.io.UnsupportedEncodingException; import java.util.Arrays; public class MainTest { public static void main(String[] args) throws UnsupportedEncodingException { // 建立File物件 File file = new File("D:\\filetest\\file4.txt"); FileInputStream fileInputStream = null; try { // 新建一個FileInputStream物件 fileInputStream = new FileInputStream(file); // 新建一個位元組陣列 byte[] buf = new byte[2]; // read(buf):此方法的返回值就是當前讀取的位元組個數,將資料讀取到buf陣列 // 將readLen變數也就是read方法的返回值,當此變數等於-1,則讀到檔案末尾 int readLen = -1; //讀取檔案資料 while ((readLen = fileInputStream.read(buf)) != -1) { int pos=0;//記錄負數的個數 for(byte v:buf) { if(v<0) { pos++; } } //負數個數為偶數,讀取完整,沒有讀取到半個中文 if(pos%2==0) { // 將位元組陣列轉換成字串 String content = new String(buf,readLen); System.out.print(content); }else {//負數個數為奇數,讀取不完整,會亂碼 //再讀取下一位位元組 int nextByteValue=fileInputStream.read(); int nextLen=readLen+1; //位元組陣列擴容一位 buf= Arrays.copyOf(buf,nextLen); buf[readLen]= (byte) nextByteValue; String content=new String(buf,nextLen); System.out.print(content); //奇數,位元組補全 //針對陣列擴容一個位元組單元 /* buf=Arrays.copyOf(buf,readLen+1); int nextByteValue=fileInputStream.read(); buf[readLen]= (byte) nextByteValue; String content = new String(buf,readLen); System.out.print(content);*/ } } } catch (FileNotFoundException e) { // 輸出堆疊資訊 e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } finally { try { // 檔案輸入流關閉(釋放資源) fileInputStream.close(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } } } }
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。