1. 程式人生 > 實用技巧 >字元編碼與字符集

字元編碼與字符集

1.字元編碼
編碼:字元(能看懂的)-->位元組(看不懂的)
解碼:位元組(看不懂的)-->字元(能看懂的)
亂碼:按照A規則儲存,同樣按照A規則解析,那麼會顯示正確的文字符號;
反之,按照A規則儲存,再按B規則解析,會導致亂碼現象。
字元編碼(Character Encoding):就是一套自然語言的字元與二進位制數之間的對應規則
編碼表:生活中文字和計算機中二進位制的對應規則

2.字符集就是編碼表,是系統所有字元的集合,包括各個國家文字、標點符號、圖形符號、數字

編碼引發的亂碼問題:

package iotest.bufferedIOtest;
/*FileReader在IDEA中預設的編碼格式為UTF-8
* FileReader讀取系統預設編碼(GBK),會出現亂碼
* 
*/ import java.io.FileInputStream; import java.io.FileReader; import java.io.IOException; public class ErrorCodeTest { public static void main(String[] args) throws IOException { FileReader fr = new FileReader("C:\\test\\系統預設GBK編碼文字1.txt"); int len =0; while ((len = fr.read()) != -1){ System.out.print((
char) len); } fr.close(); } }

執行結果為:

原始檔內容為:

出現了亂碼現象

解決亂碼的方法: