1. 程式人生 > >java程式實現Unicode碼和中文互相轉換筆記

java程式實現Unicode碼和中文互相轉換筆記

有了前一篇文章的瞭解,大概瞭解了unicode編碼格式了

ANSI:漢字區的內碼範圍高位元組從B0-F7,低位元組從A1-FE
Unicode:漢字的Unicode編碼範圍為\u4E00-\u9FA5 \uF900-\uFA2D,如果不在這個範圍內就不是漢字了.

現在程式中遇到的問題是,伺服器端傳送中文給android客戶端的時候,android客戶端獲取到字串然後顯示到介面上,可是顯示的結果是

unicode編碼格式开始兑奖所以呢,這要轉換啊

jdk有一個工具也提供轉換,是native2ascii.exe,在bin目錄下面,直接點開輸入中文就可以了

可是我們要在程式中將這個些开轉換成中文啊~~~~

String a="開始兌獎";
 System.out.println(a.codePointAt(0));

這個打印出來的是“開”字的开unicode碼的數字部分24320

System.out.println((char)24320);

這個打印出來的是將一個數字轉換成一個char型別,這個char型別就是一個代表這個unicode碼的中文字元,

打印出來結果為:開

有了這個就可以將unicode轉換成中文了

1:“位元組”是byte,“位”是bit ;

  2: 1 byte = 8 bit ;

  char 在java中是2個位元組。java採用unicode,2個位元組(16位)來表示一個字元。

  例子程式碼如下:

  1. publicclass Test {  
  2.     publicstaticvoid main(String[] args) {  
  3.         String str= "中";  
  4.         char x ='中';  
  5.         byte[] bytes=null;  
  6.         byte[] bytes1=null;  
  7.         try {  
  8.             bytes = str.getBytes("utf-8"
    );  
  9.             bytes1 = charToByte(x);  
  10.         } catch (UnsupportedEncodingException e) {  
  11.             // TODO Auto-generated catch block
  12.             e.printStackTrace();  
  13.         }  
  14.         System.out.println("bytes 大小:"+bytes.length);  
  15.         System.out.println("bytes1大小:"+bytes1.length);  
  16.     }  
  17.     publicstaticbyte[] charToByte(char c) {   
  18.         byte[] b = newbyte[2];   
  19.         b[0] = (byte) ((c & 0xFF00) >> 8);   
  20.         b[1] = (byte) (c & 0xFF);   
  21.         return b;   
  22.     }  
  23. }  

執行結果:

bytes 大小:3
bytes1大小:2

java是用unicode來表示字元,"中"這個中文字元的unicode就是2個位元組。

 String.getBytes(encoding)方法是獲取指定編碼的byte陣列表示,

通常gbk/gb2312是2個位元組,utf-8是3個位元組

如果不指定encoding則取系統預設的encoding。