java程式實現Unicode碼和中文互相轉換筆記
有了前一篇文章的瞭解,大概瞭解了unicode編碼格式了
ANSI:漢字區的內碼範圍高位元組從B0-F7,低位元組從A1-FE
Unicode:漢字的Unicode編碼範圍為\u4E00-\u9FA5 \uF900-\uFA2D,如果不在這個範圍內就不是漢字了.
現在程式中遇到的問題是,伺服器端傳送中文給android客戶端的時候,android客戶端獲取到字串然後顯示到介面上,可是顯示的結果是
unicode編碼格式开始兑奖所以呢,這要轉換啊
jdk有一個工具也提供轉換,是native2ascii.exe,在bin目錄下面,直接點開輸入中文就可以了
可是我們要在程式中將這個些开轉換成中文啊~~~~
String a="開始兌獎";
System.out.println(a.codePointAt(0));
這個打印出來的是“開”字的开unicode碼的數字部分24320
System.out.println((char)24320);
這個打印出來的是將一個數字轉換成一個char型別,這個char型別就是一個代表這個unicode碼的中文字元,
打印出來結果為:開
有了這個就可以將unicode轉換成中文了
1:“位元組”是byte,“位”是bit ;
2: 1 byte = 8 bit ;
char 在java中是2個位元組。java採用unicode,2個位元組(16位)來表示一個字元。
例子程式碼如下:
- publicclass Test {
- publicstaticvoid main(String[] args) {
- String str= "中";
- char x ='中';
- byte[] bytes=null;
- byte[] bytes1=null;
- try {
-
bytes = str.getBytes("utf-8"
- bytes1 = charToByte(x);
- } catch (UnsupportedEncodingException e) {
- // TODO Auto-generated catch block
- e.printStackTrace();
- }
- System.out.println("bytes 大小:"+bytes.length);
- System.out.println("bytes1大小:"+bytes1.length);
- }
- publicstaticbyte[] charToByte(char c) {
- byte[] b = newbyte[2];
- b[0] = (byte) ((c & 0xFF00) >> 8);
- b[1] = (byte) (c & 0xFF);
- return b;
- }
- }
執行結果:
bytes 大小:3
bytes1大小:2
java是用unicode來表示字元,"中"這個中文字元的unicode就是2個位元組。
String.getBytes(encoding)方法是獲取指定編碼的byte陣列表示,
通常gbk/gb2312是2個位元組,utf-8是3個位元組。
如果不指定encoding則取系統預設的encoding。