1. 程式人生 > >\u Unicode和漢字轉化

\u Unicode和漢字轉化

介紹

\uxxxx這種格式是Unicode寫法,表示一個字元,其中xxxx表示一個16進位制數字,範圍所0~65535. Unicode十六進位制數只能包含數字0~9、大寫字母A~F或者小寫字母A~F。需要注意到是:Unicode的大小端問題,一般都是小端在前,例如 \u5c0f 表示漢語中的 ''字,轉換成10進位制就是9215,所以在byte陣列中應該是1592.

漢字轉Unicode

複製程式碼
 private string Unicode2Chinese(string strUnicode)
{
    string[] splitString = new string[1];
    splitString[
0] = "\\u"; string[] unicodeArray = strUnicode.Split(splitString, StringSplitOptions.RemoveEmptyEntries); StringBuilder sb = new StringBuilder(); foreach (string item in unicodeArray) { byte[] codes = new byte[2]; int code1, code2; code1 = Convert.ToInt32(item.Substring(0
, 2), 16); code2 = Convert.ToInt32(item.Substring(2), 16); codes[0] = (byte)code2;//必須是小端在前 codes[1] = (byte)code1; sb.Append(Encoding.Unicode.GetString(codes)); } return sb.ToString(); }
複製程式碼

Unicode轉漢字

複製程式碼
private string Chinese2Unicode(string strChinese)
{
    string
strUnicodes = string.Empty; foreach (char item in strChinese.ToCharArray()) { strUnicodes += "\\u" + ((int)item).ToString("x"); //16進位制 } return strUnicodes; }
複製程式碼