1. 程式人生 > >3.6.6 碼點與程式碼單元

3.6.6 碼點與程式碼單元

    Java字串由char值序列組成。char資料型別是一個採用UTF-16編碼表示Unicode碼點的程式碼單元。大多數的常用Unicode字元使用一個程式碼單元就可以表示,而輔助字元需要一對程式碼單元表示。     length方法返回採用UTF-16編碼表示的給定字串所需要的程式碼單元數量。例如:         String greeting = "Hello";         int n = greeting.length();       要想得到實際的長度,即碼點數量,可以呼叫:         int cpCount = greeting.codePointCount(0, greeting.length());       呼叫s.charAt(n)將返回位置n的程式碼單元,n介於 0 ~ s.length() - 1之間。       要想得到第i個碼點,應該使用下列語句         int index = greeting.offsetByCodePoints(0,i);         int cp = greeting.codePointAt(index);