1. 程式人生 > >漢字unicode編碼範圍

漢字unicode編碼範圍



GB2312編碼:1981年5月1日釋出的簡體中文漢字編碼國家標準。GB2312對漢字採用雙位元組編碼,收錄7445個圖形字元,其中包括6763個漢字

BIG5編碼:臺灣地區繁體中文標準字符集,採用雙位元組編碼,共收錄13053箇中文字,1984年實施。

GBK編碼:1995年12月釋出的漢字編碼國家標準,是對GB2312編碼的擴充,對漢字採用雙位元組編碼。GBK字符集共收錄21003個漢字,包含國家標準GB13000-1中的全部中日韓漢字,和BIG5編碼中的所有漢字。

GB18030編碼:2000年3月17日釋出的漢字編碼國家標準,是對GBK編碼的擴充,覆蓋中文、日文、朝鮮語和中國少數民族文字,其中收錄27484個漢字。GB18030字符集採用單位元組、雙位元組和四位元組三種方式對字元編碼。相容GBK和GB2312字符集。

Unicode編碼:國際標準字符集,它將世界各種語言的每個字元定義一個唯一的編碼,以滿足跨語言、跨平臺的文字資訊轉換。

漢字unicode編碼表:

一般使用2w基本漢字就夠了
字符集 字數 Unicode 編碼
基本漢字 20902字 4E00-9FA5
38字 9FA6-9FCB
擴充套件A 6582字 3400-4DB5
擴充套件B 42711字 20000-2A6D6
擴充套件C 4149字 2A700-2B734
擴充套件D 222字 2B740-2B81D
康熙部首 214字 2F00-2FD5
部首擴充套件 115字 2E80-2EF3
相容漢字 477字 F900-FAD9
相容擴充套件 542字 2F800-2FA1D
部件擴充套件 452字 E400-E5E8
PUA增補 207字 E600-E6CF
漢字筆畫 36字 31C0-31E3
漢字結構 12字 2FF0-2FFB
漢語註音 22字 3105-3120
註音擴充套件 22字 31A0-31BA
1字 3007