漢字unicode編碼範圍
阿新 • • 發佈:2019-01-23
GB2312編碼:1981年5月1日釋出的簡體中文漢字編碼國家標準。GB2312對漢字採用雙位元組編碼,收錄7445個圖形字元,其中包括6763個漢字。
BIG5編碼:臺灣地區繁體中文標準字符集,採用雙位元組編碼,共收錄13053箇中文字,1984年實施。
GBK編碼:1995年12月釋出的漢字編碼國家標準,是對GB2312編碼的擴充,對漢字採用雙位元組編碼。GBK字符集共收錄21003個漢字,包含國家標準GB13000-1中的全部中日韓漢字,和BIG5編碼中的所有漢字。
GB18030編碼:2000年3月17日釋出的漢字編碼國家標準,是對GBK編碼的擴充,覆蓋中文、日文、朝鮮語和中國少數民族文字,其中收錄27484個漢字。GB18030字符集採用單位元組、雙位元組和四位元組三種方式對字元編碼。相容GBK和GB2312字符集。
Unicode編碼:國際標準字符集,它將世界各種語言的每個字元定義一個唯一的編碼,以滿足跨語言、跨平臺的文字資訊轉換。
漢字unicode編碼表:
一般使用2w基本漢字就夠了
字符集 | 字數 | Unicode 編碼 |
基本漢字 | 20902字 | 4E00-9FA5 |
38字 | 9FA6-9FCB | |
擴充套件A | 6582字 | 3400-4DB5 |
擴充套件B | 42711字 | 20000-2A6D6 |
擴充套件C | 4149字 | 2A700-2B734 |
擴充套件D | 222字 | 2B740-2B81D |
康熙部首 | 214字 | 2F00-2FD5 |
部首擴充套件 | 115字 | 2E80-2EF3 |
相容漢字 | 477字 | F900-FAD9 |
相容擴充套件 | 542字 | 2F800-2FA1D |
部件擴充套件 | 452字 | E400-E5E8 |
PUA增補 | 207字 | E600-E6CF |
漢字筆畫 | 36字 | 31C0-31E3 |
漢字結構 | 12字 | 2FF0-2FFB |
漢語註音 | 22字 | 3105-3120 |
註音擴充套件 | 22字 | 31A0-31BA |
〇 | 1字 | 3007 |