這“⼀⼝”和那“一口”有什麼不同,關於unicode一個小知識
雖然這“⼀⼝”和那“一口”大體是相似的,不過仔細一點兒看就會發現它們的字型並不相同(如果字型支援的不夠的話,很有可能這“⼀⼝”還會顯示不出來)。這裡,如果把文字拷貝到程式碼中獲取一下他們的unicode編碼,就會發現,這“⼀⼝”對應的是\u2f00\u2f1d,而那“一口”對應的是\u4e00\u53e3。
為什麼這兩口會有這樣的差別呢,其實謹慎的說,這“⼀⼝”並不是漢字,而是漢字的部首,在unicode的標準中有一個專門的分類來標識部首,叫做“KANGXI RADICAL”。在這裡看到“部首”不需要驚慌,開啟家裡的《新華字典》翻到部首檢字表,那個部首的列表,就是我們這裡說到的unicode的部首的列表,可能在總數上略微有些差別,但是大體的意思是沒問題的。在unicode中,康熙部首(KANGXI RADICAL)總共有214個,編碼範圍是從U+2F00到U+2FD5,內容是根據《康熙字典》來定義的,具體可以參考
以上就是這“⼀⼝”和那“一口”的區別,但是除了區別之外,這“⼀⼝”和那“一口”還是有聯絡的,這個聯絡就是unicode的正規化。unicode正規化根據每一個字的具體的含義,把一些相同字的不同變形都對應到了同一個字元上,這樣就可以方便一些本來應該是同一個字的不同字元的比較。unicode正規化也會分為幾種型別,分別是NFC,NFKC,NFD,NFKD,這些型別的命名中NF就是normal form的縮寫,C(Canonical)表示是規範的,K(Compitable)表示相容的,也就是一些相對通用但是並非標準的也可以涵蓋,D(Decomposition)表示分解,比如㉂(U+3242)這個字元的NFKD就是"(自)",從一個字元變成了三個字元。那麼現在就可以說回這“⼀⼝”和那“一口”了,如果把這“⼀⼝”轉換成而來NFKC或者NFKD的形式,就會成為那“一口”。在一些漢字處理的操作中,因為這“⼀⼝”可能字型的支援沒有那麼好,把文章整體處理成那“一口”,也是一種保障體驗的方法。
下面把全部的KANGXI RADICAL的unicode字元以及該字元所對應的不同的正規化的形式,都列在了下面的表格上
Radical | Unicode | NFC | NFKC | NFD | NFKD |
⼀ | U+2F00 | ⼀ (U+2F00) | 一 (U+4E00) | ⼀ (U+2F00) | 一 (U+4E00) |
⼁ | U+2F01 | ⼁ (U+2F01) | 丨 (U+4E28) | ⼁ (U+2F01) | 丨 (U+4E28) |
⼂ | U+2F02 | ⼂ (U+2F02) | 丶 (U+4E36) | ⼂ (U+2F02) | 丶 (U+4E36) |
⼃ | U+2F03 | ⼃ (U+2F03) | 丿 (U+4E3F) | ⼃ (U+2F03) | 丿 (U+4E3F) |
⼄ | U+2F04 | ⼄ (U+2F04) | 乙 (U+4E59) | ⼄ (U+2F04) | 乙 (U+4E59) |
⼅ | U+2F05 | ⼅ (U+2F05) | 亅 (U+4E85) | ⼅ (U+2F05) | 亅 (U+4E85) |
⼆ | U+2F06 | ⼆ (U+2F06) | 二 (U+4E8C) | ⼆ (U+2F06) | 二 (U+4E8C) |
⼇ | U+2F07 | ⼇ (U+2F07) | 亠 (U+4EA0) | ⼇ (U+2F07) | 亠 (U+4EA0) |
⼈ | U+2F08 | ⼈ (U+2F08) | 人 (U+4EBA) | ⼈ (U+2F08) | 人 (U+4EBA) |
⼉ | U+2F09 | ⼉ (U+2F09) | 兒 (U+513F) | ⼉ (U+2F09) | 兒 (U+513F) |
⼊ | U+2F0A | ⼊ (U+2F0A) | 入 (U+5165) | ⼊ (U+2F0A) | 入 (U+5165) |
⼋ | U+2F0B | ⼋ (U+2F0B) | 八 (U+516B) | ⼋ (U+2F0B) | 八 (U+516B) |
⼌ | U+2F0C | ⼌ (U+2F0C) | 冂 (U+5182) | ⼌ (U+2F0C) | 冂 (U+5182) |
⼍ | U+2F0D | ⼍ (U+2F0D) | 冖 (U+5196) | ⼍ (U+2F0D) | 冖 (U+5196) |
⼎ | U+2F0E | ⼎ (U+2F0E) | 冫 (U+51AB) | ⼎ (U+2F0E) | 冫 (U+51AB) |
⼏ | U+2F0F | ⼏ (U+2F0F) | 幾 (U+51E0) | ⼏ (U+2F0F) | 幾 (U+51E0) |
⼐ | U+2F10 | ⼐ (U+2F10) | 凵 (U+51F5) | ⼐ (U+2F10) | 凵 (U+51F5) |
⼑ | U+2F11 | ⼑ (U+2F11) | 刀 (U+5200) | ⼑ (U+2F11) | 刀 (U+5200) |
⼒ | U+2F12 | ⼒ (U+2F12) | 力 (U+529B) | ⼒ (U+2F12) | 力 (U+529B) |
⼓ | U+2F13 | ⼓ (U+2F13) | 勹 (U+52F9) | ⼓ (U+2F13) | 勹 (U+52F9) |
⼔ | U+2F14 | ⼔ (U+2F14) | 匕 (U+5315) | ⼔ (U+2F14) | 匕 (U+5315) |
⼕ | U+2F15 | ⼕ (U+2F15) | 匚 (U+531A) | ⼕ (U+2F15) | 匚 (U+531A) |
⼖ | U+2F16 | ⼖ (U+2F16) | 匸 (U+5338) | ⼖ (U+2F16) | 匸 (U+5338) |
⼗ | U+2F17 | ⼗ (U+2F17) | 十 (U+5341) | ⼗ (U+2F17) | 十 (U+5341) |
⼘ | U+2F18 | ⼘ (U+2F18) | 卜 (U+535C) | ⼘ (U+2F18) | 卜 (U+535C) |
⼙ | U+2F19 | ⼙ (U+2F19) | 卩 (U+5369) | ⼙ (U+2F19) | 卩 (U+5369) |
⼚ | U+2F1A | ⼚ (U+2F1A) | 廠 (U+5382) | ⼚ (U+2F1A) | 廠 (U+5382) |
⼛ | U+2F1B | ⼛ (U+2F1B) | 厶 (U+53B6) | ⼛ (U+2F1B) | 厶 (U+53B6) |
⼜ | U+2F1C | ⼜ (U+2F1C) | 又 (U+53C8) | ⼜ (U+2F1C) | 又 (U+53C8) |
⼝ | U+2F1D | ⼝ (U+2F1D) | 口 (U+53E3) | ⼝ (U+2F1D) | 口 (U+53E3) |
⼞ | U+2F1E | ⼞ (U+2F1E) | 囗 (U+56D7) | ⼞ (U+2F1E) | 囗 (U+56D7) |
⼟ | U+2F1F | ⼟ (U+2F1F) | 土 (U+571F) | ⼟ (U+2F1F) | 土 (U+571F) |
⼠ | U+2F20 | ⼠ (U+2F20) | 士 (U+58EB) | ⼠ (U+2F20) | 士 (U+58EB) |
⼡ | U+2F21 | ⼡ (U+2F21) | 夂 (U+5902) | ⼡ (U+2F21) | 夂 (U+5902) |
⼢ | U+2F22 | ⼢ (U+2F22) | 夊 (U+590A) | ⼢ (U+2F22) | 夊 (U+590A) |
⼣ | U+2F23 | ⼣ (U+2F23) | 夕 (U+5915) | ⼣ (U+2F23) | 夕 (U+5915) |
⼤ | U+2F24 | ⼤ (U+2F24) | 大 (U+5927) | ⼤ (U+2F24) | 大 (U+5927) |
⼥ | U+2F25 | ⼥ (U+2F25) | 女 (U+5973) | ⼥ (U+2F25) | 女 (U+5973) |
⼦ | U+2F26 | ⼦ (U+2F26) | 子 (U+5B50) | ⼦ (U+2F26) | 子 (U+5B50) |
⼧ | U+2F27 | ⼧ (U+2F27) | 宀 (U+5B80) | ⼧ (U+2F27) | 宀 (U+5B80) |
⼨ | U+2F28 | ⼨ (U+2F28) | 寸 (U+5BF8) | ⼨ (U+2F28) | 寸 (U+5BF8) |
⼩ | U+2F29 | ⼩ (U+2F29) | 小 (U+5C0F) | ⼩ (U+2F29) | 小 (U+5C0F) |
⼪ | U+2F2A | ⼪ (U+2F2A) | 尢 (U+5C22) | ⼪ (U+2F2A) | 尢 (U+5C22) |
⼫ | U+2F2B | ⼫ (U+2F2B) | 屍 (U+5C38) | ⼫ (U+2F2B) | 屍 (U+5C38) |
⼬ | U+2F2C | ⼬ (U+2F2C) | 屮 (U+5C6E) | ⼬ (U+2F2C) | 屮 (U+5C6E) |
⼭ | U+2F2D | ⼭ (U+2F2D) | 山 (U+5C71) | ⼭ (U+2F2D) | 山 (U+5C71) |
⼮ | U+2F2E | ⼮ (U+2F2E) | 巛 (U+5DDB) | ⼮ (U+2F2E) | 巛 (U+5DDB) |
⼯ | U+2F2F | ⼯ (U+2F2F) | 工 (U+5DE5) | ⼯ (U+2F2F) | 工 (U+5DE5) |
⼰ | U+2F30 | ⼰ (U+2F30) | 己 (U+5DF1) | ⼰ (U+2F30) | 己 (U+5DF1) |
⼱ | U+2F31 | ⼱ (U+2F31) | 巾 (U+5DFE) | ⼱ (U+2F31) | 巾 (U+5DFE) |
⼲ | U+2F32 | ⼲ (U+2F32) | 幹 (U+5E72) | ⼲ (U+2F32) | 幹 (U+5E72) |
⼳ | U+2F33 | ⼳ (U+2F33) | 么 (U+5E7A) | ⼳ (U+2F33) | 么 (U+5E7A) |
⼴ | U+2F34 | ⼴ (U+2F34) | 廣 (U+5E7F) | ⼴ (U+2F34) | 廣 (U+5E7F) |
⼵ | U+2F35 | ⼵ (U+2F35) | 廴 (U+5EF4) | ⼵ (U+2F35) | 廴 (U+5EF4) |
⼶ | U+2F36 | ⼶ (U+2F36) | 廾 (U+5EFE) | ⼶ (U+2F36) | 廾 (U+5EFE) |
⼷ | U+2F37 | ⼷ (U+2F37) | 弋 (U+5F0B) | ⼷ (U+2F37) | 弋 (U+5F0B) |
⼸ | U+2F38 | ⼸ (U+2F38) | 弓 (U+5F13) | ⼸ (U+2F38) | 弓 (U+5F13) |
⼹ | U+2F39 | ⼹ (U+2F39) | 彐 (U+5F50) | ⼹ (U+2F39) | 彐 (U+5F50) |
⼺ | U+2F3A | ⼺ (U+2F3A) | 彡 (U+5F61) | ⼺ (U+2F3A) | 彡 (U+5F61) |
⼻ | U+2F3B | ⼻ (U+2F3B) | 彳 (U+5F73) | ⼻ (U+2F3B) | 彳 (U+5F73) |
⼼ | U+2F3C | ⼼ (U+2F3C) | 心 (U+5FC3) | ⼼ (U+2F3C) | 心 (U+5FC3) |
⼽ | U+2F3D | ⼽ (U+2F3D) | 戈 (U+6208) | ⼽ (U+2F3D) | 戈 (U+6208) |
⼾ | U+2F3E | ⼾ (U+2F3E) | 戶 (U+6236) | ⼾ (U+2F3E) | 戶 (U+6236) |
⼿ | U+2F3F | ⼿ (U+2F3F) | 手 (U+624B) | ⼿ (U+2F3F) | 手 (U+624B) |
⽀ | U+2F40 | ⽀ (U+2F40) | 支 (U+652F) | ⽀ (U+2F40) | 支 (U+652F) |
⽁ | U+2F41 | ⽁ (U+2F41) | 攴 (U+6534) | ⽁ (U+2F41) | 攴 (U+6534) |
⽂ | U+2F42 | ⽂ (U+2F42) | 文 (U+6587) | ⽂ (U+2F42) | 文 (U+6587) |
⽃ | U+2F43 | ⽃ (U+2F43) | 鬥 (U+6597) | ⽃ (U+2F43) | 鬥 (U+6597) |
⽄ | U+2F44 | ⽄ (U+2F44) | 斤 (U+65A4) | ⽄ (U+2F44) | 斤 (U+65A4) |
⽅ | U+2F45 | ⽅ (U+2F45) | 方 (U+65B9) | ⽅ (U+2F45) | 方 (U+65B9) |
⽆ | U+2F46 | ⽆ (U+2F46) | 無 (U+65E0) | ⽆ (U+2F46) | 無 (U+65E0) |
⽇ | U+2F47 | ⽇ (U+2F47) | 日 (U+65E5) | ⽇ (U+2F47) | 日 (U+65E5) |
⽈ | U+2F48 | ⽈ (U+2F48) | 曰 (U+66F0) | ⽈ (U+2F48) | 曰 (U+66F0) |
⽉ | U+2F49 | ⽉ (U+2F49) | 月 (U+6708) | ⽉ (U+2F49) | 月 (U+6708) |
⽊ | U+2F4A | ⽊ (U+2F4A) | 木 (U+6728) | ⽊ (U+2F4A) | 木 (U+6728) |
⽋ | U+2F4B | ⽋ (U+2F4B) | 欠 (U+6B20) | ⽋ (U+2F4B) | 欠 (U+6B20) |
⽌ | U+2F4C | ⽌ (U+2F4C) | 止 (U+6B62) | ⽌ (U+2F4C) | 止 (U+6B62) |
⽍ | U+2F4D | ⽍ (U+2F4D) | 歹 (U+6B79) | ⽍ (U+2F4D) | 歹 (U+6B79) |
⽎ | U+2F4E | ⽎ (U+2F4E) | 殳 (U+6BB3) | ⽎ (U+2F4E) | 殳 (U+6BB3) |
⽏ | U+2F4F | ⽏ (U+2F4F) | 毋 (U+6BCB) | ⽏ (U+2F4F) | 毋 (U+6BCB) |
⽐ | U+2F50 | ⽐ (U+2F50) | 比 (U+6BD4) | ⽐ (U+2F50) | 比 (U+6BD4) |
⽑ | U+2F51 | ⽑ (U+2F51) | 毛 (U+6BDB) | ⽑ (U+2F51) | 毛 (U+6BDB) |
⽒ | U+2F52 | ⽒ (U+2F52) | 氏 (U+6C0F) | ⽒ (U+2F52) | 氏 (U+6C0F) |
⽓ | U+2F53 | ⽓ (U+2F53) | 氣 (U+6C14) | ⽓ (U+2F53) | 氣 (U+6C14) |
⽔ | U+2F54 | ⽔ (U+2F54) | 水 (U+6C34) | ⽔ (U+2F54) | 水 (U+6C34) |
⽕ | U+2F55 | ⽕ (U+2F55) | 火 (U+706B) | ⽕ (U+2F55) | 火 (U+706B) |
⽖ | U+2F56 | ⽖ (U+2F56) | 爪 (U+722A) | ⽖ (U+2F56) | 爪 (U+722A) |
⽗ | U+2F57 | ⽗ (U+2F57) | 父 (U+7236) | ⽗ (U+2F57) | 父 (U+7236) |
⽘ | U+2F58 | ⽘ (U+2F58) | 爻 (U+723B) | ⽘ (U+2F58) | 爻 (U+723B) |
⽙ | U+2F59 | ⽙ (U+2F59) | 爿 (U+723F) | ⽙ (U+2F59) | 爿 (U+723F) |
⽚ | U+2F5A | ⽚ (U+2F5A) | 片 (U+7247) | ⽚ (U+2F5A) | 片 (U+7247) |
⽛ | U+2F5B | ⽛ (U+2F5B) | 牙 (U+7259) | ⽛ (U+2F5B) | 牙 (U+7259) |
⽜ | U+2F5C | ⽜ (U+2F5C) | 牛 (U+725B) | ⽜ (U+2F5C) | 牛 (U+725B) |
⽝ | U+2F5D | ⽝ (U+2F5D) | 犬 (U+72AC) | ⽝ (U+2F5D) | 犬 (U+72AC) |
⽞ | U+2F5E | ⽞ (U+2F5E) | 玄 (U+7384) | ⽞ (U+2F5E) | 玄 (U+7384) |
⽟ | U+2F5F | ⽟ (U+2F5F) | 玉 (U+7389) | ⽟ (U+2F5F) | 玉 (U+7389) |
⽠ | U+2F60 | ⽠ (U+2F60) | 瓜 (U+74DC) | ⽠ (U+2F60) | 瓜 (U+74DC) |
⽡ | U+2F61 | ⽡ (U+2F61) | 瓦 (U+74E6) | ⽡ (U+2F61) | 瓦 (U+74E6) |
⽢ | U+2F62 | ⽢ (U+2F62) | 甘 (U+7518) | ⽢ (U+2F62) | 甘 (U+7518) |
⽣ | U+2F63 | ⽣ (U+2F63) | 生 (U+751F) | ⽣ (U+2F63) | 生 (U+751F) |
⽤ | U+2F64 | ⽤ (U+2F64) | 用 (U+7528) | ⽤ (U+2F64) | 用 (U+7528) |
⽥ | U+2F65 | ⽥ (U+2F65) | 田 (U+7530) | ⽥ (U+2F65) | 田 (U+7530) |
⽦ | U+2F66 | ⽦ (U+2F66) | 疋 (U+758B) | ⽦ (U+2F66) | 疋 (U+758B) |
⽧ | U+2F67 | ⽧ (U+2F67) | 疒 (U+7592) | ⽧ (U+2F67) | 疒 (U+7592) |
⽨ | U+2F68 | ⽨ (U+2F68) | 癶 (U+7676) | ⽨ (U+2F68) | 癶 (U+7676) |
⽩ | U+2F69 | ⽩ (U+2F69) | 白 (U+767D) | ⽩ (U+2F69) | 白 (U+767D) |
⽪ | U+2F6A | ⽪ (U+2F6A) | 皮 (U+76AE) | ⽪ (U+2F6A) | 皮 (U+76AE) |
⽫ | U+2F6B | ⽫ (U+2F6B) | 皿 (U+76BF) | ⽫ (U+2F6B) | 皿 (U+76BF) |
⽬ | U+2F6C | ⽬ (U+2F6C) | 目 (U+76EE) | ⽬ (U+2F6C) | 目 (U+76EE) |
⽭ | U+2F6D | ⽭ (U+2F6D) | 矛 (U+77DB) | ⽭ (U+2F6D) | 矛 (U+77DB) |
⽮ | U+2F6E | ⽮ (U+2F6E) | 矢 (U+77E2) | ⽮ (U+2F6E) | 矢 (U+77E2) |
⽯ | U+2F6F | ⽯ (U+2F6F) | 石 (U+77F3) | ⽯ (U+2F6F) | 石 (U+77F3) |
⽰ | U+2F70 | ⽰ (U+2F70) | 示 (U+793A) | ⽰ (U+2F70) | 示 (U+793A) |
⽱ | U+2F71 | ⽱ (U+2F71) | 禸 (U+79B8) | ⽱ (U+2F71) | 禸 (U+79B8) |
⽲ | U+2F72 | ⽲ (U+2F72) | 禾 (U+79BE) | ⽲ (U+2F72) | 禾 (U+79BE) |
⽳ | U+2F73 | ⽳ (U+2F73) | 穴 (U+7A74) | ⽳ (U+2F73) | 穴 (U+7A74) |
⽴ | U+2F74 | ⽴ (U+2F74) | 立 (U+7ACB) | ⽴ (U+2F74) | 立 (U+7ACB) |
⽵ | U+2F75 | ⽵ (U+2F75) | 竹 (U+7AF9) | ⽵ (U+2F75) | 竹 (U+7AF9) |
⽶ | U+2F76 | ⽶ (U+2F76) | 米 (U+7C73) | ⽶ (U+2F76) | 米 (U+7C73) |
⽷ | U+2F77 | ⽷ (U+2F77) | 糸 (U+7CF8) | ⽷ (U+2F77) | 糸 (U+7CF8) |
⽸ | U+2F78 | ⽸ (U+2F78) | 缶 (U+7F36) | ⽸ (U+2F78) | 缶 (U+7F36) |
⽹ | U+2F79 | ⽹ (U+2F79) | 網 (U+7F51) | ⽹ (U+2F79) | 網 (U+7F51) |
⽺ | U+2F7A | ⽺ (U+2F7A) | 羊 (U+7F8A) | ⽺ (U+2F7A) | 羊 (U+7F8A) |
⽻ | U+2F7B | ⽻ (U+2F7B) | 羽 (U+7FBD) | ⽻ (U+2F7B) | 羽 (U+7FBD) |
⽼ | U+2F7C | ⽼ (U+2F7C) | 老 (U+8001) | ⽼ (U+2F7C) | 老 (U+8001) |
⽽ | U+2F7D | ⽽ (U+2F7D) | 而 (U+800C) | ⽽ (U+2F7D) | 而 (U+800C) |
⽾ | U+2F7E | ⽾ (U+2F7E) | 耒 (U+8012) | ⽾ (U+2F7E) | 耒 (U+8012) |
⽿ | U+2F7F | ⽿ (U+2F7F) | 耳 (U+8033) | ⽿ (U+2F7F) | 耳 (U+8033) |
⾀ | U+2F80 | ⾀ (U+2F80) | 聿 (U+807F) | ⾀ (U+2F80) | 聿 (U+807F) |
⾁ | U+2F81 | ⾁ (U+2F81) | 肉 (U+8089) | ⾁ (U+2F81) | 肉 (U+8089) |
⾂ | U+2F82 | ⾂ (U+2F82) | 臣 (U+81E3) | ⾂ (U+2F82) | 臣 (U+81E3) |
⾃ | U+2F83 | ⾃ (U+2F83) | 自 (U+81EA) | ⾃ (U+2F83) | 自 (U+81EA) |
⾄ | U+2F84 | ⾄ (U+2F84) | 至 (U+81F3) | ⾄ (U+2F84) | 至 (U+81F3) |
⾅ | U+2F85 | ⾅ (U+2F85) | 臼 (U+81FC) | ⾅ (U+2F85) | 臼 (U+81FC) |
⾆ | U+2F86 | ⾆ (U+2F86) | 舌 (U+820C) | ⾆ (U+2F86) | 舌 (U+820C) |
⾇ | U+2F87 | ⾇ (U+2F87) | 舛 (U+821B) | ⾇ (U+2F87) | 舛 (U+821B) |
⾈ | U+2F88 | ⾈ (U+2F88) | 舟 (U+821F) | ⾈ (U+2F88) | 舟 (U+821F) |
⾉ | U+2F89 | ⾉ (U+2F89) | 艮 (U+826E) | ⾉ (U+2F89) | 艮 (U+826E) |
⾊ | U+2F8A | ⾊ (U+2F8A) | 色 (U+8272) | ⾊ (U+2F8A) | 色 (U+8272) |
⾋ | U+2F8B | ⾋ (U+2F8B) | 艸 (U+8278) | ⾋ (U+2F8B) | 艸 (U+8278) |
⾌ | U+2F8C | ⾌ (U+2F8C) | 虍 (U+864D) | ⾌ (U+2F8C) | 虍 (U+864D) |
⾍ | U+2F8D | ⾍ (U+2F8D) | 蟲 (U+866B) | ⾍ (U+2F8D) | 蟲 (U+866B) |
⾎ | U+2F8E | ⾎ (U+2F8E) | 血 (U+8840) | ⾎ (U+2F8E) | 血 (U+8840) |
⾏ | U+2F8F | ⾏ (U+2F8F) | 行 (U+884C) | ⾏ (U+2F8F) | 行 (U+884C) |
⾐ | U+2F90 | ⾐ (U+2F90) | 衣 (U+8863) | ⾐ (U+2F90) | 衣 (U+8863) |
⾑ | U+2F91 | ⾑ (U+2F91) | 襾 (U+897E) | ⾑ (U+2F91) | 襾 (U+897E) |
⾒ | U+2F92 | ⾒ (U+2F92) | 見 (U+898B) | ⾒ (U+2F92) | 見 (U+898B) |
⾓ | U+2F93 | ⾓ (U+2F93) | 角 (U+89D2) | ⾓ (U+2F93) | 角 (U+89D2) |
⾔ | U+2F94 | ⾔ (U+2F94) | 言 (U+8A00) | ⾔ (U+2F94) | 言 (U+8A00) |
⾕ | U+2F95 | ⾕ (U+2F95) | 谷 (U+8C37) | ⾕ (U+2F95) | 谷 (U+8C37) |
⾖ | U+2F96 | ⾖ (U+2F96) | 豆 (U+8C46) | ⾖ (U+2F96) | 豆 (U+8C46) |
⾗ | U+2F97 | ⾗ (U+2F97) | 豕 (U+8C55) | ⾗ (U+2F97) | 豕 (U+8C55) |
⾘ | U+2F98 | ⾘ (U+2F98) | 豸 (U+8C78) | ⾘ (U+2F98) | 豸 (U+8C78) |
⾙ | U+2F99 | ⾙ (U+2F99) | 貝 (U+8C9D) | ⾙ (U+2F99) | 貝 (U+8C9D) |
⾚ | U+2F9A | ⾚ (U+2F9A) | 赤 (U+8D64) | ⾚ (U+2F9A) | 赤 (U+8D64) |
⾛ | U+2F9B | ⾛ (U+2F9B) | 走 (U+8D70) | ⾛ (U+2F9B) | 走 (U+8D70) |
⾜ | U+2F9C | ⾜ (U+2F9C) | 足 (U+8DB3) | ⾜ (U+2F9C) | 足 (U+8DB3) |
⾝ | U+2F9D | ⾝ (U+2F9D) | 身 (U+8EAB) | ⾝ (U+2F9D) | 身 (U+8EAB) |
⾞ | U+2F9E | ⾞ (U+2F9E) | 車 (U+8ECA) | ⾞ (U+2F9E) | 車 (U+8ECA) |
⾟ | U+2F9F | ⾟ (U+2F9F) | 辛 (U+8F9B) | ⾟ (U+2F9F) | 辛 (U+8F9B) |
⾠ | U+2FA0 | ⾠ (U+2FA0) | 辰 (U+8FB0) | ⾠ (U+2FA0) | 辰 (U+8FB0) |
⾡ | U+2FA1 | ⾡ (U+2FA1) | 辵 (U+8FB5) | ⾡ (U+2FA1) | 辵 (U+8FB5) |
⾢ | U+2FA2 | ⾢ (U+2FA2) | 邑 (U+9091) | ⾢ (U+2FA2) | 邑 (U+9091) |
⾣ | U+2FA3 | ⾣ (U+2FA3) | 酉 (U+9149) | ⾣ (U+2FA3) | 酉 (U+9149) |
⾤ | U+2FA4 | ⾤ (U+2FA4) | 釆 (U+91C6) | ⾤ (U+2FA4) | 釆 (U+91C6) |
⾥ | U+2FA5 | ⾥ (U+2FA5) | 裡 (U+91CC) | ⾥ (U+2FA5) | 裡 (U+91CC) |
⾦ | U+2FA6 | ⾦ (U+2FA6) | 金 (U+91D1) | ⾦ (U+2FA6) | 金 (U+91D1) |
⾧ | U+2FA7 | ⾧ (U+2FA7) | 長 (U+9577) | ⾧ (U+2FA7) | 長 (U+9577) |
⾨ | U+2FA8 | ⾨ (U+2FA8) | 門 (U+9580) | ⾨ (U+2FA8) | 門 (U+9580) |
⾩ | U+2FA9 | ⾩ (U+2FA9) | 阜 (U+961C) | ⾩ (U+2FA9) | 阜 (U+961C) |
⾪ | U+2FAA | ⾪ (U+2FAA) | 隸 (U+96B6) | ⾪ (U+2FAA) | 隸 (U+96B6) |
⾫ | U+2FAB | ⾫ (U+2FAB) | 隹 (U+96B9) | ⾫ (U+2FAB) | 隹 (U+96B9) |
⾬ | U+2FAC | ⾬ (U+2FAC) | 雨 (U+96E8) | ⾬ (U+2FAC) | 雨 (U+96E8) |
⾭ | U+2FAD | ⾭ (U+2FAD) | 靑 (U+9751) | ⾭ (U+2FAD) | 靑 (U+9751) |
⾮ | U+2FAE | ⾮ (U+2FAE) | 非 (U+975E) | ⾮ (U+2FAE) | 非 (U+975E) |
⾯ | U+2FAF | ⾯ (U+2FAF) | 面 (U+9762) | ⾯ (U+2FAF) | 面 (U+9762) |
⾰ | U+2FB0 | ⾰ (U+2FB0) | 革 (U+9769) | ⾰ (U+2FB0) | 革 (U+9769) |
⾱ | U+2FB1 | ⾱ (U+2FB1) | 韋 (U+97CB) | ⾱ (U+2FB1) | 韋 (U+97CB) |
⾲ | U+2FB2 | ⾲ (U+2FB2) | 韭 (U+97ED) | ⾲ (U+2FB2) | 韭 (U+97ED) |
⾳ | U+2FB3 | ⾳ (U+2FB3) | 音 (U+97F3) | ⾳ (U+2FB3) | 音 (U+97F3) |
⾴ | U+2FB4 | ⾴ (U+2FB4) | 頁 (U+9801) | ⾴ (U+2FB4) | 頁 (U+9801) |
⾵ | U+2FB5 | ⾵ (U+2FB5) | 風 (U+98A8) | ⾵ (U+2FB5) | 風 (U+98A8) |
⾶ | U+2FB6 | ⾶ (U+2FB6) | 飛 (U+98DB) | ⾶ (U+2FB6) | 飛 (U+98DB) |
⾷ | U+2FB7 | ⾷ (U+2FB7) | 食 (U+98DF) | ⾷ (U+2FB7) | 食 (U+98DF) |
⾸ | U+2FB8 | ⾸ (U+2FB8) | 首 (U+9996) | ⾸ (U+2FB8) | 首 (U+9996) |
⾹ | U+2FB9 | ⾹ (U+2FB9) | 香 (U+9999) | ⾹ (U+2FB9) | 香 (U+9999) |
⾺ | U+2FBA | ⾺ (U+2FBA) | 馬 (U+99AC) | ⾺ (U+2FBA) | 馬 (U+99AC) |
⾻ | U+2FBB | ⾻ (U+2FBB) | 骨 (U+9AA8) | ⾻ (U+2FBB) | 骨 (U+9AA8) |
⾼ | U+2FBC | ⾼ (U+2FBC) | 高 (U+9AD8) | ⾼ (U+2FBC) | 高 (U+9AD8) |
⾽ | U+2FBD | ⾽ (U+2FBD) | 髟 (U+9ADF) | ⾽ (U+2FBD) | 髟 (U+9ADF) |
⾾ | U+2FBE | ⾾ (U+2FBE) | 鬥 (U+9B25) | ⾾ (U+2FBE) | 鬥 (U+9B25) |
⾿ | U+2FBF | ⾿ (U+2FBF) | 鬯 (U+9B2F) | ⾿ (U+2FBF) | 鬯 (U+9B2F) |
⿀ | U+2FC0 | ⿀ (U+2FC0) | 鬲 (U+9B32) | ⿀ (U+2FC0) | 鬲 (U+9B32) |
⿁ | U+2FC1 | ⿁ (U+2FC1) | 鬼 (U+9B3C) | ⿁ (U+2FC1) | 鬼 (U+9B3C) |
⿂ | U+2FC2 | ⿂ (U+2FC2) | 魚 (U+9B5A) | ⿂ (U+2FC2) | 魚 (U+9B5A) |
⿃ | U+2FC3 | ⿃ (U+2FC3) | 鳥 (U+9CE5) | ⿃ (U+2FC3) | 鳥 (U+9CE5) |
⿄ | U+2FC4 | ⿄ (U+2FC4) | 鹵 (U+9E75) | ⿄ (U+2FC4) | 鹵 (U+9E75) |
⿅ | U+2FC5 | ⿅ (U+2FC5) | 鹿 (U+9E7F) | ⿅ (U+2FC5) | 鹿 (U+9E7F) |
⿆ | U+2FC6 | ⿆ (U+2FC6) | 麥 (U+9EA5) | ⿆ (U+2FC6) | 麥 (U+9EA5) |
⿇ | U+2FC7 | ⿇ (U+2FC7) | 麻 (U+9EBB) | ⿇ (U+2FC7) | 麻 (U+9EBB) |
⿈ | U+2FC8 | ⿈ (U+2FC8) | 黃 (U+9EC3) | ⿈ (U+2FC8) | 黃 (U+9EC3) |
⿉ | U+2FC9 | ⿉ (U+2FC9) | 黍 (U+9ECD) | ⿉ (U+2FC9) | 黍 (U+9ECD) |
⿊ | U+2FCA | ⿊ (U+2FCA) | 黑 (U+9ED1) | ⿊ (U+2FCA) | 黑 (U+9ED1) |
⿋ | U+2FCB | ⿋ (U+2FCB) | 黹 (U+9EF9) | ⿋ (U+2FCB) | 黹 (U+9EF9) |
⿌ | U+2FCC | ⿌ (U+2FCC) | 黽 (U+9EFD) | ⿌ (U+2FCC) | 黽 (U+9EFD) |
⿍ | U+2FCD | ⿍ (U+2FCD) | 鼎 (U+9F0E) | ⿍ (U+2FCD) | 鼎 (U+9F0E) |
⿎ | U+2FCE | ⿎ (U+2FCE) | 鼓 (U+9F13) | ⿎ (U+2FCE) | 鼓 (U+9F13) |
⿏ | U+2FCF | ⿏ (U+2FCF) | 鼠 (U+9F20) | ⿏ (U+2FCF) | 鼠 (U+9F20) |
⿐ | U+2FD0 | ⿐ (U+2FD0) | 鼻 (U+9F3B) | ⿐ (U+2FD0) | 鼻 (U+9F3B) |
⿑ | U+2FD1 | ⿑ (U+2FD1) | 齊 (U+9F4A) | ⿑ (U+2FD1) | 齊 (U+9F4A) |
⿒ | U+2FD2 | ⿒ (U+2FD2) | 齒 (U+9F52) | ⿒ (U+2FD2) | 齒 (U+9F52) |
⿓ | U+2FD3 | ⿓ (U+2FD3) | 龍 (U+9F8D) | ⿓ (U+2FD3) | 龍 (U+9F8D) |
⿔ | U+2FD4 | ⿔ (U+2FD4) | 龜 (U+9F9C) | ⿔ (U+2FD4) | 龜 (U+9F9C) |
⿕ | U+2FD5 | ⿕ (U+2FD5) | 龠 (U+9FA0) | ⿕ (U+2FD5) | 龠 (U+9FA0) |
生成這個表格(.csv)的Python程式碼如下:
# -*- coding: utf-8 -*-
import csv
from unicodedata import normalize
def unicode_repr(ch):
return 'U+%s' % hex(ord(ch))[-4:].upper()
def normalized_repr(form, ch):
base = '%s (%s)'
return base % (normalize(form, ch),
unicode_repr(normalize(form, ch)))
def run(fileobj):
writer = csv.writer(fileobj)
writer.writerow(["Radical", "Unicode", "NFC", "NFKC", "NFD", "NFKD"])
for x in range(ord('\u2f00'), ord('\u2fd6') + 1):
ch = chr(x)
row = [ch,
unicode_repr(ch),
normalized_repr('NFC', ch),
normalized_repr('NFKC', ch),
normalized_repr('NFD', ch),
normalized_repr('NFKD', ch)]
writer.writerow(row)
run(open('unicode_kangxi_radical.csv', 'w'))