Unicode研究之Python將Unihan_Readings.txt轉化為SQLite資料庫
阿新 • • 發佈:2021-01-02
實戰需求
Python將Unihan_Readings.txt轉化為SQLite資料庫
Unihan_Readings介紹
從Unihan提取的漢字讀音資料庫。包含漢語拼音及頻率、粵語讀法、韓語讀法、日語訓/音讀法等。
- kDefinition, 英文解釋
- kHanyuPinlu, 讀音及其使用頻率 – 漢字才有
- kMandarin, 普通話發音
- kCantonese, 廣東話發音
- kJapaneseKun, 日語發音,訓讀(訓読み/くんよみ)
- kJapaneseOn, 日語中的漢字發音,音讀(音読み/おんよみ)
- kKorean, 韓語發音,耶魯拼音(不推薦使用)
- kHangul, 韓語字母(韓文)
- kVietnamese, 越南語發音
- kTang, 唐代發音
- kXHC1983, 1983版的《現代漢語詞典》給出的漢語拼音
python程式碼
bz_list={ #Unihan_Readings "kDefinition":"定義", 'kCantonese':"粵拼", "kHangul":"韓語", "kHanyuPinlu":"漢代漢語詞頻", "kHanyuPinyin":"詞典漢語拼音", "kJapaneseKun":"日語發音", "kJapaneseOn":"中日發音", "kKorean":"韓語基礎漢字&