1. 程式人生 > 資料庫 >Unicode研究之Python將Unihan_Readings.txt轉化為SQLite資料庫

Unicode研究之Python將Unihan_Readings.txt轉化為SQLite資料庫

實戰需求

Python將Unihan_Readings.txt轉化為SQLite資料庫


Unihan_Readings介紹

從Unihan提取的漢字讀音資料庫。包含漢語拼音及頻率、粵語讀法、韓語讀法、日語訓/音讀法等。

  • kDefinition, 英文解釋
  • kHanyuPinlu, 讀音及其使用頻率 – 漢字才有
  • kMandarin, 普通話發音
  • kCantonese, 廣東話發音
  • kJapaneseKun, 日語發音,訓讀(訓読み/くんよみ)
  • kJapaneseOn, 日語中的漢字發音,音讀(音読み/おんよみ)
  • kKorean, 韓語發音,耶魯拼音(不推薦使用)
  • kHangul, 韓語字母(韓文)
  • kVietnamese, 越南語發音
  • kTang, 唐代發音
  • kXHC1983, 1983版的《現代漢語詞典》給出的漢語拼音

python程式碼


bz_list={
    #Unihan_Readings
    "kDefinition":"定義",
    'kCantonese':"粵拼",
    "kHangul":"韓語",
    "kHanyuPinlu":"漢代漢語詞頻",
    "kHanyuPinyin":"詞典漢語拼音",
    "kJapaneseKun":"日語發音",
    "kJapaneseOn":"中日發音",
    "kKorean":"韓語基礎漢字&