1. 程式人生 > >各種編碼問題

各種編碼問題

存儲 頁表 unicode 避免 字符 中文字符 系列 維護 中國

UNICODE字符集和UTF系列編碼

  • UNICODE是一個標準,他為每個字符規定了編號。
  • UTF系列編碼是對UNICODE標準規定的編號進行編碼,以便於傳輸或者存儲。
  • 16位存不下UNICODE所有字符。只是中文都可以直接用UTF-16編碼用2字節表示。

_UNICODE宏的作用

  • 主要是方便程序員維護代碼,避免為UNICODE和ANSI寫兩套代碼。

w_char和char

  • w_char存儲中文字符,Windows在內存中用UTF-16編碼表示。
  • char存儲中文字符,Windows在內存中用GBK編碼表示。

頁表

  • 在中國,Windows默認頁表為936,即GBK編碼。
  • w_char中文字符直接輸出到控制臺是亂碼,應為頁表不對。

各種編碼問題