1. 程式人生 > >5-20

5-20

tran 不同的 transform cmd 程序 unicode gbk win 不同

GB2312是中國規定的漢字編碼,也可以說是簡體中文的字符集編碼

  GBK 是 GB2312的擴展 ,除了兼容GB2312外,它還能顯示繁體中文,還有日文的假名

  cp936:中文本地系統是Windows中的cmd,默認codepage是CP936,cp936就是指系統裏第936號編碼格式,即GB2312的編碼。

    (當然有其它編碼格式:cp950 繁體中文、cp932 日語、cp1250 中歐語言。。。)

  Unicode是國際組織制定的可以容納世界上所有文字和符號的字符編碼方案。UTF-8、UTF-16、UTF-32都是將數字轉換到程序數據的編碼方案。

  UTF-8 (8-bit Unicode Transformation Format)是最流行的一種對 Unicode 進行傳播和存儲的編碼方式。它用不同的 bytes 來表示每一個代碼點。ASCII 字符每個只需要用一個 byte ,與 ASCII 的編碼是一樣的。所以說 ASCII 是 UTF-8 的一個子集。

5-20