各種編碼格式

阿新 • • 發佈：2018-07-30

就是 ron 問題 shift 全世界轉化可變兩個 code

　　ASCII：由於計算機是美國人發明的，因此，最早只有127個字符被編碼到計算機裏，也就是大小寫英文字母、數字和一些符號，這個編碼表被稱為ASCII編碼，比如大寫字母A的編碼是65，小寫字母z的編碼是122。

　　GB2312：但是要處理中文顯然一個字節是不夠的，至少需要兩個字節，而且還不能和ASCII編碼沖突，所以，中國制定了GB2312編碼，用來把中文編進去。

　　Unicode：可以想得到的是，全世界有上百種語言，日本把日文編到Shift_JIS裏，韓國把韓文編到Euc-kr裏，各國有各國的標準，就會不可避免地出現沖突，結果就是，在多語言混合的文本中，顯示出來會有亂碼。因此，Unicode應運而生。Unicode把所有語言都統一到一套編碼裏，這樣就不會再有亂碼問題了。Unicode標準也在不斷發展，但最常用的是用兩個字節表示一個字符（如果要用到非常偏僻的字符，就需要4個字節）。現代操作系統和大多數編程語言都直接支持Unicode。

　　ASCII編碼和Unicode編碼的區別：ASCII編碼是1個字節，而Unicode編碼通常是2個字節。

　　UTF-8：如果統一成Unicode編碼，亂碼問題從此消失了。但是，如果你寫的文本基本上全部是英文的話，用Unicode編碼比ASCII編碼需要多一倍的存儲空間，在存儲和傳輸上就十分不劃算。所以，本著節約的精神，又出現了把Unicode編碼轉化為“可變長編碼”的UTF-8編碼。UTF-8編碼把一個Unicode字符根據不同的數字大小編碼成1-6個字節，常用的英文字母被編碼成1個字節，漢字通常是3個字節，只有很生僻的字符才會被編碼成4-6個字節。如果你要傳輸的文本包含大量英文字符，用UTF-8編碼就能節省空間。UTF-8編碼有一個額外的好處，就是ASCII編碼實際上可以被看成是UTF-8編碼的一部分，所以，大量只支持ASCII編碼的歷史遺留軟件可以在UTF-8編碼下繼續工作。

　　在最新的Python 3版本中，字符串是以Unicode編碼的。

各種編碼格式

就是 ron 問題 shift 全世界轉化可變兩個 code 　　ASCII：由於計算機是美國人發明的，因此，最早只有127個字符被編碼到計算機裏，也就是大小寫英文字母、數字和一些符號，這個編碼表被稱為ASCII編碼，比如大寫字母A的編碼是65，小寫字母z的編碼是12

各種編碼格式

各種編碼格式

對於PrintStream 和PrintWriter的理解以及各種編碼格式以及編碼和解碼的解釋

GB2312、GBK、ISO-8859-1、ASCII碼、Unicode、UTF-8各種編碼格式詳解（終於搞懂了）

各種編碼格式（非常經典）

常用語音編碼的WAVE檔案頭格式剖析--各種編碼

各種圖片編碼格式詳解

Java 修改編碼格式的幾種方式

【編碼格式錯誤】SyntaxError: Non-UTF-8 code starting with

轉音視頻封裝格式、編碼格式知識

mac終端下修改MySQL的編碼格式--找不到my-default.cnf及my.cnf

H.264編碼格式分析

Maven設置utf8編碼格式

mysql查看編碼格式以及修改編碼格式

c#之如何轉換文本文件編碼格式為utf-8

在ubuntu怎樣修改默認的編碼格式

獲取任意網頁的編碼格式

Windows10cmd編碼格式改為UTF-8

新版谷歌瀏覽器怎麽查找和改變編碼格式 IT開發人員谷歌的編碼格式

eclipse編碼格式設置

Eclipse中設置新創建文件的默認編碼格式

各種編碼格式

相關推薦