編碼ascii碼,unicode碼,utf-8編碼
阿新 • • 發佈:2022-05-13
1. ASCII
ASCII 只有127個字元,表示英文字母的大小寫、數字和一些符號,但由於其他語言用ASCII 編碼表示位元組不夠,例如:常用中文需要兩個位元組,且不能和ASCII衝突,中國定製了GB2312編碼格式,相同的,其他國家的語言也有屬於自己的編碼格式
2. Unicode
由於每個國家的語言都有屬於自己的編碼格式,在多語言編輯文字中會出現亂碼,這樣Unicode應運而生,Unicode就是將這些語言統一到一套編碼格式中,通常兩個位元組表示一個字元,而ASCII是一個位元組表示一個字元,這樣如果你編譯的文字是全英文的,用Unicode編碼比ASCII編碼需要多一倍的儲存空間,在儲存和傳輸上就十分不划算。
3. UTF-8
為了解決上述問題,又出現了把Unicode編碼轉化為“可變長編碼”UTF-8編碼,UTF-8編碼將Unicode字元按數字大小編碼為1-6個位元組,英文字母被編碼成一個位元組,常用漢字被編碼成三個位元組,如果你編譯的文字是純英文的,那麼用UTF-8就會非常節省空間,並且ASCII碼也是UTF-8的一部分。