1. 程式人生 > >文字編碼解釋

文字編碼解釋

一張圖解釋字符集

在這裡插入圖片描述


舉例說明什麼是編碼:

UTF-8編碼
等長編碼對於英文來說浪費空間,所以出現了變長編碼UTF系列,如UTF8,UTF16,UTF32。
UTF8的編碼物件是整個Unicode字符集,所以可以表示所有國家的語言而不會亂碼,所以叫“萬國碼”。所以網路傳輸文字一般使用UTF-8編碼,如網頁,這樣可以在不同的電腦上看到相同的文字而不亂碼。

GB2312編碼
但是UTF8還是對於英文來說,還是單個位元組,但是對於其他語言編碼還是多個位元組,佔用空間仍然較大。
如果只針對中文進行編碼,被編碼文字只有幾萬字,那麼會節省很多空間。常用的簡體中文編碼有GBK/GB2312,GB表示國家標準。雖然節省的儲存空間,但是前提是需要知道文字的語言是什麼。所以只在中文環境下使用。