1. 程式人生 > >Python編碼格式

Python編碼格式

可變 gb2312 字節 寫代碼 python編碼 code 美國 轉化 基本

1,編碼有很多種,中國的GB2312,美國的ASCII碼,日本的Shift-JIS等等。在存儲時,所占的字節識是不一樣的,比如:中國的GB2312占兩個字節,美國的ASCII占一個字節

2,國際上便統一了一種編碼:Unicode占兩個字節,這樣就導致有的國家不同意。

3,所以會又發明了UTF-8,該編碼是可變字長的編碼格式,表示字母用一個字節,表示漢字用兩個字節

4,這樣的話,基本上我們在寫代碼,或者文本時,都是以UTF-8來存儲,但是加載到內存後,這些東西會被解釋成為Unicode的編碼形式,再轉化為二進制。

Python編碼格式