python 編碼
阿新 • • 發佈:2017-09-06
沒有 示例 ext left com keyword python 編碼 解碼 使用
字符編碼解釋:
ASCII,8個bit,1個Byte
GB2312,2個Byte,7000多個漢字
GBK,2個Byte,21886個漢字,最常用,
GB18030,2個Byt,27484個漢字,
Unicode,,2個Byte
UTF8是Unicode的子集,可變長,其存儲ASCII只占1個Byte,存儲漢字時候占用3個Byte
python2.7默認使用ASCII
想使用UTF-8在首行添加:# -- coding:utf-8 --
python3默認使用UTF-8
python3的文本(text)和二進制數據(byte)區分的很清楚,不能混用 不能拼接字符串和字節,也無法在字節包裏搜索字符串
文本用str來表示
字符串可以編碼成字節包,而字節包可以解碼成字符串。
byte --decode--> string
string --encode--> byte
示例
>>> "售狀".encode(‘utf-8‘) //告訴編譯器字符串的編碼,默認使用utf-8
b‘\xe5\x94\xae\xe7\x8a\xb6‘
>>> b‘\xe5\x94\xae\xe7\x8a\xb6‘.decode(‘utf-8‘) //沒有默認
‘售狀‘
python3網絡傳輸都是二進制
python 編碼