1. 程式人生 > >python 編碼

python 編碼

沒有 示例 ext left com keyword python 編碼 解碼 使用

字符編碼解釋:

ASCII,8個bit,1個Byte

GB2312,2個Byte,7000多個漢字

GBK,2個Byte,21886個漢字,最常用,

GB18030,2個Byt,27484個漢字,

Unicode,,2個Byte

UTF8是Unicode的子集,可變長,其存儲ASCII只占1個Byte,存儲漢字時候占用3個Byte


python2.7默認使用ASCII

  想使用UTF-8在首行添加:# -- coding:utf-8 --

python3默認使用UTF-8


python3的文本(text)和二進制數據(byte)區分的很清楚,不能混用 不能拼接字符串和字節,也無法在字節包裏搜索字符串

  文本用str來表示

  字符串可以編碼成字節包,而字節包可以解碼成字符串。

byte --decode--> string
string --encode--> byte

    示例
        >>> "售狀".encode(‘utf-8‘)  //告訴編譯器字符串的編碼,默認使用utf-8
        b‘\xe5\x94\xae\xe7\x8a\xb6‘
        
        >>> b‘\xe5\x94\xae\xe7\x8a\xb6‘.decode(‘utf-8‘) //沒有默認
        ‘售狀‘

python3網絡傳輸都是二進制

python 編碼