1. 程式人生 > >Python 3.x 編解碼

Python 3.x 編解碼

字符 unicode fault 兼容 auth default 你好 類型 文件編碼

#-- coding:gbk -- 指定文件編碼
#Author:lei
import sys
print(sys.getdefaultencoding())
s = "你好"
print(s)
print(s.encode("gbk")) #編碼都會轉成bytes類型
print(s.encode("utf-8"))
gbk_to_utf8 = s.encode("gbk").decode("gbk").encode("utf-8")
print(gbk_to_utf8)
#unicode 統一的萬維碼

--->unicode decode解碼

---->gbk 或 gb2312 或 utf8 encode 編碼

import sys
print(sys.getdefaultencoding())
s = "你哈"
print(s.encode("gbk"))
print(s.encode("utf-8"))
print(s.encode("utf-8").decode("utf-8").encode("gb2312").decode("gb2312"))

#decode("utf-8") 文件本身為utf-8格式 解碼成unicode
#gb2312向下兼容 gbk
#python 3.x所有的編碼成utf-8 gb2312 gbk 都成了byte類型文件,只有 decode 解碼之後才成為字符串

Python 3.x 編解碼