Python編碼解碼問題 encode decode

阿新 • • 發佈：2019-01-23

首先要搞清楚，字串在Python內部的表示是unicode編碼，因此，在做編碼轉換時，通常需要以unicode作為中間編碼，即先將其他編碼的字串解碼（decode）成unicode，再從unicode編碼（encode）成另一種編碼。

decode的作用是將其他編碼的字串轉換成unicode編碼，如str1.decode('gb2312')，表示將gb2312編碼的字串轉換成unicode編碼。

encode的作用是將unicode編碼轉換成其他編碼的字串，如str2.encode('gb2312')，表示將unicode編碼的字串轉換成gb2312編碼。

在某些IDE中，字串的輸出總是出現亂碼，甚至錯誤，其實是由於IDE的結果輸出控制檯自身不能顯示字串的編碼，而不是程式本身的問題。

例如：ljq.py，編碼為utf8，包含內容如下：

#-*-coding:utf-8-*- 

s='中文'
print type(s) #檢視s的字元型別
print s  

s.decode('utf8') #解碼utf8，預設的編碼方式是unicode
s.decode('gbk', "ignore") #解碼utf8，忽略其中有異常的編碼，僅顯示有效的編碼
s.decode('gbk', 'replace')
print type(s)
print s

s.encode('gb2312') ##編碼為utf8
print type(s)
print s

ljq.py編碼必需與s.decode('utf8')指定的編碼一致，不然會丟擲解碼異常資訊，可以通過s.decode("gbk", "ignore")或s.decode("gbk", "replace")來解決。

另外對於一些包含特殊字元的編碼，直接解碼可能會報錯，可以使用對於的引數來設定。如:
s.decode("utf-8", "ignore") 忽略其中有異常的編碼，僅顯示有效的編碼
s.decode("utf-8", "replace") 替換其中異常的編碼，這個相對來可能一眼就知道那些字元編碼出問題了。

從unicode轉str，被看做是把一個資訊文字編碼為二進位制位元組流的過程，要用encode方法

Python編碼解碼問題 encode decode

python 編碼（encode）解碼（decode）問題

Python編碼解碼問題 encode decode

Python中的字元編碼問題encode/decode

Python 編碼解碼的問題(學習筆記+總結思考)

Python字串的編碼與解碼(encode與decode)

Python3中字符串的編碼與解碼以及編碼之間轉換(decode、encode)

python編碼encode decode(解惑)

a標籤跳頁傳參，以及擷取URL引數 js 中編碼（encode）和解碼（decode）的三種方法

js 中編碼（encode）和解碼（decode）的三種方法

python編碼encode和decode

python中文編碼問題（decode('gbk').encode('utf-8')和decode('utf-8').encode('gbk')這對好基友）

python 編碼，decode() ,encode() 用法區別

python 編碼亂碼問題（decode，encode）

Python編碼格式說明及轉碼函式encode和decode的使用

python基礎學習之字元編碼unicode、decode、encode的相互轉化

python 編碼問題：'ascii' codec can't encode characters in position 的解決方案

編碼-encode,decode

解決python編碼問題報錯：'ascii' codec can't encode characters in position 0-15: ordinal not in range(128)

Python讀取文件編碼解碼問題

Python 編碼與解碼

Python編碼解碼問題 encode decode

相關推薦