python編碼encode和decode

阿新 • • 發佈：2018-12-27

計算機裡面，編碼方法有很多種，英文的一般用ascii,而中文有unicode，utf-8,gbk,utf-16等等。

unicode是 utf-8,gbk,utf-16這些的父編碼，這些子編碼都能轉換成unicode編碼，然後轉化成子編碼，例如utf8可以轉成unicode，再轉gbk，但不能直接從utf8轉gbk

所以，python中就有兩個方法用來解碼（decode）與編碼（encode），解碼是子編碼轉unicode，編碼就是unicode轉子編碼

1.編碼

#encoding=utf-8
c=u'\u5f00\u59cb\u6267\u884c\u66f4\u65b0\u547d\u4ee4'
print c
print c.encode('utf8')
print c.encode('gbk')

在這裡，檔案的編碼方式為utf8,控制檯的編碼方式是utf8
變數c是一個unicode編碼的字串（需要在引號前面加u）

輸出的結果為：

開始執行更新命令
開始執行更新命令
��ʼִ�и�������

因為控制檯是utf8編碼，所以unicode編碼和utf8編碼都能識別，但是gbk就不可以了
2.解碼

#encoding=utf-8
a = '中文'
print a.decode('g')
print [a.decode('g')]

這裡a為utf8編碼，decode方法將utf8解碼為unicode編碼
輸出結果：

中文
[u'\u4e2d\u6587']

由於控制檯能識別unicode編碼，所以需要把字串放在列表裡面才能看到unicode原始碼

#encoding=utf-8
a = '中文'
print [a.decode('gbk')]

因為a是utf8編碼的，如果將a用gbk解碼，程式就會報錯

UnicodeDecodeError: 'gbk' codec can't decode bytes in position 2-3: illegal multibyte sequence

a = '中文'
print a.decode('utf-16')

如果用utf-16解碼方法解碼utf-8的字串，程式並不會報錯（可能因為它們的編碼方式相似），但是返回的是亂碼：

룤螖

如果一個字串為unicode碼，又沒有u標識，可以這樣來轉換成中文

a='\u8054\u76df\u533a'
b="u'%s'"%a

print eval(b)

後記

1.如果想知道一個字串是什麼編碼，可以print [字串] 來看二進位制碼

[u'\u76ee\u6807\u533a\u670d']
['\xe7\x9b\xae\xe6\xa0\x87\xe5\x8c\xba\xe6\x9c\x8d']

第一個是unicode，第二個是utf-8

python編碼encode和decode

計算機裡面，編碼方法有很多種，英文的一般用ascii,而中文有unicode，utf-8,gbk,utf-16等等。 unicode是 utf-8,gbk,utf-16這些的父編碼，這些子編碼都能轉換成unicode編碼，然後轉化成子編碼，例如utf8可以轉成unicode，再轉gbk，但不能直接從utf8

python的encode和decode誤讀總結

解析 font 計算機理解文本 str 無符號出現 c中 python的encode和decode誤讀總結最近在學Python，對編碼有個誤解的地方下面是錯誤的理解： encode（）：編碼，將對象的編碼轉換為指定編碼格式，按照字面理解，一直以為

JAVA關於base64編碼Encode和Decode編碼的幾種方式

關於base64編碼Encode和Decode編碼的幾種方式 Base64是一種能將任意Binary資料用64種字元組合成字串的方法，而這個Binary資料和字串資料彼此之間是可以互相轉換的，十分方便。在實際應用上，Base64除了能將Binary資料視覺化之外，也常用

關於base64編碼Encode和Decode編碼的幾種方式

Base64是一種能將任意Binary資料用64種字元組合成字串的方法，而這個Binary資料和字串資料彼此之間是可以互相轉換的，十分方便。在實際應用上，Base64除了能將Binary資料視覺化之外，也常用來表示字串加密過後的內容。如果要使用Java 程式語言來實作Base

Python編碼格式說明及轉碼函式encode和decode的使用

從檔案編碼的方式來看，檔案可分為ASCII碼檔案和二進位制碼檔案兩種。 ASCII檔案也稱為文字檔案，這種檔案在磁碟中存放時每個字元對應一個位元組，用於存放對應的ASCII碼。例如，數5678的儲存形式為： ASC碼：　00110101 00110110 00110111 00111000 　　　　　↓

Python 列表內字元編碼問題，encode和decode

在學習python爬蟲時遇到個小問題，記錄一下：列表內的元素用迴圈單個輸出的話，是正常的中文顯示，而用 append 方法新增到集合再直接輸出集合的時候，顯示的是下面的Unicode編碼格式。 import urllib2 import random from bs4 i

python encode和decode函數說明

系統格式得到 enc utf-16 取消 div 一個 span 字符串編碼常用類型：utf-8,gb2312,cp936,gbk等。 python中，我們使用decode()和encode()來進行解碼和編碼在python中，使用unicode類型作為編碼的基礎類型

探究 encode 和 decode 的使用問題（Python）

gbk nco com 程序 mage python 文件 height pre 很多時候在寫Python程序的時候都要在頭部添加這樣一行代碼 #coding: utf-8 或者是這樣 # -*- coding:utf-8 -*- 等等這行代

python編碼encode decode(解惑)

關於python 字串編碼一直沒有搞清楚，今天總結了一下。 Python 字串型別 Python有兩種字串型別：str 與 unicode。字串例項 # -*- coding: utf-8 -*- # 這個是 str 的字串 s = '關關雎鳩' # 這個是 unicode 的字串 u = u'

python中的encode()和decode()函式

對於很多人來說，python的中字元轉碼是一件很頭疼的事情，本來期望結果輸出的是中文，結果來一段像這樣\xe4\xbd\xa0\xe5\xa5\xbd像是亂碼的字串。由於學python沒多久，昨天使用python的時候，就遇到這種問題，現在來深入研究下與之相

python中字串的encode和decode

為什麼Python使用過程中會出現各式各樣的亂碼問題，明明是中文字元卻顯示成“/xe4/xb8/xad/xe6/x96/x87”的形式？為什麼會報錯“UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1:

python encode和decode的妙用

字串解碼：有個字串： '\\u4fee\\u6539\\u8282\\u70b9\\u72b6\\u6001\\u6210\\u529f' 想轉換為： u"\u4fee\u6539\u8282\u70b9\u72b6\u6001\u6210\u529f" 可以通過如下

Python基礎知識——encode和decode函式

以前我們介紹過，Python2.x中預設的編碼的基礎型別是unicode編碼的型別，在Python3.x才轉化為基於unicode的字串。那麼我們在Python2.x的學習中就會遇到各種各樣的編碼問

Java基礎之字串的編碼(Encode)和解碼(Decode)

package newFeatures8; import java.io.UnsupportedEncodingException; import java.util.Arrays; /*

python encode和decode函式說明

目錄(?)[-] 字串編碼常用型別：utf-8,gb2312,cp936,gbk等。 python中，我們使用decode()和encode()來進行解碼和編碼在python中，使用unicode型別作為編碼的基礎型別。即 decode

python 2 encode and decode

into value intern leave his supported probably 字符 pro https://docs.python.org/2/howto/unicode.html a Unicode string is a sequence of code

python3 中encode 和decode的使用方法。

這就是得到網絡 code 報錯方式 left 定義 () 編碼：　　將文本轉換成字節流的過程。即Unicode----------->特定格式的編碼方式，產生特定的字節流保存在硬盤中(一般為utf-8格式)。解碼：　　將硬盤中的字節流轉換成文本的過程。即特

Encode 和 Decode

encode -h baidu blank www urldecode amp tar col Server.UrlDecode();Server.UrlEncode();是兩個成對的方法作用是在URL傳參時如果直接傳中文可能會出問題（對中文參數支持部完善），所以先用 S

python基礎-encode與decode，中文亂碼

來源：http://blog.csdn.net/a921800467b/article/details/8579510 為什麼會報錯“UnicodeEncodeError:'ascii' codec can't encode characters in position 0-1: ordi

Python 關於 encode與decode 中文亂碼問題

字串在Python內部的表示是unicode編碼，因此，在做編碼轉換時，通常需要以unicode作為中間編碼，即先將其他編碼的字串解碼（decode）成unicode，再從unicode編碼（encode）成另一種編碼。 decode的作用是將其他編碼的字串轉換成unicode編碼，如str1.decode

python編碼encode和decode

相關推薦