unicode,decode,encode在python的作用
字串在Python內部的表示是unicode編碼,因此,在做編碼轉換時,通常需要以unicode作為中間編碼,即先將其他編碼的字串解碼(decode)成unicode,再從unicode編碼(encode)成另一種編碼。
即:其他編碼->解碼(decode)->unicode->編碼(encode)->其他編碼2
decode的作用是將其他編碼的字串轉換成unicode編碼,如str1.decode('gb2312'),表示將gb2312編碼的字串str1轉換成unicode編碼。
encode的作用是將unicode編碼轉換成其他編碼的字串,如str2.encode('gb2312'),表示將unicode編碼的字串str2轉換成gb2312編碼。
程式碼中字串的預設編碼與程式碼檔案本身的編碼一致。
如:s='中文'
如果是在utf8的檔案中,該字串就是utf8編碼,如果是在gb2312的檔案中,則其編碼為gb2312。這種情況下,要進行編碼轉換,都需要先用decode方法將其轉換成unicode編碼,再使用encode方法將其轉換成其他編碼。通常,在沒有指定特定的編碼方式時,都是使用的系統預設編碼建立的程式碼檔案。
如果字串是這樣定義:s=u'中文'
則該字串的編碼就被指定為unicode了,即python的內部編碼,而與程式碼檔案本身的編碼無關。因此,對於這種情況做編碼轉換,只需要直接使用encode方法將其轉換成指定編碼即可。
相關推薦
unicode,decode,encode在python的作用
字串在Python內部的表示是unicode編碼,因此,在做編碼轉換時,通常需要以unicode作為中間編碼,即先將其他編碼的字串解碼(decode)成unicode,再從unicode編碼(encode)成另一種編碼。 即:其他編碼->解碼(decode)->unicode->
python蛋疼的編碼decode、encode、unicode、str、byte的問題都在這了
機器 .com mage byte 一個 blog 字符 同時 nbsp 相信很多人和我一樣,被python蛋疼的編碼問題糾纏不清,比如下面的 私以為出現這種錯誤的原因還是對一些基本的編解碼概念不夠熟悉,下面就說說我的理解: 首先python剛出來的時候uni
python 字符串編碼 str和unicode 區別以及相互轉化 decode('utf-8') encode('utf-8')
encode unicode 字符串 code com bubuko src 區別 分享圖片 python 字符串編碼 str和unicode 區別以及相互轉化 decode('utf-8') encode('utf-8'
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UX
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UX 在stackoverflow 上找到了類似的錯誤,原來是圖片路徑寫的 有問題 錯誤的:'C
報錯:SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape
Outline SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape 讀取pickle檔案時,報了上述錯誤。 pick
python3 unicode bytes decode encode之間聯絡
首先 decode表示解碼 encode表示編碼 在python3 文字(包括str 漢字等)都是unicode &
Python中SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: ***錯誤
前幾天一直在對檔案的寫入、刪除等操作學習,但是複製檔案的路徑一直報錯對檔案操作不了,所以一直把檔案複製到pychrome當前專案的目錄中使用,現在總結下怎麼使用非當前目錄下的檔案。 fh=logging.FileHandler("C:\Users\huang\Pycharm
decode函式的作用 decode和case when用法對比
學習分享必看:javacto.taobao.com 例子 如Table表有性別欄位,1代表男2代表女、3代表中性、還有沒填就代表未說明 select id,decode(sex,'1','男','2','女','3','中性','未說明') from Table; select id, &n
python之分析decode、encode、unicode編碼轉換為漢字
decode()方法使用註冊編碼的編解碼器的字串進行解碼。它預設為預設的字串編碼。decode函式可以將一個普通字串轉換為unicode物件。decode是將普通字串按照引數中的編碼格式進行解析,然後生成對應的unicode物件,比如在這裡我們程式碼用的是utf-8,那麼把
python 字元編碼與解碼——unicode、str和中文:UnicodeDecodeError: 'ascii' codec can't decode
摘要:在進行python指令碼的編寫時,如果我們用python來處理網頁資料或者進行與中文字元有關的處理工作,經常出現這樣的出錯資訊:SyntaxError: Non-ASCII character '\xe6' in file ./filename.py on line
python3:(unicode error) 'utf-8' codec can't decode
環境: 作業系統:win7 旗艦版 語言:python3.4 文字編輯器:vim、notepad++ 報錯:SyntaxError: (unicode error) 'utf-8' codec can't decode byte 0xb4 in position 0:
python編碼與反編碼 decode('unicode-escape')
“反編碼”我自己起的名字,大概意思就是我得到一串字元,是unicode碼,如:‘\u53eb\u6211’,進行反編碼後得到其對應的漢字。 f='\u53eb\u6211' print f print(f.decode('unicode-escape')) 結
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3解決方法
問題描述 在Python3中,切換工作目錄時,出現報錯: SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes
成功解決Python中匯出圖片出現錯誤SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position
今天對Python程式設計寫個Hierarchical clustering層次聚類演算法,想把多張圖片層次聚類,輸出一張圖片時,發現了一個討厭的bugdrawdendrogram(tree, imlist, jpeg='C:\Users\99386\Desktop\resu
python基礎學習之字元編碼unicode、decode、encode的相互轉化
#unicode # encode :解碼 decode:編碼 一、encode的使用 s="你好" s_gbk = s.encode("gbk") print(s) print(s.encode()) #預設utf-8,進行enc
TRIZ系列-創新原理-20-有效作用的連續性原理
工作流 div 浪費 可能 生產 ont 也不會 打印 con 有效作用的連續性原理表述例如以下:1)連續實施動作不要中斷,物體的全部部分應該一直處於滿負荷工作狀態。2)去除全部空暇的,中間的動作:3)用循環的動作取代“來來回回”的動作:這個原理能夠看著是原理19的一個反
創建對象與使用對象——談談工廠的作用
方便 構圖 erb aof 常用 uda 行為 too jpg 工廠模式(包括簡單工廠模式、工廠方法模式和抽象工廠模式)到底有什麽用,很多時候通過反射機制就可以很靈活地創建對象,為毛還要工廠?,在本文中我將圍繞創建對象和使用對象來簡單談談工廠的作用。 與一個對象
RRTI的概念以及Class對象作用
eat 有趣的 getclass 2種 init null java虛擬機 class對象 小例子 深入理解Class對象 RRTI的概念以及Class對象作用 認識Class對象之前,先來了解一個概念,RTTI(Run-Time Type Identifi
java中string.trim()函數的作用
main ati cnblogs return style ret blog substr system trim /[tr?m] / 英文意思:整理,修理,修剪,整齊的 trim()的作用:去掉字符串首尾的空格。 public static void main(S
自動類型轉換、強制類型轉換、作用域、整型表數範圍
基本類 logs 自動類型轉換 四種 main print 輸出字符串 縮小 stat 一、變量的作用域 測試代碼: public class Test1 { private static int value = 1; // 全局變量 pri