1. 程式人生 > >python 字串編碼

python 字串編碼

通過字串的decode和encode方法

1 encode([encoding,[errors]])
#其中encoding可以有多種值,比如gb2312 gbk gb18030 bz2 zlib big5 bzse64等都支援。errors預設值為"strict",意思是UnicodeError。可能的值還有'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace' 和所有的通過codecs.register_error註冊的值。

S.decode([encoding,[errors]]) 下面是字串編碼應用:

a = '你好'
b = 'python'
print a.decode('utf-8').encode('gbk')##decode方法把字串轉換為unicode物件,然後通過encode方法轉換為指定的編碼字串物件
print b.decode('utf-8')##decode方法把字串轉換為unicode物件

相關推薦

python字串編碼

python預設編碼   python 2.x預設的字元編碼是ASCII,預設的檔案編碼也是ASCII。   python 3.x預設的字元編碼是unicode,預設的檔案編碼是utf-8。   中文亂碼問題   無論以什麼編碼在記憶體裡顯示字元,存到硬碟上都是二進位制

Python字串-編碼

字串str ​ 作用: ​ 用來記錄文字資訊 字面值表示方法: ​ 用引號括起來的部分都是字串 ​ ‘ 單引號 ​ “ 雙引號 ​ ’’’ 三單引號 ​ ””” 三雙引號 空字串’’, ””, ’’’’’’, ”””””” 字串的字面值表示方式:

Python字串編碼轉換

使用encode()方法編碼 str.encode([encoding="utf-8"][,errors="strict"]) str:表示需要轉換的字串 encoding=“utf-8”:可選引數

python字串編碼及亂碼解決方案

字元編碼詳解Python原始碼的編碼方式str與位元組碼s = "人生苦短"s是個字串,它本身儲存的就是位元組碼(這個s可能是檔案中的一行,或者命令列中的一行?)。那麼這個位元組碼是什麼格式的?如果這段程式碼是在直譯器上輸入的,那麼這個s的格式就是直譯器的編碼格式,對於win

python 字串編碼

通過字串的decode和encode方法 1 encode([encoding,[errors]]) #其中encoding可以有多種值,比如gb2312 gbk gb18030 bz2 zlib big5 bzse64等都支援。errors預設值為"strict",意思是UnicodeError。可能

解決python中因為字串編碼導致的錯誤

python程式設計例項: 1. 將抓取的網站資料,儲存到excel表格中,在sheet.write()函式時,報錯如下: UnicodeDecodeError: 'ascii' codec can't decode byte 0xe6 in position 0: ordinal not

python 001-編碼設定 簡單字串列印

字元輸出 message=“helloword” print(message) message=“hahahahahah” print(message) 字串操作 變成title 首字母大寫 mess_title=“ada minaih” print(mess_title.t

python 檢測字串編碼型別是什麼

for index,value in enumerate(listvalue): adchar=chardet.detect(value) print adchar if adchar['encoding']=='u

python與go字串編碼

python中字串(str)是Unicode編碼的,所以中文和英文字母都佔兩個位元組(一個位元組的話,最大為256)。英文字母數值與Ascii保持一致。 a="啦" print("Unicode編碼為:",ord(a)) print("英文字母%s編碼為:%d"%("b",ord("b"))

字串編碼Python 3編碼

昨天部落格訪問量超過20w了,很高興,也希望這些筆記和文章能夠真正幫到更多的人。對於一個做技術的人來說,分享真的會給自己帶來很多快樂。不過說來也很慚愧,最近兩個月都沒寫什麼新的內容,一直忙於畢業設計和論文的事,也沒學什麼新的東西。不過想到馬上要畢業將要踏上新的征

python判斷字串編碼——使用chardet判斷字串編碼的方法

本文例項講述了python使用chardet判斷字串編碼的方法。分享給大家供大家參考。具體分析如下: 最近利用python抓取一些網上的資料,遇到了編碼的問題。非常頭痛,總結一下用到的解決方案。 linux中vim下檢視檔案編碼的命令 set fileencoding  python中一個強力的編碼檢

python 2.7的字串編碼問題

【如何計算漢字字串的長度】   s=u"我的"   len(s)=2   print(s.encode('utf-8')) # utf-8環境漢字長度是以字為單位,print的時候必須編碼為非unicode字元 【unicode字元】   unichr(11) # 將十進位

python字串編碼方式小結

         Python2中字串的型別有兩種:str和unicode,其中unicode是統一編碼方式,它使得字元跟二進位制是一一對應的,因此所有其他編碼的encode都從unicode開始,而其他編碼方式按照相應的編碼decode之後也會變成unico

2 -12 字串編碼 python 之路,致那些年,我們依然沒搞明白的編碼

python 之路,致那些年,我們依然沒搞明白的編碼 python編碼終極版     1 檔案與記憶體的編碼格式 搞清楚了ASCII、Unicode和UTF-8的關係,我們就可以總結一下現在計算機系統通用的字元編碼工作方式: 在計算機記憶體中,統一使用Unicode編碼,當

Python判斷檔案和字串編碼型別的例項

# 說明:UTF相容ISO8859-1和ASCII,GB18030相容GBK,GBK相容GB2312,GB2312相容ASCIICODES = ['UTF-8', 'UTF-16', 'GB18030', 'BIG5']# UTF-8 BOM字首位元組UTF_8_BOM = b'\xef\xbb\xbf'#

python的string與Unicode轉換,gbk字串編碼

問題一 字串前面少了u。 當遇見以下情況。 返回字串為’\u82f9\u679c’的unicode時候。 str1 = '\u82f9\u679c' # 這裡沒有u,當傳入引數

python字串編碼轉換

字串編碼轉換程式設計師最苦逼的地方,什麼亂碼之類的幾乎都是由漢字引起的。 其實編碼問題很好搞定,只要記住一點: 任何平臺的任何編碼,都能和Unicode互相轉換。 UTF-8與GBK互相轉換,那就先把UTF-8轉換成Unicode,再從Unicode轉換成GBK,反之同理。 注意:在python3中en

Python字串編碼與解碼(encode與decode)

首先要搞清楚,字串在Python內部的表示是unicode編碼,因此,在做編碼轉換時,通常需要以unicode作為中間編碼,即先將其他編碼的字串解碼(decode)成unicode,再從unicode編碼(encode)成另一種編碼。 decode的作用是將其他編碼的字串轉換成unicode編碼,如str1

Python中文編碼問題(字串前面加'u')

中文編碼問題是用中文的程式設計師經常頭大的問題,在python下也是如此,那麼應該怎麼理解和解決python的編碼問題呢? 我們要知道python內部使用的是unicode編碼,而外部卻要面對千奇百怪的各種編碼,比如作為中國程式經常要面對的gbk,gb2312

Python判斷檔案和字串編碼型別

python判斷檔案和字串編碼型別可以用chardet工具包,可以識別大多數的編碼型別。但是前幾天在讀取一個Windows記事本儲存的txt檔案時,GBK卻被識別成了KOI8-R,無解。 然後就自己寫了個簡單的編碼識別模組,基本可以識別大部分常用編碼,如果有特殊需要,可以自