python2中將Unicode編碼的中文和str相互轉換
阿新 • • 發佈:2018-11-07
在python2x版本中 關於中文漢字轉換
1.中文------字串格式
>>> s = '漢字' >>> type(s) <type 'str'>
預設漢字型別是:str
列印 s 時會顯示如下內容:反斜槓和字母組合,一個漢字對應兩組這樣的組合
'\xba\xba\ 對應 ‘漢’
>>> s '\xba\xba\xd7\xd6'
2.中文------漢字Unicode編碼格式
>>> s1 = u'漢字' >>> type(s1)<type 'unicode'>
列印s1時:
>>> s1 u'\u6c49\u5b57'
3.將Unicode編碼的 s1字串(u'\u6c49\u5b57')---》變換成str格式('\xba\xba\xd7\xd6')
>>> s2 = s1.encode('cp936') >>> s2 '\xba\xba\xd7\xd6'
4.將str編碼的 s字串('\xba\xba\xd7\xd6')---》變換成Unicode格式(u'\u6c49\u5b57')
>>> s3 = s.decode('gbk') >>> s3 u'\u6c49\u5b57'