python報錯"utf-8 codec can't decode byte 0x"
望文生義,報錯的內容就是說utf-8的編碼方式不能解碼0x的位元組,選擇正確的解碼方式就可以解決。
深入些理解,可以把編碼就是編成位元組資料,就是二進位制的東西,解碼以後就是我們看懂的字串,python裡面就是unicode型別。但是打碼的方式有很多,需要採用適合的方法(打碼方法)才能下馬。比如在檔案操作時,encode就是指明檔案讀寫時的編碼方式。
具體到python中,utf-8編碼的文字可以用iso8859-1的編碼表示,但是反過來不行。iso8859-1是單位元組編碼,而utf8是定長編碼,從utf8轉化成iso8859-1相當於是高精度轉化成低精度,造成精度丟失,所以不可逆。因為utf8中文,在iso8859-1沒有匹配的位置。而gbk是不定長編碼,英文數字的字元編碼規則跟iso8859-1是一樣的,所以gbk是相容iso8859-1編碼的,這兩者可以相互轉換。
有時候即使採用正確的解碼方式,比如iso檔案,一些中文還是有亂碼,得轉成預設的utf-8格式
#iso檔案是iso編碼的二進位制資料
fr = open('iso', 'rb') #可以先用位元組模式獲取資料
data = fr.readline()
data = data.decode('gbk') #因為gbk相容iso和utf,先按gbk解碼
data = data.encode('utf-8') #需要的話可以再用utf格式編碼
相關推薦
python報錯"utf-8 codec can't decode byte 0x"
望文生義,報錯的內容就是說utf-8的編碼方式不能解碼0x的位元組,選擇正確的解碼方式就可以解決。 深入些理解,可以把編碼就是編成位元組資料,就是二進位制的東西,解碼以後就是我們看懂的字串,python裡面就是unicode型別。但是打碼的方式有很多,需要採用適合的方法(打
python 字串輸出報錯 'utf-8' codec can't encode characters in position
一些字串無法被utf-8解碼,所以可以把無法轉化為utf-8格式的字元‘ignore’掉,再進行解碼。 str().encode('UTF-8', 'ignore').decode('UTF-8') 測試程式碼: text = ''' '\n
VS2015 下python程式設計,報錯:'utf-8' codec can't decode byte,解決辦法?
問題描述,形如以下的C++呼叫python程式碼,在vs2015下報中文編碼錯誤 #include <iostream> using namespace std; int main() { Py_Initialize(); /*初始化
python 讀取資料出現UnicodeDecodeError:: 'utf-8' codec can't decode byte 0xc8 in position 0: invalid contin
之前寫程式時也出現過類似錯誤,每次解決了到第二次遇見又忘了具體方法,這次記錄一下。 一、字元編碼問題 先介紹一下字元編碼問題 1.ASCLL與GB2312 由於計算機是美國人發明的,因此,最早只有127個字元被編碼到計算機裡,也就是大小寫英文字母、數字和一些符號,這個
Python decode報錯UnicodeDecodeError: ‘gb2312’ codec can’t decode byte
gb2312 遇到 字符 取代 使用 python 異常 報錯 設置 今天用python采集文章的時候發現有些中文會出現解碼出錯,UnicodeDecodeError: ‘gb2312’ codec can’t decode byte 0
python3 'utf-8' codec can't decode byte 0xb3
問題:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb3 in position 109: invalid start byte 該問題發生於decode解碼; 編碼與解碼: 編碼就是將字串轉換成位元組碼,涉
解決UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte問題
本文最後更新於2018-6-20,可能會因為沒有更新而失效。如已失效或需要修正,請聯絡我! 早上在用Flask框架時出現了這個問題,我在原始碼裡寫的是 @app.route('/hello') def hello(): return render_te
部署django中出現UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc8 in position 3解決方案
在《Python入門到實踐》18.3例程中,編寫好index.html <p>Learning Log</p><p>Learning Log helps you keep track of your learning,for any to
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa8 in position 怎麼辦
如題,我遇到了要讀取csv結果發生: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa8 in position 2987: invalid start byte 怎麼辦呢? 原來的csv儲存命令是: df.t
Python3解決UnicodeDecodeError: 'utf-8' codec can't decode byte..問題 終極解決方案
0x00 問題引出: 最近在做一個買房自動化分析Python指令碼,需要爬取網頁。 在使用urllib獲取reqest的response的時候,還要進行解碼。 見語句: result = res.decode('utf-8') 當執行該語句的時候,
'utf-8' codec can't decode byte 0xff in position 0: invalid start byte
‘utf-8’ codec can’t decode byte 0xff in position 0: invalid start byte 覺得有用的話,歡迎一起討論相互學習~Follow Me 今天使用語句 image_raw_data_jpg
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte...
其他 編碼問題 nbsp pan utf-8 erro can 問題 報錯 1. 編碼問題, 如果來源為編碼為其他的,而是用utf-8去解碼就會報錯。 2. 如果只是有部分無法解碼, 則添加 ‘ingnore’ 參數 a = b‘...‘ result = a.d
【轉】UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc7 in position 1: invalid continuation 漢字編碼
如果在python 3裡面碰到下面的Error message: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc7 in position 1: invalid continuation byte。 你很可
使用Robot Framework執行時後臺報錯UnicodeDecodeError:'utf8' codec can't decode byte
使用Robot Framework進行自動化測試,執行時遇到 UnicodeDecodeError :'utf-8' codec can't decode byte 0xd0 in position 46:invalid continuation byte 如下方法可
decode解碼報錯UnicodeDecodeError: 'gb2312' codec can't decode byte 0x8f in position 6018: illegal multib
python抓取網頁後用decode解碼,報錯資訊如下:Traceback (most recent call last): File "<pyshell#7>", line 1, in <module> html = html.decod
TensorFlow學習筆記(UTF-8 問題解決 UnicodeDecodeError- 'utf-8' codec can't decode byte 0xff in position 0- in
我使用VS2013 Python3.5 TensorFlow 1.3 的開發環境 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte 在
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 0: invalid start byte解決方法
最近在學機器學習,看《機器學習實戰》,因為書上的程式碼是在Python2下編寫的,所以轉到Python3會有許多問題需要修改。 第3章決策樹有一個函式如下: def grabTree(filename): import pickle fr = open(f
TensorFlow學習筆記(UTF-8 問題解決 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: in
今天在跑跑程式碼時,遇到了標題的問題,然後網上查了下,在此處: http://www.cnblogs.com/Qt-Chao/p/7474360.html 剛剛好講解了解決該問題的辦法,這裡當作一個筆記,記錄下來。 我使用VS2013 Python3.5 Tenso
python 3.5 解決csv 讀入中的'utf-8' codec can't decode辦法
------------------------------------------------------------------------------------------------------------------------------------------
tensorflow讀不出圖片,出現'utf-8' codec can't decode..錯誤
首先我試了《實戰Google深度學習框架》這本書,結果圖片讀不出來,上網隨便找了個簡單的程式讀,還是讀不出來,我就查資料,執行以下程式 import importlib importlib.reload(sys) 然後簡單的搞定了,但書裡的 image_raw