解決UnicodeDecodeError: 'utf8' codec can't decode byte 0x9c

阿新 • • 發佈：2019-01-30

問題

with open(file, 'rb') as f:
        for raw_line in f:
            # process

但是我在執行時會報TypeError錯誤：

TypeError: sequence item 0: expected str instance, bytes found

一個簡單的解決方式是不再使用二進位制讀取，改為普通讀取，即去掉‘r’，但是此時丟擲UnicodeDecodeError錯誤：

UnicodeDecodeError: ‘utf8’ codec can’t decode byte 0xf3 in position
4645: invalid continuation byte

初步推測這是檔案中包含了utf8也無法解碼的偏僻字元，導致報此錯誤。

解決方法

我在百度上搜索了一會兒後發現中文網站上大多為 ‘gbk’ codec can’t decode byte XXX，然後解決方法是改為utf8編碼，然而我的Python程式碼本身就是utf8編碼。

吸取上次解決Ubuntu18的bug導致系統啟動後黑屏的問題的教訓，我在意識到百度上沒有我想要的答案後，就到stackoverflow上搜索相關問題了，果然找到了解決方法。
1. 使用unicode解碼：

with open(file, 'r') as f:
        for str in f:
            # unicode 是python2裡的，我在python3測試會有問題 

            str = unicode(str, errors = 'replace')
            # or
            str = unicode(str, errors = 'ignore')

該方法返回一個不包含那些無法解析的字元的字串。
2. 使用codecs讀取檔案：

import codecs

with codecs.open(file, 'r', encoding='utf-8', 
        errors='ignore') as f:
    for str in f:
        # process

關於utf8無法解析的字串的問題，Python還有

官方文件說明，有興趣的同學可以參考一下。

解決UnicodeDecodeError: 'utf8' codec can't decode byte 0x9c

問題 with open(file, 'rb') as f: for raw_line in f: # process 但是我在執行時會報TypeError錯誤： TypeError: sequence

解決UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xe5 in position 108: ordinal not in range(128)

style 資料 spa 和數 cnblogs ref lib utf 其中　　今天做網頁到了測試和數據庫交互的地方，其中HTML和數據庫都是設置成utf-8格式編碼，插入到數據庫中是正確的，但是當讀取出來的時候就會出錯，原因就是Python的str默認是ascii編碼，

UnicodeDecodeError: 'utf8' codec can't decode byte 0xc4 in position 0: i報錯問題

在網上搜了很多人的處理方法是在程式的頂部加 import sys reload( sys ) sys.setdefaultencoding('gbk') 可是我自己試一了，程式錯是不報了，但是實際沒有執行最後，我在程度的頂部加了下面兩行就好了，中文也可以正常顯示了

使用Robot Framework執行時後臺報錯UnicodeDecodeError:'utf8' codec can't decode byte

使用Robot Framework進行自動化測試，執行時遇到 UnicodeDecodeError :'utf-8' codec can't decode byte 0xd0 in position 46:invalid continuation byte 如下方法可

py檔案增加encoding='utf-8',errors='ignore' 後仍然沒解決UnicodeDecodeError: 'gbk' codec can't decode byte

感覺和oracle的輸出字符集有關，gbk,gb18030都試了沒解決，注意紅色部分，修改後解決問題 #!/usr/bin/env python import sys import csv import cx_Oracle import codecs import os

python 編碼問題 UnicodeDecodeError: ‘utf8’ codec can’t decode byte 0xb4 in position 0: invalid start byt

心好累呀，作為一個菜鳥，進了銀行實習，銀行還沒有網路，不能查詢，只能靠自己的流量；而且銀行也不能將檔案輸入輸出，造成了我更加懵逼的狀態。腳還扭傷了，兩週沒有去，進度更不上。 windows配spark的環境老不行，問題也不能解決。等會把問題抄一下吧先把編碼的問題寫上來

python執行時出現UnicodeDecodeError: 'gbk' codec can't decode byte 0x89 in position 14: illegal ...的解決辦法

在python第四次實驗作業時： python在讀取檔案時出現“UnicodeDecodeError: 'gbk' codec can't decode byte 0x89 in position 14: illegal multibyte sequence”錯誤翻譯為

[python]解決Windows下安裝第三方外掛報錯：UnicodeDecodeError: 'ascii' codec can't decode byte 0xcb in position 0:

系統：win10 IDE：pycharm Python版本：2.7 安裝第三方外掛是報錯：報錯原因與編碼有關，pip把下載的臨時檔案存放在了使用者臨時檔案中，這個目錄一般是C:\Users

webpy 解決中文出現UnicodeDecodeError: 'ascii' codec can't decode byte 問題

學習webpy過程中，出現 UnicodeDecodeError: 'ascii' codec can't decode byte 0xe6 in position 29: ordinal not in range(128) 錯誤百度之後參考如下文章解決: http://

python 安裝scrapy錯誤提示：UnicodeDecodeError: 'ascii' codec can't decode byte 解決方案

應該是出了編碼問題，谷歌了一下找到了解決方案：在python的Lib\site-packages資料夾下新建一個sitecustomize.py： import sys sys.setdefaultencoding('gb2312') 搞定，就是這麼簡單！

真正解決python UnicodeDecodeError: ‘ascii’ codec can’t decode byte ……

相信很多人跟我一樣在用python處理一些字串的時候遇到過這樣的問題：（csdn問題…圖片上的網址請自行忽略）然後遇到這種問題了之後左改右改發現依然有這個問題 … …… ……… 但是最後，仔細閱讀了python的官方文件在內的多處網站後發現還有print sys.g

UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xbd in position 11: ordinal not in range(128)

Windows預設的編碼方式是GBK 在使用python呼叫matlab相關的patplotlib.pyplot庫進行畫圖操作時遇到“UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xbd in position 11:

jupytext 安裝遇到UnicodeDecodeError: 'gbk' codec can't decode byte xx

今日安裝jupytext，遇到如題所示問題，詳情如下：怎麼辦呢？首先，從Traceback可以看到問題出在jupytext/setup.py line 6，很顯然，後面的語句告訴我們該程式有檔案讀取過程，但是編碼不對。然後，我們複

python | 讀檔案編碼問題 | UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 34: illegal mu

python 讀取文字檔案，報出gbk問題問題如下： UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in positio

Python各種錯誤之 UnicodeDecodeError: 'ascii' codec can't decode byte 0xc4 in position 33: ordinal not in

錯誤起因：為Python2.7安裝ez_setup.py。所報錯誤： UnicodeDecodeError: 'ascii' codec can't decode byte 0xc4 in pos

UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 199: illegal multib

在python3中讀取檔案時報錯：UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xae in position 199: illegal multibyte sequence 報錯原因:某個字元不能解碼

python編碼錯誤：UnicodeDecodeError: 'utf8' codec can't decode

這個是在寫hive的map指令碼時遇到的，基本情況如下： map檔案中呼叫了其他同學的公用函式，在hive指令碼中執行時，輸出報錯。但是，如果單獨執行python，並輸出到檔案，就沒有錯誤了，感覺異常的詭異，其中hive報錯如下： Traceback (mo

UnicodeDecodeError: 'ascii' codec can't decode byte 0xd3 in position 1: ordinal not in range(128)

用Python呼叫畫圖模組matplotlib的時候，執行老是報錯：“UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xd3 in position 1: ordinal not in range(128

pip 安裝pandas報UnicodeDecodeError: 'ascii' codec can't decode byte 0xd5錯

當python在window環境中通過pip安裝pandas報標題這樣的錯，主要是因為python預設編碼格式是：ascii 在https://www.python.org/dev/peps/pep-0100/文章中有如下介紹 Unicode Default Enco

fool.load_userdict(path)出現編碼檔案出錯，UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position

錯誤問題：UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 34: illegal multibyte sequence 解決方法：解決辦法1

解決UnicodeDecodeError: 'utf8' codec can't decode byte 0x9c

問題

解決方法

相關推薦