rood-Python 3讀取.CSV檔案遇到的編碼問題

阿新 • • 發佈：2019-01-08

今天算是我第一次進行Python 靜心的學習過程了。
拿到隧道的資料拷貝一下我擦30多G 很是happy 看來可以在故障檢測上面的有點進展了。
進入正題：
首先想要讀取.CSV 檔案，看到pandas模組有直接讀取的操作read_csv（）函式。雖然印象中Python中好像內建有open（），read（）等等函式，但是呃呃我是渣渣實在記不得怎麼用。。。。。。
於是很開心的給了一句
pd.read_csv(‘D:/AAProject/data/west/1/2012101100_2012101123.csv’)
悲劇了。。。。報錯
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb1 in position 0: invalid start byte
趕緊找度娘。。
度娘說。。啊這種情況吧你要。。。
【
import sys
import imp
imp.reload(sys)
sys.setdefaultencoding(‘utf-8’)
】—說是改變Python直譯器的編碼方式，預設是Unicode 要該為 utf-8
然並卵啊，AttributeError: module ‘sys’ has no attribute ‘setdefaultencoding’
就是告訴我sys裡面沒有這個方法唄。要是想當年出現這種情況，，，我直接做系統了。。。。
淡定。重新百度。。。。
因為我的原始檔資料裡確實有漢字所以很可能‘GBK’編碼唄。那就看看pandas 的read_csv()函式裡面有沒有規定編碼方式的引數控制唄，重要發現還是有引數進行控制的，小菜在這裡給出語句
pd.read_csv(‘D:/AAProject/data/west/1/2012101100_2012101123.csv’,encoding=”gbk”,skiprows=[1])
至此問題完美解決。

—–涉及ETL、Python、java、D3、機器學習為目標的研一小菜鳥

rood-Python 3讀取.CSV檔案遇到的編碼問題

rood-Python 3讀取.CSV檔案遇到的編碼問題

Python中pandas讀取*.csv檔案出現編碼問題

使用python pandas讀取csv檔案資料

Python pandas讀取csv檔案直接轉化成二維列表（Dataframe轉化為list）

python的讀取csv檔案資料

Python批量讀取csv檔案併合並檔案

3.2.4 Python讀取CSV檔案

Python學習：讀取csv檔案

Python 讀取 csv 檔案忽略引號中欄位的逗號

python指定字符集寫入和讀取csv檔案

Pandas Python讀取CSV檔案中的某一列

Win7，64位下Python 讀取csv檔案(Excel轉化的)並繪製圖表

Python按指定列讀取csv檔案及寫檔案時的隔行問題

使用python讀取csv檔案

讀書筆記--python資料視覺化--001_讀取CSV檔案資料

python中常見csv檔案讀取方法比較

Python讀取csv檔案分隔符設定

Python 讀取csv檔案批量入庫Mysql

Python ddt讀取CSV文件數據驅動

android讀取csv檔案資料

rood-Python 3讀取.CSV檔案遇到的編碼問題

相關推薦