Pandas之read_csv()讀取檔案跳過報錯行的解決

阿新 • • 發佈：2020-04-22

讀取檔案時遇到和列數不對應的行，此時會報錯。若報錯行可以忽略，則新增以下引數:

樣式：

pandas.read_csv(***,error_bad_lines=False)

pandas.read_csv(filePath) 方法來讀取csv檔案時，可能會出現這種錯誤：

ParserError：Error tokenizing data.C error:Expected 2 fields in line 407,saw 3.

是指在csv檔案的第407行資料，期待2個欄位，但在第407行實際發現了3個欄位。

原因：header只有兩個欄位名，但資料的第407行卻出現了3個欄位（可能是該行資料包含了逗號，或者確實有三個部分），導致pandas不知道該如何處理。

解決辦法：把第407行多出的欄位刪除，或者通過在read_csv方法中設定error_bad_lines=False來忽略這種錯誤：

改為

pandas.read_csv(filePath,error_bad_lines=False)

來忽略掉其中出現錯亂(例如，由於逗號導致多出一列)的行。

KeyError錯誤：

報這種錯是由於使用了DataFrame中沒有的欄位，例如id欄位，原因可能是：

.csv檔案的header部分沒加逗號分割，此時可使用df.columns.values來檢視df到底有哪些欄位：

print(df.columns.values)

.在操作DataFrame的過程中丟掉了id欄位的header，卻沒發現該欄位已丟失。

例如：

df=df[df['id']!='null']#取得id欄位不為null的行
df=df['id']#賦值後df為Series，表示df在id列的值，而不再是一個DataFrame,於是丟掉了id的頭，此時若再使用df['id']將報錯。

取列的值，與取列的區別：

df=df['id']#取id列的值，賦值後df為Series型別，可用print(type(df))來檢視其型別
df=df[['id']]#只取df的id列作為一個新的DataFrame，賦值後df仍然是一個DataFrame
df=df[['id','age']]#取df的id和age列作為一個新的DataFrame，賦值後df仍然是一個DataFrame

過濾行

df=df[df['id']!='null']#過濾掉id欄位取值為'null'的行

注意，此處的'null'是一個字串，若df中某行id欄位的值不是字串型，或者為空，將報TypeError：invalid type comparison錯，因為只有相同型別的值才能進行比較。

解決辦法：如果不能保證id列都是string型別，則需要去掉該過濾條件。

補充知識：pandas 使用read_csv讀取檔案時產生錯誤：EOF inside string starting at line

解決方法：使用引數 quoting

df = pd.read_csv(csvfile,header = None,delimiter="\t",quoting=csv.QUOTE_NONE,encoding='utf-8')

以上這篇Pandas之read_csv()讀取檔案跳過報錯行的解決就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

Pandas之read_csv()讀取檔案跳過報錯行的解決

讀取檔案時遇到和列數不對應的行，此時會報錯。若報錯行可以忽略，則新增以下引數:

mysql 主從複製如何跳過報錯

一、傳統binlog主從複製，跳過報錯方法 mysql> stop slave; mysql> set global sql_slave_skip_counter = 1;

解決Cannot resolve com.alibaba.cloud:aliyun-oss-spring-boot-starter:unknown 檔案上傳報錯aliCloudEdasSdk解決

1.解決unknown：  <dependencyManagement> <dependencies>

關於java讀取resource下檔案，程式報錯不存在問題的解決

技術標籤：# java記錄先排除路徑錯誤等低階錯誤。一般讀取某檔案，比如在resource目錄下的ehcache資料夾中有ehcache-shiro.xml檔案，使用以下方式讀取

pytest測試框架之skip&skipif跳過測試用例

前言 pytest.mark.skip可以標記無法在某些平臺上執行的測試功能，或者您希望失敗的測試功能。

android studio 新建專案報錯的解決之路

android studio 新建工程報錯 Error:Could not resolve all files for configuration \':app:debugCompileClasspath\'.

vue打包靜態資源後顯示空白及static檔案路徑報錯的解決

今天使用vue打包（npm run build）遇到了幾個坑，在這裡分享給大家打包之後開啟dist的頁面顯示空白：

Spring JPA配置檔案Eclipse報錯如何解決

新公司工程是用Maven管理的，技術上使用了JPA，但是我匯入工程到MyEclipse時，applicationContext.xml中提示錯誤：

Windows編輯shell檔案放到Linux中執行報錯的解決方案

技術標籤：技術雜記 Windows用notepad++ 編輯shell檔案run_spleeter.sh echo "================================="

十分鐘cmdb 之 2021-01-19 Django2.2報錯 AttributeError: ‘str‘ object has no attribute ‘decode‘

技術標籤：django開發python語言pythondjango Django2.2報錯 AttributeError: \'str\' object has no attribute \'decode\'

QSqlDatabase:QMYSQL driver not load 之Qt與MySQL連線報錯的解決辦法

1.錯誤情況 1.1 測試程式 QStringList drivers = QSqlDatabase::drivers(); foreach (QString str, drivers) {

POI匯出word檔案插入圖片報錯問題整理

技術標籤：javapoi 匯出word文件的過程中因為文件資訊展示需要，要在指定位置插入圖片，遇到的一系列問題整理：

刪除Python-readlines讀取檔案時出現的換行

技術標籤：Pyhton小知識python 使用 splitlines() 方法前 with open(\'jieba.txt\',\'r\', encoding=\'utf-8\') as f:

(轉載)Mac根目錄下無法建立檔案或目錄-報錯 mount_apfs: volume could not be mounted: Operation not permitted mount: / fail

Mac根目錄下無法建立檔案或目錄- 報錯 /data: Read-only file system 報錯 mount_apfs: volume could not be mounted: Operation not permitted mount: / fail

淺析pdfbox將pdf檔案轉圖片報錯Cannot read JPEG2000 image的問題及JPEG與JPEG2000介紹瞭解

一、問題背景 1、問題報錯：How to fix \"Cannot read JPEG2000 image: Java Advanced Imaging (JAI) Image I/O Tools are not installed\"

日常踩坑之jpa儲存時失敗，報錯SQL Error: 1064, SQLState: 42000錯誤

背景交代使用jpa的save儲存物件時，發現死活存不進去，然後報錯了SQL Error: 1064, SQLState: 42000錯誤

檔案上傳報錯：Current request is not a multipart request的解決辦法

原文連結: https://blog.csdn.net/u013168084/article/details/107911335 1.問題現象寫在檔案上傳介面時，傳入引數有MultipartFile檔案和其他型別引數，如圖所示。

【Serverless】雲端儲存web上傳檔案提示網路報錯問題

問題背景：在web專案中整合AGC雲端儲存SDK後，在執行reference.put(file)方法上傳一張圖片檔案時，一直會報“Agconnect Storage: agc network request error, Network Error”的錯誤，上傳失敗。

SpringBoot整合MybatisPlus報錯的解決方案

這篇文章主要介紹了SpringBoot整合MybatisPlus報錯的解決方案,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Spring Cloud Feign報錯問題解決

這篇文章主要介紹了Spring Cloud Feign報錯問題解決,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Pandas之read_csv()讀取檔案跳過報錯行的解決

相關推薦