pandas的read_csv()和to_csv()使用方法

阿新 • • 發佈：2020-07-20

資料處理時經常會涉及csv讀寫操作，存在很多小tip，總結一下，方便使用。首先read_csv()是pandas的方法，to_csv()是DataFrame類的方法。

1. read_csv()

pandas.read_csv(
filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, 
index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, 
dtype=None, engine=None, converters=None, true_values=None, false_values=None, 
skipinitialspace 
=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, 
na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, 
infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, 
iterator=False, chunksize=None, compression='infer', thousands=None, decimal=b' 
.', 
lineterminator=None, quotechar='"', quoting=0, escapechar=None, comment=None, 
encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, 
warn_bad_lines=True, skipfooter=0, skip_footer=0, doublequote=True, 
delim_whitespace=False, as_recarray=None, compact_ints=None, use_unsigned=None, 
low_memory 
=True, buffer_lines=None, memory_map=False, float_precision=None )

引數特別多，挑幾個常用的總結一下

filepath_or_buffer：檔案所在處的路徑

pd.read_csv('C:/Users/My/Path/test.csv') #絕對位置

sep：指定分隔符，預設為逗號','

pd.read_csv('C:/Users/My/Path/test.csv',sep='?') #以?為分隔符，讀取csv檔案

delimiter：定界符，備選分隔符（如果指定該引數，則sep引數失效）

pd.read_csv('C:/Users/My/Path/test.csv',sep='?',delimiter=' ') #以空格作為分隔符讀取檔案，分隔符'?'失效

header：預設設定為0（即第一行作為表頭），如果沒有表頭的話，要修改引數，設定header=None

pd.read_csv('C:/Users/My/Path/test.csv',header=None) #讀出csv檔案無表頭

names：指定列的名稱，用列表表示。

pd.read_csv('C:/Users/My/Path/test.csv',names=['index','A','B']) #表頭中各列名字為index,A,B

index_col：指定哪一列資料作為行索引，可以是一列，也可以多列

pd.read_csv('C:/Users/My/Path/test.csv',index_col='A') #列為A的列作為行索引

prefix：給列名新增字首。

pd.read_csv('C:/Users/My/Path/test.csv',prefix='test') #當檔案無表頭，設定表頭中列名全都加上test字首，即test0，test1...

nrows：int, default None需要讀取的行數（從檔案頭開始算起）

pd.read_csv('C:/Users/My/Path/test.csv',nrows=10) #讀取10行資料

encoding：讀取檔案是使用的編碼方式

pd.read_csv('C:/Users/My/Path/test.csv',encoding='utf-8')

skiprows：需要忽略的行數（從檔案開始處算起），或需要跳過的行號列表（從0開始），預設為None

pd.read_csv('C:/Users/My/Path/test.csv',skiprows=5)  #跳過前五行資料（包括表頭資料）

2.DataFrame.to_csv()

DataFrame.to_csv(
path_or_buf=None, sep=', ', na_rep='',float_format=None, columns=None, 
header=True, index=True, index_label=None, mode='w', encoding=None, compression=None, 
quoting=None, quotechar='"', line_terminator='\n', chunksize=None, tupleize_cols=None, 
date_format=None, doublequote=True, escapechar=None, decimal='.')

引數相對少很多

path_or_buf:儲存檔案的路徑

df.to_csv('test.csv') #相對位置，儲存在os.getcwd()獲得的路徑下
df.to_csv('C:/Users/My/Path/test.csv') #絕對位置

sep：輸出檔案的欄位分隔符，預設為”,”

df.to_csv('C:/Users/My/Path/test.csv',sep='?')#使用?分隔需要儲存的資料，如果不寫，預設是,

na_rep：替換空值，預設為‘’

df.to_csv('C:/Users/My/Path/test.csv',na_rep='NA') #確實值儲存為NA，如果不寫，預設是空

float_format：浮點數格式

df.to_csv('C:/Users/My/Path/test.csv',float_format='%.2f') #保留兩位小數

cols:保留某列資料，預設為None

df.to_csv('C:/Users/think/Desktop/Result.csv',columns=['name']) #儲存索引列和name列

header：是否保留列名，預設為True

df.to_csv('C:/Users/My/Path/test.csv',header=0) #不儲存列名

index：是否保留行索引，預設為True

df.to_csv('C:/Users/My/Path/test.csv',index=False) #不儲存行索引

index_label：索引的列標籤，字串或序列，或False，預設為None

df.to_csv('C:/Users/My/Path/test.csv',index_label='Index') #行索引列名為'Index'

mode：str儲存模式：值為‘str’，預設“w”

df.to_csv('C:/Users/My/Path/test.csv',mode='a') #增量存入csv

encoding：輸出檔案中使用的編碼，預設為“UTF-8”

df.to_csv('C:/Users/My/Path/test.csv',encoding='utf_8_sig') #中文出現亂碼，改用utf_8_sig可解決

pandas的read_csv()和to_csv()使用方法

資料處理時經常會涉及csv讀寫操作，存在很多小tip，總結一下，方便使用。首先read_csv()是pandas的方法，to_csv()是DataFrame類的方法。

1篇文章搞清楚8種JVM記憶體溢位（OOM）的原因和解決方法

前言擼Java的同學，多多少少會碰到記憶體溢位（OOM）的場景，但造成OOM的原因卻是多種多樣。

Redis中記憶體溢位問題和持久化方法

一、記憶體溢位問題解決辦法 1. 設定key的過期時間 2. 按需求使用8種資料淘汰策略

簡單瞭解Java的預設和靜態方法

這篇文章主要介紹了簡單瞭解Java的預設和靜態方法,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

java封裝的概念和實現方法示例

本文例項講述了java封裝的概念和實現方法。分享給大家供大家參考，具體如下：

JAVA抽象類和抽象方法(abstract)例項分析

本文例項講述了JAVA抽象類和抽象方法(abstract)。分享給大家供大家參考，具體如下：

Java抽象類和抽象方法定義與用法例項詳解

本文例項講述了Java抽象類和抽象方法定義與用法。分享給大家供大家參考，具體如下：

Java同步程式碼塊和同步方法原理與應用案例詳解

本文例項講述了Java同步程式碼塊和同步方法。分享給大家供大家參考，具體如下：

Mysql資料庫的QPS和TPS的意義和計算方法

在做db基準測試的時候，qps,tps 是衡量資料庫效能的關鍵指標。本文比較了網上的兩種計算方式。先來了解一下相關概念。

基於scrapy的redis安裝和配置方法

在定向爬蟲的製作過程中，使用分散式爬取技術可以顯著提高爬取效率。而 Redis 配合 Scrapy 是實現分散式爬取的基礎。

Redis的配置、啟動、操作和關閉方法

一、啟動Redis 1.預設配置啟動執行redis-server命令，按照預設的redis.conf配置檔案中的配置啟動Redis，如下：

關於MySQL的儲存函式(自定義函式)的定義和使用方法詳解

儲存函式什麼是儲存函式: 封裝一段sql程式碼，完成一種特定的功能，返回結果。

mysql 5.7.20常用下載、安裝和配置方法及簡單操作技巧(解壓版免安裝)

話說凌晨剛折騰完一臺MySQL 5.7.19版本的安裝，未曾料到早上MySQL官方就釋出了最新的5.7.20版本。這個版本看似更新不多，但是加入了一個我們所急需的功能。

Python面向物件之私有屬性和私有方法應用案例分析

本文例項講述了Python面向物件之私有屬性和私有方法。分享給大家供大家參考，具體如下：

python面向物件之類屬性和類方法案例分析

本文例項講述了python面向物件之類屬性和類方法。分享給大家供大家參考，具體如下：

python字典setdefault方法和get方法使用例項

這篇文章主要介紹了python字典setdefault方法和get方法使用例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python 靜態方法和類方法例項分析

本文例項講述了Python 靜態方法和類方法。分享給大家供大家參考，具體如下：

詳解Python list和numpy array的儲存和讀取方法

numpy array儲存為.npy 儲存： import numpy as np numpy_array = np.array([1,2,3]) np.save(\'log.npy\',numpy_array )

python多繼承(鑽石繼承)問題和解決方法簡單示例

本文例項講述了python多繼承(鑽石繼承)問題和解決方法。分享給大家供大家參考，具體如下：

pandas的read_csv()和to_csv()使用方法

相關推薦