pandas讀取csv檔案的操作
阿新 • • 發佈:2019-02-14
1. 讀取csv檔案
import pandas as pd
import numpy as np
# 讀取整個csv檔案
csv_data = pd.read_csv("./stock_day.csv")
# 讀取指定列索引欄位的資料
csv_data = pd.read_csv("./stock_day.csv", usecols=['open', 'close'])
# 將我們修改完的csv的檔案儲存到新的路徑下
csv_data.to_csv('demo.csv')
觀察我們儲存的檔案的格式(行索引為我們的日期, 列索引為 open close) :
# 檢視新儲存的檔案 new_data = read_csv('./demo.csv')
觀察新儲存的檔案(我們在讀取的時候預設給我們添加了新的行索引, 及Unnamed:0):
使用to_csv的時候, 我們可以給他傳入幾個引數:
csv_data.to_csv('demo.csv', header=True, index=False)
to_csv這個方法中可以傳遞一些引數:
DataFrame.to_csv(path_or_buf=None, sep=', ’, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None)
- path_or_buf :檔案儲存的路徑;
- sep :預設是以 , 進行分割 , 也可以自己制定;
- columns : 儲存索引列和指定列;
- index:是否寫進行索引 0或者1;
- header :boolean or list of string, default True,是否寫進列索引值 0或者 1;
- na_rep=NaN: 缺失值儲存為Na 如果不寫 預設為空;
- float_format='%.2f' :保留兩位小數;
再來回顧一下將我們的行索引裝成日期格式的方法:
# 生成一個時間的序列,略過週末非交易日 date = pd.date_range('2018-02-27', periods=new_data.shape[1], freq='B') # index代表行索引,columns代表列索引 new_data = pd.DataFrame(new_data, index=date)