1. 程式人生 > >pandas讀取csv檔案的操作

pandas讀取csv檔案的操作

1. 讀取csv檔案

import pandas as pd
import numpy as np

# 讀取整個csv檔案
csv_data = pd.read_csv("./stock_day.csv")

# 讀取指定列索引欄位的資料
csv_data = pd.read_csv("./stock_day.csv", usecols=['open', 'close'])

# 將我們修改完的csv的檔案儲存到新的路徑下
csv_data.to_csv('demo.csv')

觀察我們儲存的檔案的格式(行索引為我們的日期, 列索引為 open close) :

# 檢視新儲存的檔案
new_data = read_csv('./demo.csv')

觀察新儲存的檔案(我們在讀取的時候預設給我們添加了新的行索引, 及Unnamed:0): 

使用to_csv的時候, 我們可以給他傳入幾個引數:

csv_data.to_csv('demo.csv', header=True, index=False)

 

to_csv這個方法中可以傳遞一些引數:

 DataFrame.to_csv(path_or_buf=None, sep=', ’, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None)

  • path_or_buf :檔案儲存的路徑;
  • sep :預設是以 , 進行分割 , 也可以自己制定;
  • columns : 儲存索引列和指定列;
  • index:是否寫進行索引 0或者1;
  • header :boolean or list of string, default True,是否寫進列索引值 0或者 1;
  • na_rep=NaN: 缺失值儲存為Na 如果不寫 預設為空;
  • float_format='%.2f' :保留兩位小數;

再來回顧一下將我們的行索引裝成日期格式的方法:

# 生成一個時間的序列,略過週末非交易日
date = pd.date_range('2018-02-27', periods=new_data.shape[1], freq='B')

# index代表行索引,columns代表列索引
new_data = pd.DataFrame(new_data, index=date)