1. 程式人生 > >python時間序列降頻resample(python學習記錄)

python時間序列降頻resample(python學習記錄)

在處理行情資料和回測的時候,變頻操作用得非常多。我這裡用的比較多的是1分鐘資料變頻為高級別週期,比如5分鐘、半小時、1小時等。這裡以5分鐘舉例,並記錄變頻操作時遇到的問題:

import pandas as pd
df=pd.read_csv("D:\\Quant\Min1_close.csv")
df_close=df.resample('5min').last()
print(df.head(30))
print(df_close.head())


resample里老的寫法是

df_close=df.resample('5min',how='last')

how裡可以選的方式有很多:sum, first, max等等

——想像一下,如果1分鐘的資料降頻到5分鐘,那麼5分鐘的開盤價應該是第一個1分鐘的開盤價,5分鐘的收盤價應該是第5個1分鐘的收盤價,最高價是5個1分鐘裡的最高價,最低價是5個1分鐘裡的最低價。

在這裡遇到的小小問題是wind輸出的1分鐘資料裡額外有個15:00和20:59的資料,並且是有成交量的

合成5分鐘以後同樣會多出來15:00和20:55分的資料——相當於多出了兩根BAR