時間序列處理方法
阿新 • • 發佈:2018-08-17
code 相關 ima 數據讀取 pacf air 讀取 imp 數列 時間序列處理方法
1、ARIMA模型
ARIMA模型,是統計學中的常見對時間序列處理的模型,全稱為自回歸移動平均模型。
ARIMA模型主要有p,d,q三個參數。
p--代表預測模型中采用的時序數據本身的滯後數(lags) ,也叫做AR/Auto-Regressive項
d--代表時序數據需要進行幾階差分化,才是穩定的,也叫Integrated項。
q--代表預測模型中采用的預測誤差的滯後數(lags),也叫做MA/Moving Average項
2.應用步驟
1.數據讀取
把索引轉換成時間索引;
# -*- coding:utf-8 -*- import numpy as np import pandas as pd from datetime import datetime import matplotlib.pylab as plt # 讀取數據,pd.read_csv默認生成DataFrame對象,需將其轉換成Series對象 df = pd.read_csv(‘AirPassengers.csv‘, encoding=‘utf-8‘, index_col=‘date‘) df.index = pd.to_datetime(df.index) # 將字符串索引轉換成時間索引 ts = df[‘x‘] # 生成pd.Series對象 # 查看數據格式 ts.head() ts.head().index
2.繪制圖,觀察序列是否為平穩序列,若否,則進行d階差分,轉化成平穩數列。
3.對平穩序列獲取,自相關系數ACF和偏相關系數PACF;從而得到最佳的階層p和階數q;
4.獲得ARIMA模型,進行預測。
————
參考:
- https://www.kesci.com/home/project/5a349f31da263370ab5f89c4;
時間序列處理方法