利用python實現平穩時間序列的建模方式

阿新 • • 發佈：2020-06-04

一、平穩序列建模步驟

假如某個觀察值序列通過序列預處理可以判定為平穩非白噪聲序列，就可以利用ARMA模型對該序列進行建模。建模的基本步驟如下：

（1）求出該觀察值序列的樣本自相關係數（ACF）和樣本偏自相關係數（PACF）的值。

（2）根據樣本自相關係數和偏自相關係數的性質，選擇適當的ARMA（p，q）模型進行擬合。

（3）估計模型中位置引數的值。

（4）檢驗模型的有效性。如果模型不通過檢驗，轉向步驟（2），重新選擇模型再擬合。

（5）模型優化。如果擬合模型通過檢驗，仍然轉向不走（2），充分考慮各種情況，建立多個擬合模型，從所有通過檢驗的擬合模型中選擇最優模型。

（6）利用擬合模型，預測序列的將來走勢。

二、程式碼實現

1、繪製時序圖，檢視資料的大概分佈

trainSeting.head()
Out[36]: 
date
2017-10-01 126.4
2017-10-02  82.4
2017-10-03  78.1
2017-10-04  51.1
2017-10-05  90.9
Name: sales,dtype: float64

plt.plot(trainSeting)

利用python實現平穩時間序列的建模方式

2、平穩性檢驗

'''進行ADF檢驗
adf_test的返回值
Test statistic：代表檢驗統計量
p-value：代表p值檢驗的概率
Lags used：使用的滯後k，autolag=AIC時會自動選擇滯後
Number of Observations Used：樣本數量
Critical Value(5%) : 顯著性水平為5%的臨界值。
(1)假設是存在單位根，即不平穩；
(2)顯著性水平，1%：嚴格拒絕原假設；5%：拒絕原假設，10%類推。
(3)看P值和顯著性水平a的大小，p值越小，小於顯著性水平的話，就拒絕原假設，認為序列是平穩的；大於的話，不能拒絕，認為是不平穩的
(4)看檢驗統計量和臨界值，檢驗統計量小於臨界值的話，就拒絕原假設，認為序列是平穩的；大於的話，不能拒絕，認為是不平穩的
'''
#滾動統計
def rolling_statistics(timeseries):
 #Determing rolling statistics
 rolmean = pd.rolling_mean(timeseries,window=12)
 rolstd = pd.rolling_std(timeseries,window=12)
 
 #Plot rolling statistics:
 orig = plt.plot(timeseries,color='blue',label='Original')
 mean = plt.plot(rolmean,color='red',label='Rolling Mean')
 std = plt.plot(rolstd,color='black',label = 'Rolling Std')
 plt.legend(loc='best')
 plt.title('Rolling Mean & Standard Deviation')
 plt.show(block=False)
 
##ADF檢驗
from statsmodels.tsa.stattools import adfuller
def adf_test(timeseries):
 rolling_statistics(timeseries)#繪圖
 print ('Results of Augment Dickey-Fuller Test:')
 dftest = adfuller(timeseries,autolag='AIC')
 dfoutput = pd.Series(dftest[0:4],index=['Test Statistic','p-value','#Lags Used','Number of Observations Used'])
 for key,value in dftest[4].items():
  dfoutput['Critical Value (%s)'%key] = value #增加後面的顯著性水平的臨界值
 print (dfoutput)
 
adf_test(trainSeting) #從結果中可以看到p值為0.1097>0.1，不能拒絕H0,認為該序列不是平穩序列

返回結果如下

利用python實現平穩時間序列的建模方式

Results of Augment Dickey-Fuller Test:
Test Statistic    -5.718539e+00
p-value      7.028398e-07
#Lags Used      0.000000e+00
Number of Observations Used 6.200000e+01
Critical Value (1%)   -3.540523e+00
Critical Value (5%)   -2.909427e+00
Critical Value (10%)   -2.592314e+00
dtype: float64

通過上面可以看到，p值小於0.05，可以認為該序列為平穩時間序列。

3、白噪聲檢驗

'''acorr_ljungbox(x,lags=None,boxpierce=False)函式檢驗無自相關
lags為延遲期數，如果為整數，則是包含在內的延遲期數，如果是一個列表或陣列，那麼所有時滯都包含在列表中最大的時滯中
boxpierce為True時表示除開返回LB統計量還會返回Box和Pierce的Q統計量
返回值：
lbvalue:測試的統計量
pvalue:基於卡方分佈的p統計量
bpvalue:((optionsal),float or array) – test statistic for Box-Pierce test
bppvalue:((optional),float or array) – p-value based for Box-Pierce test on chi-square distribution
'''
from statsmodels.stats.diagnostic import acorr_ljungbox
def test_stochastic(ts,lag):
 p_value = acorr_ljungbox(ts,lags=lag) #lags可自定義
 return p_value

test_stochastic(trainSeting,[6,12])
Out[62]: (array([13.28395274,14.89281684]),array([0.03874194,0.24735042]))

從上面的分析結果中可以看到，延遲6階的p值為0.03<0.05，因此可以拒絕原假設，認為該序列不是白噪聲序列。

4、確定ARMA的階數

（1）利用自相關圖和偏自相關圖

####自相關圖ACF和偏相關圖PACF
import statsmodels.api as sm
def acf_pacf_plot(ts_log_diff):
 sm.graphics.tsa.plot_acf(ts_log_diff,lags=40) #ARIMA,q
 sm.graphics.tsa.plot_pacf(ts_log_diff,p
 
acf_pacf_plot(trainSeting) #檢視資料的自相關圖和偏自相關圖

利用python實現平穩時間序列的建模方式

（2）藉助AIC、BIC統計量自動確定

##藉助AIC、BIC統計量自動確定
from statsmodels.tsa.arima_model import ARMA
def proper_model(data_ts,maxLag): 
 init_bic = float("inf")
 init_p = 0
 init_q = 0
 init_properModel = None
 for p in np.arange(maxLag):
  for q in np.arange(maxLag):
   model = ARMA(data_ts,order=(p,q))
   try:
    results_ARMA = model.fit(disp=-1,method='css')
   except:
    continue
   bic = results_ARMA.bic
   if bic < init_bic:
    init_p = p
    init_q = q
    init_properModel = results_ARMA
    init_bic = bic
 return init_bic,init_p,init_q,init_properModel
 
proper_model(trainSeting,40)

#在statsmodels包裡還有更直接的函式：
import statsmodels.tsa.stattools as st
order = st.arma_order_select_ic(ts_log_diff2,max_ar=5,max_ma=5,ic=['aic','bic','hqic'])
order.bic_min_order
'''
我們常用的是AIC準則，AIC鼓勵資料擬合的優良性但是儘量避免出現過度擬合(Overfitting)的情況。所以優先考慮的模型應是AIC值最小的那一個模型。
為了控制計算量，我們限制AR最大階不超過5，MA最大階不超過5。 但是這樣帶來的壞處是可能為區域性最優。
timeseries是待輸入的時間序列，是pandas.Series型別，max_ar、max_ma是p、q值的最大備選值。
order.bic_min_order返回以BIC準則確定的階數，是一個tuple型別

返回值如下：

order.bic_min_order
Out[13]: (1,0)

5、建模

從上述結果中可以看到，可以選擇AR(1)模型

################################模型######################################
# AR模型，q=0
#RSS是殘差平方和
# disp為-1代表不輸出收斂過程的資訊，True代表輸出
from statsmodels.tsa.arima_model import ARIMA
model = ARIMA(trainSeting,order=(1,0)) #第二個引數代表使用了二階差分
results_AR = model.fit(disp=-1)
plt.plot(trainSeting)
plt.plot(results_AR.fittedvalues,color='red') #紅色線代表預測值
plt.title('RSS:%.4f' % sum((results_AR.fittedvalues-trainSeting)**2))#殘差平方和

利用python實現平穩時間序列的建模方式

6、預測未來走勢

############################預測未來走勢##########################################
# forecast方法會自動進行差分還原，當然僅限於支援的1階和2階差分
forecast_n = 12 #預測未來12個天走勢
forecast_AR = results_AR.forecast(forecast_n)
forecast_AR = forecast_AR[0]
print (forecast_AR)

print (forecast_ARIMA_log)
[90.49452199 84.05407353 81.92752342 81.22536496 80.99352161 80.91697003

80.89169372 80.88334782 80.88059211 80.87968222 80.87938178 80.87928258]

##將預測的資料和原來的資料繪製在一起，為了實現這一目的，我們需要增加資料索引，使用開源庫arrow:
import arrow
def get_date_range(start,limit,level='day',format='YYYY-MM-DD'):
 start = arrow.get(start,format) 
 result=(list(map(lambda dt: dt.format(format),arrow.Arrow.range(level,start,limit=limit))))
 dateparse2 = lambda dates:pd.datetime.strptime(dates,'%Y-%m-%d')
 return map(dateparse2,result)
 
# 預測從2017-12-03開始，也就是我們訓練資料最後一個數據的後一個日期
new_index = get_date_range('2017-12-03',forecast_n)
forecast_ARIMA_log = pd.Series(forecast_AR,copy=True,index=new_index)
print (forecast_ARIMA_log.head())
##繪圖如下
plt.plot(trainSeting,label='Original',color='blue')
plt.plot(forecast_ARIMA_log,label='Forcast',color='red')
plt.legend(loc='best')
plt.title('forecast')

利用python實現平穩時間序列的建模方式

以上這篇利用python實現平穩時間序列的建模方式就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

利用python實現平穩時間序列的建模方式

一、平穩序列建模步驟假如某個觀察值序列通過序列預處理可以判定為平穩非白噪聲序列，就可以利用ARMA模型對該序列進行建模。建模的基本步驟如下：

利用Python實現Json序列化庫的方法步驟

前言在Python的世界裡，將一個物件以json格式進行序列化或反序列化一直是一個問題。Python標準庫裡面提供了json序列化的工具，我們可以簡單的用json.dumps來將一個物件序列化。但是這種序列化僅支援python內建的基本

python基礎教程利用Python實現Json序列化庫的方法步驟

更多python教程請到：菜鳥教程https://www.piaodoo.com/ 前言在Python的世界裡，將一個物件以json格式進行序列化或反序列化一直是一個問題。Python標準庫裡面提供了json序列化的工具，我們可以簡單的用json.dum

Python對商店資料進行lstm和xgboost銷售量時間序列建模預測分析

原文連結：http://tecdat.cn/?p=17748 在資料科學學習之旅中，我經常處理日常工作中的時間序列資料集，並據此做出預測。

AR(I)MA時間序列建模過程——步驟和python程式碼

1.異常值和缺失值的處理這絕對是資料分析時讓所有人都頭疼的問題。異常和缺失值會破壞資料的分佈，並且干擾分析的結果，怎麼處理它們是一門大學問，而我根本還沒入門。

python實現指定ip埠掃描方式

在Linux中判斷一臺主機是否可達，可以使用ping命令，而判斷埠是否開啟，可以使用telnet命令，但是telnet命令沒有超時時間的引數，使用起來不是很方便，那麼可以利用Python來完成一個埠掃描的功能

利用python實現氣泡排序演算法例項程式碼

氣泡排序氣泡排序（英語：Bubble Sort）是一種簡單的排序演算法。它重複地遍歷要排序的數列，一次比較兩個元素，如果他們的順序錯誤就把他們交換過來。遍歷數列的工作是重複地進行直到沒有再需要交換，也就是說該數

利用python實現AR教程

先了解如何利用python語言實現以平面和標記物進行姿態估計本實驗只是先實現一個簡單的小例子。簡單來說就是先識別出影象中的參考面，再拍攝一張目標影象，將參考面頂部的3D模型投影到目標影象上。

python實現輸出一個序列的所有子序列示例

如下所示： def sub(arr): finish=[] size = len(arr) end = 1 << size #end=2**size for index in range(end): # shift index

利用python實現PSO演算法優化二元函式

python實現PSO演算法優化二元函式，具體程式碼如下所示： import numpy as np import random

利用Python校準本地時間的方法教程

1. 概念 1.1 基本概念時間，對於我們來說很重要，什麼時候做什麼？什麼時候發生什麼？沒有時間的概念，生活就亂了。

使用python實現離散時間傅立葉變換的方法

我們經常使用傅立葉變換來計算數字訊號的頻譜，進而分析數字訊號，離散時間傅立葉變換的公式為：

利用python實現.dcm格式影象轉為.jpg格式

如下所示： import pydicom import matplotlib.pyplot as plt import scipy.misc import pandas as pd import numpy as np

Python實現bilibili時間長度查詢的示例程式碼

說明：最近在B站看一些材料力學視訊時候，感覺有一些分集狂魔的分集真的很恐怖，有的甚至上百集，因此決定寫個小指令碼每次分析下到底這個系列視訊到底有多長。

利用python實現逐步迴歸

逐步迴歸的基本思想是將變數逐個引入模型，每引入一個解釋變數後都要進行F檢驗，並對已經選入的解釋變數逐個進行t檢驗，當原來引入的解釋變數由於後面解釋變數的引入變得不再顯著時，則將其刪除。以確保每次引入新的

利用python實現凱撒密碼加解密功能

凱撒密碼介紹凱撒密碼是一種非常古老的加密方法，相傳當年凱撒大地行軍打仗時為了保證自己的命令不被敵軍知道，就使用這種特殊的方法進行通訊，以確保資訊傳遞的安全。他的原理很簡單，說到底就是字母於字母之間的替

python實現處理mysql結果輸出方式

在運維過程中，經常需要讀取mysql的結果輸出並進行響應的處理，這節介紹如何用Python讀取mysql結果表並進行相應的整理。

Python如何根據時間序列資料作圖

本例子程式展示了長白山火山氣體地球化學2002年觀測資料中CO2和He兩種氣體元素深度的時間序列。程式中用到了常用的時間序列python資料處理方法，箭頭標識方法，適合學習基本python作圖學習使用。程式中所用到的no09.

利用Python實現某OA系統的自動定位功能

本文介紹了筆者通過python程式實現某OA系統自動考勤打卡功能及相關邏輯原理的解析。

Python實現計算影象RGB均值方式

要求存在一個資料夾內有若干張影象，需要計算每張圖片的RGB均值，並計算全部影象的RGB均值。

利用python實現平穩時間序列的建模方式

相關推薦