如何在Python中儲存ARIMA時間序列預測模型

阿新 • • 發佈：2022-05-02

自迴歸移動平均模型(ARIMA)是一種常用於時間序列分析和預測的線性模型。

statsmodels庫提供了Python中使用ARIMA的實現。ARIMA模型可以儲存到檔案中，以便以後對新資料進行預測。在當前版本的statsmodels庫中有一個bug，它阻止了儲存的模型被載入。在本教程中，你將瞭解如何診斷並解決此問題。

讓我們開始吧。

每日女嬰出生資料集

首先，讓我們看看標準時間序列資料集，我們可以用statsmodels ARIMA實現來理解這個問題

這個每日的女嬰出生資料集描述了1959年加利福尼亞每日出生的女嬰數量。

它的單位是數值型，有365個觀察值。資料集的來源於Newton (1988)。

你可以從DataMarket網站了解更多資訊並下載資料集。

下載資料集並將其放在你當前的工作目錄中，檔案名為 “ daily-total-female-births.csv ”。

以下的程式碼將載入並繪製資料集。

from pandasimport Series
from matplotlibimport pyplot
series= Series.from_csv('daily-total-female-births.csv', header=0)
series.plot()
pyplot.show()

執行該示例載入資料庫，並生成 Pandas 庫中的 Series 物件，然後顯示資料的折線圖。

Python環境

確認正在使用statsmodels庫是最新版本。

你可以通過執行以下指令碼來執行此操作：

import statsmodels
print('statsmodels: %s' % statsmodels.__version__)

執行指令碼應該產生一個顯示statsmodels 0.6或0.6.1的結果（目前更新到0.8，bug仍然存在）。

statsmodels:0.6.1

匯出錯誤資訊：

AttributeError:'ARIMA' object has no attribute'dates'

ARIMA模型儲存錯誤

我們可以輕鬆地在每日女嬰出生資料集上訓練一個ARIMA模型。

下面的程式碼片段在資料集上訓練了一個ARIMA（1,1,1）。該model.fit（）函式返回一個ARIMAResults物件，我們可以呼叫save（）儲存檔案模型然後呼叫load（）載入它。

from pandasimport Series
from statsmodels.tsa.arima_modelimport ARIMA
from statsmodels.tsa.arima_modelimport ARIMAResults
# load data
series= Series.from_csv('daily-total-female-births.csv', header=0)
# prepare data
X= series.values
X= X.astype('float32')
# fit model
model= ARIMA(X, order=(1,1,1))
model_fit= model.fit()
# save model
model_fit.save('model.pkl')
# load model
loaded= ARIMAResults.load('model.pkl')

執行此示例將訓練模型並將其儲存到檔案中，沒有遇到問題。

但當你嘗試從檔案載入模型時，就會報告錯誤。

Traceback (most recent call last):
  File "...", line16,in <module>
    loaded= ARIMAResults.load('model.pkl')
  File ".../site-packages/statsmodels/base/model.py", line1529,in load
    return load_pickle(fname)
  File ".../site-packages/statsmodels/iolib/smpickle.py", line41,in load_pickle
    return cPickle.load(fin)
TypeError: __new__() takes at least3 arguments (1 given)

錯誤資訊如下：

TypeError: __new__() takes at least3 arguments (1 given)

那麼我們該如何解決呢？

ARIMA模型儲存Bug解決方法

Zae Myung Kim在2016年9月發現並報告了這個錯誤。

你可以在這裡閱讀全文：

BUG: Implemented __getnewargs__() method for unpickling

會發生這種錯誤是因為在statsmodels中尚未定義pickle（用於序列化Python物件的庫）所需的函式。

在儲存之前，必須在ARIMA模型中定義__getnewargs__函式，它定義構造物件所需的引數。

我們可以解決這個問題。修復涉及兩件事情：

定義適用於ARIMA物件的__getnewargs__函式的實現。
將新的函式新增到ARIMA。

Zae Myung Kim在他的錯誤報告中提供了一個功能的例子，我們可以直接使用它：

def __getnewargs__(self):
    return ((self.endog),(self.k_lags,self.k_diff,self.k_ma))

Python允許我們對一個物件使用猴子補丁（monkey patch），像statsmodels庫做的那樣。

我們可以使用賦值在現有物件上定義一個新的函式。

我們可以在ARIMA物件上的__getnewargs__函式中執行以下操作：

ARIMA.__getnewargs__= __getnewargs__

在Python中使用猴子補丁訓練、儲存和載入ARIMA模型的完整示例如下：

from pandasimport Series
from statsmodels.tsa.arima_modelimport ARIMA
from statsmodels.tsa.arima_modelimport ARIMAResults

# monkey patch around bug in ARIMA class
def __getnewargs__(self):
    return ((self.endog),(self.k_lags,self.k_diff,self.k_ma))
ARIMA.__getnewargs__= __getnewargs__

# load data
series= Series.from_csv('daily-total-female-births.csv', header=0)
# prepare data
X= series.values
X= X.astype('float32')
# fit model
model= ARIMA(X, order=(1,1,1))
model_fit= model.fit()
# save model
model_fit.save('model.pkl')
# load model
loaded= ARIMAResults.load('model.pkl')

執行該示例現在成功載入模型沒有報錯。

總結

在這篇文章中，你學會了如何解決statsmodels ARIMA實現中的阻止你將ARIMA模型儲存並載入到檔案的bug。

你學會了如何編寫一個猴子補丁來解決這個bug，以及如何證明它已經被修復了。

原文：http://machinelearningmastery.com/save-arima-time-series-forecasting-model-python/

如何在Python中儲存ARIMA時間序列預測模型

自迴歸移動平均模型(ARIMA)是一種常用於時間序列分析和預測的線性模型。 statsmodels庫提供了Python中使用ARIMA的實現。ARIMA模型可以儲存到檔案中，以便以後對新資料進行預測。在當前版本的statsmodels庫中有一個bu

大資料分析培訓課程python時間序列預測SARIMAX模型教程

　　什麼是SARIMAX模型? 　　　　儘管我們針對時間序列模型專門撰寫了一系列大資料分析培訓課程python時間序列預測SARIMAX模型教程文章，但我們尚未討論一個非常重要的主題-季節性。

詳解用Python進行時間序列預測的7種方法

資料準備資料集（JetRail高鐵的乘客數量）下載. 假設要解決一個時序問題：根據過往兩年的資料（2012 年 8 月至 2014 年 8月），需要用這些資料預測接下來 7 個月的乘客數量。

基於 Holt-Winters季節性預測模型的時間序列預測

技術標籤：資料分析 import numpy as np import pandas as pd import matplotlib.pyplot as plt from statsmodels.tsa.api import ExponentialSmoothing

將梯度提升模型與 Prophet 相結合可以提升時間序列預測的效果

將Prophet的預測結果作為特徵輸入到 LightGBM 模型中進行時序的預測我們以前的關於使用機器學習進行時間序列預測的文章中，都是專注於解釋如何使用基於機器學習的方法進行時間序列預測並取得良好結果。

Keras中帶LSTM的多變數時間序列預測

像長短期記憶（Long Short-Term Memory ) LSTM 遞迴神經網路這樣的神經網路幾乎可以完美地模擬多個輸入變數的問題。

時間序列預測全攻略（附帶Python程式碼）

原文作者：AARSHAY JAIN 36大資料翻譯，http://www.36dsj.com/archives/43811 時間序列（簡稱TS）被認為是分析領域比較少人知道的技能。（我也是幾天前才知道它）。但是你一定知道最近的小型程式設計馬拉松就是基於時

ARIMA時間序列分析氣溫變化專案（雜記）

ARIMA時間序列分析氣溫變化專案（雜記）一年後會有同樣任務的人看到這篇文章嗎……

《時間序列預測方法總結》

時間序列預測方法總結 BINGO Hong 剛出石油坑，又入資債坑。求撈我~ 蕭瑟、有道理

如何將時間序列預測轉換為監督學習問題

技術標籤：python 時間序列轉化為監督學習 1、時間序列與監督學習2、利用Pandas的shift()函式3、series_to_supervised（）功能4、單變數時間序列5、多變數時間序列6、總結

基於Python使用整合學習實現風速預測模型

技術標籤：機器學習機器學習python 風速預測 The CSV file includes a hourly/daily summary for Szeged, Hungary area, between 2006 and 2016. Data available in the hourly response: time summary precipT

python中的常用時間轉化

技術標籤：python工具使用python大資料字串時間格式轉化 1、DataFrame中的字串轉化為時間戳

Excel & Python | 炒菜計時器——時間序列 | 07

目錄獲取當前時刻的時間返回當前時刻的日期和時間分別返回當前時刻的年、月、日返回當前時刻的週數指定日期和時間的格式字串和時間格式相互轉換時間索引時間運算兩個時間之差時間偏移小結

用LSTM進行時間序列預測

LSTM(long short-term memory)長短期記憶網路是一種比較老的處理NLP的模型，但是其在時間序列預測方面的精度還是不錯的，我這裡以用“流量”資料為例進行時間序列預測。作者使用的是pytorch框架，在jupyter-lab環境

時間序列樹模型特徵工程彙總

時間序列特徵彙總特徵一、時間特徵特徵二、類別mean encoding特徵特徵三、統計特徵特徵四：滯後歷史特徵特徵五：序列特徵特徵六：高階特徵特徵七：外部特徵稍微總結一下，時間序列中的特徵，主要針對機器學習樹模型

時間序列預測演算法——Prophet

Prophet 是 Facebook 開源的一款時序預測的工具。 Prophet 遵循 sklearn 庫建模的應用程式介面。

時間序列預測的五種策略

時間序列預測的五種策略簡介時間序列預測就是利用過去一段時間的資料來預測未來一段時間內的資訊，包括連續型預測（數值預測，範圍估計）與離散型預測（事件預測）等，具有非常高的商業價值。

LazyProphet：使用 LightGBM 進行時間序列預測

當我們考慮時間序列的增強樹時，通常會想到 M5 比賽，其中前十名中有很大一部分使用了 LightGBM。但是當在單變數情況下使用增強樹時，由於沒有大量的外生特徵可以利用，它的效能非常的糟糕。

在python中儲存指定大小圖片,去除空白區域

方法一:在plt.savefig()中新增bbox_inches = \'tight\'與pad_inches=0 1 import matplotlib.pyplot as plt

基於SARIMA、XGBoost和CNN-LSTM的時間序列預測對比

利用統計測試和機器學習分析和預測太陽能發電的效能測試和對比本文將討論通過使用假設測試、特徵工程、時間序列建模方法等從資料集中獲得有形價值的技術。我還將解決不同時間序列模型的資料洩漏和資料準備等問題，並

如何在Python中儲存ARIMA時間序列預測模型

每日女嬰出生資料集

ARIMA模型儲存錯誤

ARIMA模型儲存Bug解決方法

總結

相關推薦