（一）時間序列模型基礎

阿新 • • 發佈：2020-10-20

1.1 對傳統時序中的方法進行深入理解
    ①、通過畫出隨時間變化的銷量，來看資料是否有趨勢、季節、週期等特性
    ②、再對其進行分解（加法、乘法都需要試一下）。
    ③、對其進行平穩性分析，主要有觀察法（均值、方差是否隨時間變化而變化）和單位根檢驗法（P值是否小於5%，小於5%才能認為是平
        穩，不然需要對其進行差分），比如1階差分能去掉趨勢，12階差分能去掉季節性等，最後在對差分後的資料進行單位根檢驗。
    ④、資料平穩後，開始確定AR過程和MA過程的階數。AR和MA過程階數的判斷，都可以從1階開始模擬，逐漸增加階數。通過對階數模擬後
        的自相關圖和偏自相關圖進行分析，如果發現自相關在模擬的階數開始拖尾、偏自相關開始截尾，說明該階數合適。但如果1階這樣，
        2階也這樣，那就說明情況比較複雜，仍不能確定。
    ⑤、如果實在通過自相關和偏自相關圖找不出合適的階數，那麼可以通過計算AIC值來確定（多找幾個階數進行對比AIC，找出最大的。比
        如通過觀察可以認為階數在5階之內，那就可以計算每個階數的AIC值，選出最大的）。
    ⑥、確定p和q的階數後就可以建立arma模型。或者也可以用Facebook的properhat來做。


    擴充套件閱讀：自相關和偏自相關圖解讀：https://www.biaodianfu.com/acf-pacf.html，
     AR（p）模型：自相關係數拖尾，偏自相關係數p階截尾。
     MA（q）模型：自相關係數q階截尾，偏自相關係數拖尾。
     ＡＲＭＡ（ｐ，ｑ）模型：自相關係數拖尾，偏自相關係數拖尾

     你給的圖自相關圖一階截尾，偏自相關圖顯示出顯著的不截尾性，可以考慮用MA（１）模型擬合二階差分後的序列。
     因為前面已經進行二階差分運算，實際上就是用ARIMA（p,2,q）模型擬合原序列。


1.2 找更多的時序預測例子
    例子1（傳統的時序分析過程）：https://www.kaggle.com/jagangupta/time-series-basics-exploring-traditional-ts
    例子2：(簡單的LSTM方法)：https://www.kaggle.com/karanjakhar/simple-and-easy-aprroach-using-lstm
          ①、首先，需要把資料轉變成 [樣本數，特徵數，1]這樣的格式，比如每一行是一條樣本，每一列是一個時間點。
          ②、比如時序的長度有100，訓練集可以選擇0~99作為訓練集，它的標籤是100對應的值，測試集就選擇1-100，因為我們要預測第101個值。
          ③、當然，模型從原始時間序列上隨機抽取固定長度的樣本進行訓練。例如，如果原始時間序列的長度為 600 天，那麼把訓練樣本的長
              度設為200天，就可以有400種不同的起始點。--效果，好了一點。排名在45%。

    例子3：(MLP、LSTM、CNN、CNN+LSTM各種方法介紹)：https://www.kaggle.com/dimitreoliveira/deep-learning-for-time-series-forecasting
          假設原資料格式為:X=[樣本數,時間步長],Y=[樣本數，1],每一行就是一條樣本，每一列就是一個時間（比如dt）.
          ①、MLP:輸入格式為 [樣本數,時間步長],直接接dense層，輸出層在接dense降維到1。例如[2000,60]
          ②、LSTM：輸入格式為 [樣本數,時間步長,特徵]，一般特徵為1，也就是單變數時序輸入。例如[2000,60,1]
          ③、CNN:輸入格式為 [樣本，時間步長，特徵]，過完pooling層後，需要過一個flatten層展平，把資料展成一維，再過dense降維。例如[2000,60,1]
          ④、CNN+LSTM:輸入格式為 [樣本，子序列，時間步長，特徵]，比如原先時間步長為60，如果設定子序列為3，則變形後的時間步長為60/3=20,特徵仍為1  ,例如[2000,3,20,1]，
          CNN+LSTM多了一個子序列，通過TimeDistributed實現，目的是“我們將進一步將每個樣本劃分為更多子序列。CNN模型將解釋每個子序列，而LSTM將彙總來自這些子序列的解釋”

    其他：
          keras中TimeDistributed和RepeatVector的解釋：https://blog.csdn.net/ChaoFeiLi/article/details/89323078，基本上相當於np的reshape，但是是在model中改變輸入輸出的形狀。
          LSTM層中return_sequence和return_statue的解釋：https://blog.csdn.net/Ahead_J/article/details/84671396


   
    例子4：（使用LSTM自動編碼器方法）：https://www.kaggle.com/dimitreoliveira/time-series-forecasting-with-lstm-autoencoders/data
          ①、首先，先構造encode模型，模型的輸入[樣本，時間步長，特徵],我們假定把原時間步長壓縮成一個單值，因此我們的輸出加了一個dense(1)
          ②、encode模型的輸入資料和標籤，都是它自己encoder_decoder.fit(X_train,X_train,batch_size=batch,epochs=epochs)
          ③、通過keras中的Model，可以取出訓練好的模型中的某幾層，比如rpt_vector_layer = Model(inputs=encoder_decoder.inputs, outputs=encoder_decoder.layers[3].output)，
              然後通過rpt_vector_layer.predict(X_train[:1])進行預測輸出。
          ④、最後，我們通過構建編碼器encoder = Model(inputs=encoder_decoder.inputs, outputs=encoder_decoder.layers[2].output)，來進行輸出train_encoded = encoder.predict(X_train)
          ⑤、一般會把把自編碼出來的值，加到原資料中作為一列新的特徵，再訓練模型。

（一）時間序列模型基礎

1.1 對傳統時序中的方法進行深入理解①、通過畫出隨時間變化的銷量，來看資料是否有趨勢、季節、週期等特性②、再對其進行分解（加法、乘法都需要試一下）。③、對其進行平穩性分析，主要有觀察法（均值、方差是否隨

數學建模學習筆記（二十一）時間序列小白指南（下）

技術標籤：數學建模學習筆記上兩篇整理了ARIMA的建模和程式設計，此篇再加以拓展，考慮季節性

排序演算法（一）時間複雜度為O(n²)的排序演算法

排序演算法（一）排序演算法時間複雜度是否基於比較冒泡、插入、選擇 O(n²)

JavaSE學習筆記（一）——Java簡介與基礎

一、Java語言簡介1.1計算機語言的發展過程計算機語言發展主要分為三個階段：1．第一代：機器語言2．第二代：低階語言3．第三代：高階語言1.2Java發展簡史 1．Java 是一種程式開發語言，既然是一門語言，

聊聊執行緒（一）執行緒的基礎

技術標籤：執行緒多執行緒java 執行緒基礎程序和執行緒程序：正在執行的程式，需要記憶體和CPU資源進行運算執行，一個程式包含一個或多個程序執行緒：是程序的組成單元，一個程序包含一個或多個執行緒，每個執

JVM重新認識（一）oop-kclass模型--HSDB使用驗證

一：oop-kclass模型思考：我們平時寫的java類編譯成.class檔案，JVM載入.class檔案，那麼載入.class檔案之後在JVM中就是oop-kclass（C++）模型形式存在的。

leetcode （一）時間複雜度和空間複雜度

技術標籤：Java 前言準備刷leetcode時必須瞭解如何計算複雜度（時間複雜度空間複雜度）

<轉載>SQL 基礎知識梳理（一）- 資料庫與 SQL SQL 基礎知識梳理（一） - 資料庫與 SQLSQL 基礎知識梳理（二） - 查詢基礎SQL 基礎知識梳理（四） - 資料更新

【博主】反骨仔　　　　【原文地址】http://www.cnblogs.com/liqingwen/p/5902856.html

Java安全之反序列化（一）--基礎篇

Java序列化基礎：　　java是純面嚮物件語言，在java的世界裡所有東西都是物件。有些情況下，我們需要儲存某一刻某個物件的資訊來進行一些操作。因此才需要序列化機制，序列化機制將物件狀態以二進位制形式儲存於檔

機器學習Sklearn系列：（一）基礎線性模型

本文介紹了一些基礎的線性模型。線性迴歸線性迴歸是最簡單的線性模型，公式如下：

Java基礎（一）：I/O多路複用模型及Linux中的應用

IO多路複用模型廣泛的應用於各種高併發的中介軟體中，那麼區別於其他模式他的優勢是什麼、其核心設計思想又是什麼、其在Linux中是如何實現的？

帶你入坑大資料（一） --- HDFS基礎概念篇

前言從零開始的高併發系列我們已經把 zookeeper 給更新完了，順帶一提之前的zookeeper並沒有結合大資料來進行說明。重新開個坑一方面是一直都想找個理由來總結一下大資料方面的東西，另一方面則是抓住時代的走向吧，

Alamofire（一）-- 網路基礎TCP/IP協議簡述

最近在學習Alamofire框架的相關知識，這是一個Swift版本的很強大的網路請求庫，再深入學習之前，我們先來學習瞭解一下跟網路協議相關的一些知識。以下的概念內容和背景來自百度百科TCP/IP協議

Java 多執行緒基礎（一）

簡介在接觸多執行緒之前，在我們程式中在任意時刻都只能執行一個步驟，稱之為單執行緒。在單執行緒開發的程式中所有的程式路徑都是順序執行的，前面的必須先執行，後面的才會執行。單執行緒的優點也很明顯，相對於多

Java SE基礎鞏固（八）：序列化

在資料處理中，將資料結構或者物件轉換成其他可用的格式，並做持久化儲存或者將其傳送到網路流中，這種行為就是序列化，反序列化則是與之相反。

深入理解java併發程式設計基礎篇（一）-------併發程式設計相關概念

一、前言拖了很久的併發程式設計，今天會開始第一篇，主要分為倆大部分進行學習：分為基礎篇以及進階篇，下面就開始基礎篇的學習。

Java 基礎（一） -- 面向物件

面向過程和麵向物件的區別什麼是面向過程（pop）面向過程（Process-oriented programming）是一種以事件為中心的程式設計思想。就是分析出解決問題所需要的步驟，然後用函式把這些步驟全部實現，然後按照順序依次呼

Java SE基礎鞏固（一）：基本型別的包裝類原始碼解讀

Java中變數型別可分為兩類：基本型別和引用型別。基本型別有8種，分別是short，int，long，byte，char，float，double，boolean，同時也有8種引用型別作為其包裝類，例如Integer，Double等。本文要討論的就是這些基本

MySQL複習（一）：MySQL基礎架構、InnoDB體系結構、MySQL日誌

一、MySQL基礎架構 MySQL可以分為Server層和儲存引擎層兩部分 Server層包括聯結器、查詢快取、分析器、優化器、執行器等，涵蓋MySQL的大多數核心服務功能，以及所有的內建函式（如日期、時間、數學和加密函式等

九、Mysql資料庫--基礎入門（一）

一、資料庫入門 1.1 引入資料儲存到記憶體：優點： 1）讀寫非常快缺點： 1）程式關閉導致資料丟失

（一）時間序列模型基礎

相關推薦