1. 程式人生 > >計量經濟學_預測

計量經濟學_預測

季節 更新 1.3 三種 就是 平滑 之前 提前 經濟

1. 計量經濟學也叫數量經濟學或者叫量化經濟學,主要的過程是數據結構分析、計量模型建立和預測。因此預測這個話題在時間序列數據中相當重要。他現在仍是一個很活躍的研究領域。很多的量化投資模型最重要應用也就是預測。

2. 這裏幾種研究以回歸為進出的預測方法。

3. 假定我們的主要興趣是預測一個時間序列過程的將來值,而不一定是要估計因果性或結構型經濟模型。

4. 首先介紹一些與模型具體形式無關的基本預測原理。

  4.1 假設我們在t 時期(當前時刻)想要預測y 變量 在t+1時期(下一個時間窗口)的結果,即yt +1

  4.2 所用時間單位可以是一年、一個季度、一個月、一個星期或一天。令I

t 代表我們在t 時期可以觀測到的所有信息。這些信息叫做信息集(information set),包含yt 和 y 的先導值,常常還包括其他變量在t 或更早時期的值。可以用無數種方法來組合這些信息去預測yt+1。有沒有哪一種方法更好呢?

  4.3 設定與預測誤差相聯系的損失(loss),答案便是肯定的。

  4.4 令一個函數ft 代表在t 期對yt+1所作的預測。稱ft提前一期預測(one-step-ahead forecast)。預測誤差(forecast error)是 et+1 = yt+1 - ft,常見的誤差還可以用(et +1)2 來表示。

  4.5 誤差平方這種做法,對稱地處理正負誤差,越大的誤差得到的權重也越大

。還有一種叫|et+1| 的絕對值表示。這些都叫預測誤差的損失函數(loss function)。

5. 在t 時期,並不知道et+1的值是多少,因為yt+1是一個隨機變量,所以et+1也是個隨機變量

6. 所以在給定It 的所有信息集時,自然而然的我們選擇使預測誤差平方的期望最小的值:因此這個損失函數可以表示成下面這種概率表達式:

  E((et+1)2 | It) = E[(yt+1 - ft)2 | It] (解釋為:給定信息集右側實際值和預測值的平方的期望,等於給定預測值下一時刻的誤差平方的期望,也就是說使得這個條件均值最小化,越趨近於0,越好)。

7. 第一種簡單預測:指數平滑法

(exponenial smoothing),預測值通過下面的等式求出:ft = αyt + (1-α)ft-1,yt+1時期的預測值 是yt 和 在t-1時期對y預測值的加權平均。

8. 第二種簡單預測:條件預測(conditional forecast),已知一個模型的表達式:yt = β0 + β1zt + μt,那麽,E(yt+1 | It) = β0 + β1zt+1,不行的是我們很少知道zt+1 時刻的其他信息。除非包含時間趨勢和季節虛擬變量。

9. 第三種簡單預測:無條件預測(unconditional forescast),這個名詞多少有些用詞不當,因為我們的預測仍然是以It中的信息為條件。但是這一名詞在預測文獻中已經根深蒂固了(無非在用於與測試,被我們賦予一個特定的含義罷了)。

10. 就預測而言,除非由於某些原因使我們不得不用8中的模型,否則最好的設定的模型取決於y和z 的滯後值。這版省卻了一些步驟,不必在預測y之前還要預測右邊的變量。很容易就想到的一個模型是yt = δ0 + α1yt-1 + γ1zt-1 + μt。其中根據公式定義E(μt | It-1) = 0。若已知這些參數(估計出來)那麽在t 時期對yt+1的預測值就是這個公式:δ0 + α1yt + γ1zt

11. 提前一期預測函數可以寫成:hat_? = hat_δ0 + hat_α1yn + hat_γ1zn

12. 舉一個時間序列的預測示例(來自伍德裏奇的計量經濟學)

  12.1 第一個模型,簡單的AR(1)模型:

  hat_unemt = 1.572 + 0.732 unemt-1

         (0.577) (0.097)

  n(樣本數) = 48, R2 = 0.544, hat_σ = 1.049

  12.2 第二個模型,增加通過膨脹率的一年之後,模型如下:

  hat_unemt = 1.304 + 0.647 unemt-1 + 0.184 inft-1

         (0.577) (0.097) (0.041)

  n(樣本數) = 48, R2 = 0.677, hat_σ = 0.833

  12.3 所有的樣本數據都是從1948年-1996年度數據。

  12.4 預測下年,也就是1997年度數據,需要知道1996年的數據,也就是48條樣本中的最後一條以及第二個模型滯後一年(47條)的數據,分別為:5.4 和 3.0。我們分別把這兩個值帶入到兩個模型中,就能得到下一年也就是1997年度的預測值,過程如下:

  模型1:1.572 + 0.732 × 5.4 = 5.52

  模型2:1.304 + 0.647 × 5.4 + 0.184 × 3.0 = 5.35

  12.5 而美國1997年的實際值為4.9。這兩個模型都高估了數值,但是模型2相對好一些。

  12.6 然後我們把預測區間估計出來:

13. 在實際工作中,有些專業預測員可以固定模型參數,用每一期的預測所用的模型參數保持不變來預測;還有就是新一期數據獲得後,更新模型參數,再用更新後的參數預測下一期。(第二種方法需要進行更多的運算,但增加的過做了相對來說是次要的,它可能會(雖然並不一定)更好寫,因為這些回歸系數至少在一定程度上根據新數據而進行了調整)

14. 樣本內準則和樣本外準則。

  14.1 就預測而言,使用樣本外準則更好一些,因為預測本質上就是樣本外問題。一個模型也許在用於估計其闡述的樣本中對y擬合的比較好,但並不一定在與測試就有好的表現。一個樣本外準則的方法大致為:用樣本前一部分取估計模型中的參數,然後用樣本剩余下來的部分判斷它的預測能力。這就模擬了我們在不知道變量的將來值所需要的事情。

  14.2 RMSE = 均方根誤,MAE = 絕對平均誤差。

  14.3 還是以上面的為例子。去固定參數,然後累計外推7次預測值,去觀察RMSE和MAE在樣本外的表現。預測期(1997-2003:7年)。

     在模型1中:RMSE = 0.962,MAE = 0.778

     在模型2中:RMSE = 0.673,MAE = 0.628

  14.4 顯然模型2在樣本外同樣得到了比較好的結果。

  14.5 當然,還有一種方法。不去固定參數,然後每做一次預測估計一次參數。

15. 提前多期預測:過程也非常簡單,用預測出來的值,再代入方程,在預測多兩期的預測值,以此類推進行叠代即可。

計量經濟學_預測