計量經濟學_預測
1. 計量經濟學也叫數量經濟學或者叫量化經濟學,主要的過程是數據結構分析、計量模型建立和預測。因此預測這個話題在時間序列數據中相當重要。他現在仍是一個很活躍的研究領域。很多的量化投資模型最重要應用也就是預測。
2. 這裏幾種研究以回歸為進出的預測方法。
3. 假定我們的主要興趣是預測一個時間序列過程的將來值,而不一定是要估計因果性或結構型經濟模型。
4. 首先介紹一些與模型具體形式無關的基本預測原理。
4.1 假設我們在t 時期(當前時刻)想要預測y 變量 在t+1時期(下一個時間窗口)的結果,即yt +1。
4.2 所用時間單位可以是一年、一個季度、一個月、一個星期或一天。令I
4.3 設定與預測誤差相聯系的損失(loss),答案便是肯定的。
4.4 令一個函數ft 代表在t 期對yt+1所作的預測。稱ft 為提前一期預測(one-step-ahead forecast)。預測誤差(forecast error)是 et+1 = yt+1 - ft,常見的誤差還可以用(et +1)2 來表示。
4.5 誤差平方這種做法,對稱地處理正負誤差,越大的誤差得到的權重也越大
5. 在t 時期,並不知道et+1的值是多少,因為yt+1是一個隨機變量,所以et+1也是個隨機變量。
6. 所以在給定It 的所有信息集時,自然而然的我們選擇使預測誤差平方的期望最小的值:因此這個損失函數可以表示成下面這種概率表達式:
E((et+1)2 | It) = E[(yt+1 - ft)2 | It] (解釋為:給定信息集右側實際值和預測值的平方的期望,等於給定預測值下一時刻的誤差平方的期望,也就是說使得這個條件均值最小化,越趨近於0,越好)。
7. 第一種簡單預測:指數平滑法
8. 第二種簡單預測:條件預測(conditional forecast),已知一個模型的表達式:yt = β0 + β1zt + μt,那麽,E(yt+1 | It) = β0 + β1zt+1,不行的是我們很少知道zt+1 時刻的其他信息。除非包含時間趨勢和季節虛擬變量。
9. 第三種簡單預測:無條件預測(unconditional forescast),這個名詞多少有些用詞不當,因為我們的預測仍然是以It中的信息為條件。但是這一名詞在預測文獻中已經根深蒂固了(無非在用於與測試,被我們賦予一個特定的含義罷了)。
10. 就預測而言,除非由於某些原因使我們不得不用8中的模型,否則最好的設定的模型取決於y和z 的滯後值。這版省卻了一些步驟,不必在預測y之前還要預測右邊的變量。很容易就想到的一個模型是yt = δ0 + α1yt-1 + γ1zt-1 + μt。其中根據公式定義E(μt | It-1) = 0。若已知這些參數(估計出來)那麽在t 時期對yt+1的預測值就是這個公式:δ0 + α1yt + γ1zt。
11. 提前一期預測函數可以寫成:hat_? = hat_δ0 + hat_α1yn + hat_γ1zn。
12. 舉一個時間序列的預測示例(來自伍德裏奇的計量經濟學)
12.1 第一個模型,簡單的AR(1)模型:
hat_unemt = 1.572 + 0.732 unemt-1
(0.577) (0.097)
n(樣本數) = 48, R2 = 0.544, hat_σ = 1.049
12.2 第二個模型,增加通過膨脹率的一年之後,模型如下:
hat_unemt = 1.304 + 0.647 unemt-1 + 0.184 inft-1
(0.577) (0.097) (0.041)
n(樣本數) = 48, R2 = 0.677, hat_σ = 0.833
12.3 所有的樣本數據都是從1948年-1996年度數據。
12.4 預測下年,也就是1997年度數據,需要知道1996年的數據,也就是48條樣本中的最後一條以及第二個模型滯後一年(47條)的數據,分別為:5.4 和 3.0。我們分別把這兩個值帶入到兩個模型中,就能得到下一年也就是1997年度的預測值,過程如下:
模型1:1.572 + 0.732 × 5.4 = 5.52
模型2:1.304 + 0.647 × 5.4 + 0.184 × 3.0 = 5.35
12.5 而美國1997年的實際值為4.9。這兩個模型都高估了數值,但是模型2相對好一些。
12.6 然後我們把預測區間估計出來:
13. 在實際工作中,有些專業預測員可以固定模型參數,用每一期的預測所用的模型參數保持不變來預測;還有就是新一期數據獲得後,更新模型參數,再用更新後的參數預測下一期。(第二種方法需要進行更多的運算,但增加的過做了相對來說是次要的,它可能會(雖然並不一定)更好寫,因為這些回歸系數至少在一定程度上根據新數據而進行了調整)
14. 樣本內準則和樣本外準則。
14.1 就預測而言,使用樣本外準則更好一些,因為預測本質上就是樣本外問題。一個模型也許在用於估計其闡述的樣本中對y擬合的比較好,但並不一定在與測試就有好的表現。一個樣本外準則的方法大致為:用樣本前一部分取估計模型中的參數,然後用樣本剩余下來的部分判斷它的預測能力。這就模擬了我們在不知道變量的將來值所需要的事情。
14.2 RMSE = 均方根誤,MAE = 絕對平均誤差。
14.3 還是以上面的為例子。去固定參數,然後累計外推7次預測值,去觀察RMSE和MAE在樣本外的表現。預測期(1997-2003:7年)。
在模型1中:RMSE = 0.962,MAE = 0.778
在模型2中:RMSE = 0.673,MAE = 0.628
14.4 顯然模型2在樣本外同樣得到了比較好的結果。
14.5 當然,還有一種方法。不去固定參數,然後每做一次預測估計一次參數。
15. 提前多期預測:過程也非常簡單,用預測出來的值,再代入方程,在預測多兩期的預測值,以此類推進行叠代即可。
計量經濟學_預測