1. 程式人生 > >外推預測法(R語言預測實戰-節選)

外推預測法(R語言預測實戰-節選)

外推預測法是根據過去和現在的發展趨勢推斷未來的一類方法的總稱。因為外推預測法基於過去的行為資料,所以它是保守的。通常可以使用時間序列資料或橫截面資料進行外推預測。對於橫截面資料進行外推的情況,比如可以使用一些州槍支法律改變的行為反應來預測其它州的反應。當外推的結果與真實的結果不一致時,外推就不再保守了。此時,可以考慮加入判斷,合併到外推的結果中。那麼有哪些方法可以合併一些知識到外推的結果中呢?

(1)使用最長時間序列

如何為構建一個時間序列預測模型選擇一個特定的起點或者選擇橫截面資料的一個特定子集,將會對預測的結果產生很大影響。通過使用最長可獲取的時間序列或所有可獲得的橫截面資料,可以減少產生預測偏差的風險。

(2)分解因果關係

通常可能會影響時間序列的因果關係包括增長、衰減、支援、反對、迴歸和未知。增長就是指在不考慮歷史趨勢的情況下,因果關係會導到時間序列的增加。當預測的時間序列是由對立的因果因素(比如增長和衰減)生成的時候,可以將時間序列分解成為受這些因素影響的各個部分,然後分別對每部分進行外推。

(3)調整趨勢

通常可以使用有關趨勢的累積知識謹慎地進行外推預測。多數情況下,較為保守的做法是減少趨勢的大小,這也就是常說的衰減。衰減通常會使預測更接近當前情況的估計。如果衰減的結果偏離了具有持久因果關係的長期趨勢,衰減也就不再保守了。那麼應該如何識別在哪些情況下調整趨勢是保守的呢?

1、時間序列多變或不穩定

可變性和穩定性可以通過統計指標或判斷或兩者一起來評估。到目前為止大多數的研究都使用統計指標。資料顯示,對多變的歷史資料的趨勢進行衰減會在一定程度上降低誤差。

2、歷史趨勢與因果關係衝突

如果作用在一個時間序列上的因果關係與時間序列觀察到的趨勢相沖突,那麼這裡存在的因果關係將嚴重地減弱這種趨勢向無變化預測的方向發展。為了識別這種因果關係,我們可以邀請一個專家組(三人以上)來做評估,並採納大多數人的判斷。專家們通常需要一分鐘左右的時間來評估給定時間序列(或一組相關的序列)的因果關係。因果關係可能足夠強勁,以致可以扭轉長期趨勢。

3、預測時間跨度比歷史時間序列更長

預測的時間跨度越長,不確定性也就越強。如果在這種情況下做預測不可避免,那麼考慮將趨勢衰減至0作為預測時間跨度的增加或者從相似的時間序列中取趨勢的平均值作為預測值。

4、短期趨勢和長期趨勢方向不一致

如果短期趨勢和長期趨勢方向不一致,那麼短期的趨勢應該在預測時間跨度延長時朝著長期趨勢的方向進行衰減。如果因果關係沒有發生重大變化,長期趨勢將比短期趨勢代表更多的時間序列行為的知識。

(4)調整季節因素

當預測情形不確定時,調整季節因素可能會降低準確率。另外,資料太少,對每年季節因素的估計差別太大,並且對引起季節性的原因一無所知,這些都會導致不確定性。比較保守的應對方法是減弱季節因素的影響到1.0,這是迄今為止最成功的一種方法。同時,可以考慮那些與目標時間序列類似的時間序列對應季節因素的估計值來改進對季節因素進行衰減的方法。下面為季節因素的調整方法分三種情況,具體如下:

1、跨年估計變化明顯

如果季節因素的大小每年都大幅度地變化,那麼這正表明了季節因素的不確定性。這些改變可能是由於重大節假日的日期改變引起的,也可能是罷工、自然災害、不規則的市場行為比如廣告或降價等等原因引起的。應對這種情況,通常減弱季節因素的估計值或使用每季節因素的平均值。

2、只有少數幾年的資料是可用的

除非有充足年份的歷史資料,可以這些資料出發進行有效估計之外,一般會大力地減弱季節因素或者避免使用它們。有資料顯示,當使用不到三年的資料進行估計時,季節因素會降低準確率。

3、因果知識薄弱

如果沒有充足的證據說明時間序列的季節性,那麼季節因素的存在可能會增加預測誤差。也就是說,由於因果知識薄弱,減少了季節性累計知識的因素。如果沒有為季節性建立起因果關係基礎,就不要使用季節性因素。

(5)選擇合適的外推方法和資料進行組合預測

相似的時間序列能夠為外推模型提供有用的資訊。該資訊和水平相關,或與橫截面資料的基準率相關,或和趨勢相關。比如,某人想要預測現代Genesis汽車的銷量,除了依靠Genesis的銷量趨勢資料以外,還可以使用所有豪華汽車的資料預測趨勢,通常將兩種預測結合起來進行組合預測。