1. 程式人生 > >時間序列的異常值處理

時間序列的異常值處理

問題描述:開盤價的日收益率出現了異常值,9000多倍,什麼原因導致?

答案:如圖所示:由於開盤價出現了異常,價格為0.01;導致以此價格為基礎計算的相關指標均異常;如果要還原真值,如果用均值與中位數均不合理,個人有兩個方案還原,方案一、前後的值取中間值,即前一個開盤價格與後一個開盤價格的均值;方案二、由於開盤價與收盤價相關性非常強,且正相關,補值的價格=當日收盤價格/昨日收盤價*昨日開盤價

 

 結論:替換異常值或缺失值在時間序列資料中,由於特徵值取值具有連續性,所以用附近的資料計算補充有更好的效果,比均值和中位數效果要好;補值的根本是要儘可能接近真實值;

 

進一步分析發現:

 

 

檢視類似開盤價格與收盤價格的異常,如圖用圖形顯示的話,直接畫出走勢圖,更直接了當,效果更好;

僅管該值是真實情況出現的,但由於樣例過少,本人仍然覺得替換掉效果較好,可使用前後值均值計算得出;