1. 程式人生 > >基於時間加權svm的指數優化復制策略

基於時間加權svm的指數優化復制策略

經驗 深度 支持向量 wid 產生 如果 控制 一段 向量

1 引言

指數追蹤,利用某些金融資產組合去追蹤某一股票指數,指數型基金核心技術。 目前主要有兩種指數復制方法 基於兩種假設 一:歷史能夠重演,在過去一段時間能構造歷史追蹤誤差最小的,未來也將是最優,現在大多數指數復制類型為此類。二:從統計角度,找到與目標指數具有最大相關 具有協整關系的股票組合,保證未來表現與未來盡可能一致。

從股票數量復制角度,分為兩種,完全復制和不完全復制,完全復制按照指數構造方式購買成分證券,但市場時序上變化迅速,造成成本高,逐漸不被使用。不完全復制根據優化方法尋找成分證券及其投資權重。

2模型

先引入模型變量

技術分享圖片

模型的構建:

技術分享圖片

至此,我們就可以得到了如下的一個回歸問題

技術分享圖片

w(it)表示第i支股票t時刻的權重,如果將其處理為與時間有關的,則此線性回歸問題將變得非常復雜,難以處理,為對此優化,我們采用固定比率策略,即w(it)=w(i)。這樣有兩個好處,一,從策略角度,為一個追漲殺跌策略,保證組合的流動性。二,模型簡化為一個二次規劃問題,能夠很容易的求解。

至此,將指數追蹤轉為了一個多元線性回歸問題。

傳統線性回歸方法為最小二乘回歸,將損失函數選擇為均方誤差:

技術分享圖片 (*)

(*)式表示了學習過程的經驗風險,傳統理論認為,經驗風險最小,即模型未來預測能力越強,但現在考慮過擬合情況,使用傳統機器學習中的svm,其具有較好泛化能力,采用結構風險最小策略,即參數量越少越好,同時參數越接近0越好,重新定義我們的損失函數:

技術分享圖片

其中ε為松弛變量,是一個接近於0但大於0的數,它的大小控制了svm中支持向量的個數,為一個超參數,需要人手工設計。

現在我們的目標函數即為:

技術分享圖片

最小化第一項,代表最小化結構風險,同時能代表svm中的間隔最大化,即有最好的預測能力;最小化第二項表示最小化經驗損失,其中 λ為不同時期的經驗損失的權重,金融中,越接近現在的,認為其含有較多未來信息,需要對現在的經驗損失提高權重,為此我們采用基於指數加權方式來計算 λ

技術分享圖片

其中α同樣為一個超參數,需要人為設計,再次,我們設定為1。

至此我們的目標函數已經建立起來,接下來,就是對約束條件的討論:

自然有的兩個邊界為資本預算以及投資比例:

技術分享圖片 技術分享圖片

從管理方面需要考慮股票的數目,數目越大,管理成本和難度越大,同樣選取一個超參數k,其代表投資組合內最大股票種類

技術分享圖片

同時限制 z 為0 1變量,為0即不進入組合,為1即進入組合。

以上討論了約束條件和目標函數,最終我們得到了我們的指數復制模型:

技術分享圖片

3 實驗驗證

技術分享圖片

技術分享圖片

從魯棒性和樣本外追蹤效果來看,優於Ruiz-Torrubiano模型

4 思考與探索

一,借助於svm中松弛變量以及支持向量的思想,進一步提高了模型泛化性能;

二,時間加權,更加準確

想法:

1 svm中更為強大的是核技巧,怎麽將核函數應用於其中,去更好的提高泛化能力

2 模型中有幾個需要人為去指定和設計的超參數,依賴於人的經驗,如何去智能調參,可能參考現在深度學習的重要方向 元學習 對其的經驗損失中的超參數 怎麽類比到深度學習中的正則化項

3指數復制中一個重要問題為基金按模型執行策略時,自身參加到了市場中,自己也對市場產生了影響,如同得到了解析解,但實際計算數值解時,發現其數據有噪聲,導致數值解不穩定,最終成為了一個不適當問題,如何將這種行為考慮進入模型中,可以參考一下我之前講解的GNN的思想,通過尋找穩定解去解決一部分問題

4不同時期,市場有著不同風格,可以認為數據不是同種分布,而機器學習模型都假設數據有著同一分布,可以將市場分割為不同周期,每個周期有著不同的參數,以往數據更多是去驗證模型的優越性,而模型參數更多依賴於近期數據。

以上就是我對徐鳳敏教授《基於時間加權svm指數復制模型和實證分析》的淺解,期望做她的研究生,做更深一步的研究!!

基於時間加權svm的指數優化復制策略