1. 程式人生 > >如何防止量化策略的陷阱

如何防止量化策略的陷阱

新古典經濟學派增長理論告訴我們,全要素生產率的增加能提高勞動和資本的效率,改變經濟發展模式。各行各業都享受到了科技進步的紅利,這在我們已經有點過度繁榮的金融業,當然也是顯而易見的:投資標的、工具越來越多樣化,交易軟體、交易方式越來越便捷,這些都拉近了人們與金融市場的距離。在科技與金融互撞出火花的Fintech熱潮中,“智慧資管”、“大資料金融”、“機器學習”等詞彙可謂擡頭不見低頭見。十年前,你去問基金經理什麼是“量化投資”、“演算法交易”,十有八九不能說清;但在今天的投資領域,你不搞個量化FOF,似乎都不好意思做金融了。

  然而,並不是所有宣稱“量化”的都是值得信任的。國內量化投資快速發展也為偽科學的滋生提供了土壤。普通投資者往往被那些聽上去高大上的新名詞所迷惑。今天,我們就來看看量化投資界那些隱藏在高深詞彙背後可能存在的不科學之處。

  基於基金淨值的風格評價

  在FOF盛行的時代,基金業績歸因尤為重要。一個基金的收益如何分解?有多少收益是風格貢獻的?又有多少來自於基金經理自身投資技巧?基金風格是成長型還是價值型?這些都是投資者關注的問題。

  對基金的風格進行評價的方法有兩種:基於收益(Return-Based)和基於持倉(Holding-Based)。如果採用基於持倉的方法,那麼在任何時點,風格都容易被直接觀察到。但基於收益的方法就需要我們將一系列風格指數作為自變數,將基金收益作為因變數,做時間序列的多元線性迴歸。

  有些機構推出的基金風格評價體系正是基於收益的(利用基金淨值)。但是,這個方法的要求是很嚴格的。

首先,風格因子指數必須互斥:最簡單的例子就是將風格指數分為大盤股指數和小盤股指數。其次,風格因子指數是完備的,像“大盤成長”、“小盤價值”這樣的分法就是不完備的。第三,風格因子指數必須分別代表獨立的風險來源,這也就意味著不能有多重共線性。第四,基金淨值資料必須準確和完整。

  如今最流行的風格因子就是Barra的風格因子:市場Beta、價值因子、紅利因子、成長因子、財務槓桿因子、流動性因子、動量因子、規模因子、波動因子。如果用這套風格因子對私募基金的業績進行歸因與評價,那麼,上述四點是值得引起注意的。

  模型的長短期錯配

  每個理論都有其適用範圍,原因是在此範圍外未獲實證支援。例如,絕對購買力平價理論在長期成立,短期就不一定成立。任何金融模型都不可能在所有市場、所有期限適用。如果生搬硬套,得出的結論就缺乏意義了。

  現在許多機構在做資產配置時,喜歡用Black-Litterman模型。這個模型對用於大類資產配置還是子類資產配置(行業、個股等)並沒有限制,也沒對長期配置和短期配置做出要求。但如果你用長時間跨度的資產收益率和短期觀點矩陣作為輸入變數,就出現了長短期錯配的問題:用長期資產收益率協方差矩陣描述短期關係,模型輸出的資產配置權重也就沒有參考性了。(果仁網上小市值策略的長短期限結構,親,你考慮過嗎?)

 基金策略指數氾濫

  近幾年,隨著投資標的的增加,私募基金產品的策略類別越來越豐富:多頭、對衝、套利……針對這些策略型別,有些機構根據自身蒐集到的私募基金淨值資訊,編制出了多種策略指數。

  然而,這些策略指數的編制過程可能極為粗糙,導致指數本身無法“勝任”業績基準的內在要求。首先,生存者偏差(Survivorship Bias)嚴重。正所謂“死人不會說話”,只有存續中的基金才會被納入指數,而那些已清盤的基金則被剔除在外。指數中的基金都是“倖存者”,這就使得策略指數的業績總好於實際情況。其次,私募基金淨值公佈的隨意性導致淨值資料本身可能存在不準確、不完整的問題。尤其當私募淨值公佈頻率太低的時候,策略指數的波動率會比真實情況低。第四,編制策略指數所選用的私募基金產品樣本未必具有好的代表性。第五,對策略的分類沒有做到完備和互斥(果仁的做自定義指數的,考慮一下這個)

  將純資產配置模型用於基金配置

  所謂純資產,就是股票、債券、大宗商品、房地產等具有單種屬性的資產。無論是經典的馬可維茨均值-方差模型(MVO)還是時下最為流行的風險平價模型(Risk Parity Model),都是針對純資產進行配置的模型。

  而目前湧現出一批“FOF配置工具”,將這些模型用於確定FOF組合中各基金的權重,甚至用在策略配置上(以基金策略指數為標的),這樣的結果往往看似實現最優配置,卻暗藏風險。因為無論是基金還是基金策略指數,都不是純資產,而是由多種純資產組合而成的混合資產。即使股票型基金,也可能有一部分債券持倉;更別提將股票型基金和債券型基金放在一起,試圖通過MVO和RP得到最優配置組合了。

舉個簡單的例子:假定根據風險平價模型確定了5只基金的權重,使這5只基金的風險貢獻比例相等。

這5只基金都是混合型基金,持倉資產包括股票和債券。我們將5只基金拆分後按照純資產(權益類、固收類)重新組合,發現風險並不平價:

    由上表可知,權益類的風險貢獻比例為93.2%,固收類的風險貢獻比例為6.8%,反而與我們運用風險平價模型配置資產的初衷相違背——結果是某一類資產的風險集中度過高。

(這一點對果仁網上使用複合因子的策略需要小心,複合因子的共線性非常難去除,可以關注長江金工的純因子構造系列,美女的研報哦)

被操縱的量化策略回測業績

 誰不希望自己的策略有漂亮的業績?但是,有些人偏偏不誠實,愛自作聰明。

         就如同過早地記錄收入和將營運成本資本化等財務騙術一樣,策略回測業績也是可以被操縱的。為了使一個策略的回測表現令人滿意,研究員往往會不斷調優樣本內參數,直至樣本外資料回測結果達到心中的標準。這就是資料探勘偏差(Data-mining Bias)。一個策略總能被“優化”得近乎完美,這就出現了過度擬合現象(Overfitting)。

  如果研究員不在引數上做文章,而是特意選擇一段策略業績表現好的時間段,剔除業績相對較差的時間段,則是利用特定時間段偏差(Time-period Bias)來“美化”自己的策略。

類似的小tricks還有很多,但你如果不想在實盤的時候見光死,最好還是擺正心態,腳踏實地做研究。

(關於這一點,親們,如果你沒有在策略上過度擬合優化,來,我給你一個擁抱,男的讓開。。。。)

 無視情景的模型

  我們在利用模型進行預測的時候,應當考慮每個引數的背景——尤其是和經濟週期密切相關的變數。

  以CAPM為例:假設經濟擴張階段大盤的年化收益率是20%,經濟衰退階段大盤的年化收益率是5%。無風險利率為3%。假定我們已計算出某資產在經濟擴張階段的Beta是0.7,在經濟衰退階段的Beta是1.5,則可算出正確定價的資產收益率在經濟擴張階段為3%+0.7(20%-3%)=14.9%,在經濟衰退階段為3%+1.5(5%-3%)=6%。

  假設我們估計下一階段經濟擴張和經濟衰退的概率各為0.5,則該資產在下一階段的收益率為14.9%×0.5+6%×0.5=10.45%。

  如果無視經濟週期,我們很可能用的是一個根據經濟擴張和蕭條兩個階段的資料迴歸得到Beta,即0.7×0.5+1.5×0.5=1.1,進一步運用CAPM得到下一階段資產收益率為3%+1.1(20%×0.5+5%×0.5-3%)=13.45%,比10.45%的預期高出了3%。

  由於未將系統性風險隨經濟週期發生變化的因素考慮到模型的輸入變數中,我們得到預測結果是不準確的。

  在量化投資風生水起的大環境下,廣大果仁同學們要時刻保持清晰的思路和清醒的頭腦,學會甄別量化投資中的偽科學。要知道,量化不等於科學,有的“量化外衣”下只不過是用一些數學和統計工具粉飾的濫竽充數者。請記住,量化是我們的研究手段,而非目的,我們追求的是科學的投資方式。一種投資策略,只要遵循科學的研究方法,不論運用定性分析還是定量分析,都是科學投資。