使用 TensorFlow Probability 對金融模型中的誤差進行介紹性分析
文 / Deepak Kanungo,Hedged Capital LLC 創始人兼執行長
來源 | TensorFlow 公眾號
作為採用 “AI 先行” 戰略的金融交易和諮詢公司,Hedged Capital 使用概率模型在金融市場中進行交易。我們將在本文中探討所有金融模型中固有的三類誤差,並會以 Tensorflow Probability (TFP) 中的簡單模型作為例子來進行說明。 注:Tensorflow Probability 連結 https://www.tensorflow.org/probability/
金融學並非物理學
亞當·斯密是公認的現代經濟學之父,他對牛頓的力學和萬有引力定律心存敬畏 [1]。自那時起,經濟學家們一直致力於將經濟學變成類似物理學的學科。他們渴望建立理論,在微觀和巨集觀層面準確解釋及預測人類的經濟活動。在 20 世紀初期,歐文·費雪等經濟學家的成就使這種渴望愈發強烈,並在 20 世紀後期的經濟物理學運動中達到頂峰。
儘管現代金融學包含各種複雜的數學運算,但其理論嚴重不足,與物理學相比時,這一點尤為明顯。例如,物理學能夠以驚人的精確度預測月球和計算機中電子的運動。而任何物理學家均可隨時在世界上的任何地方計算出這些預測結果。相比之下,市場參與者難以解釋每日市場走勢的原因,也無法在世界上任何地方隨時預測股票價格。
這或許是因為金融學比物理學更難。與原子和鐘擺不同,人類是富有情感的複雜生物,並擁有自由意志和潛在的認知偏差。他們的行為往往不一致,並會不斷對他人的行為作出反應。此外,市場參與者通過利用或操縱規管他們的體系來獲利。
牛頓在投資南海公司損失不菲後,感慨道:“我可以計算出天體執行的軌跡,卻無法計算人類的瘋狂。” 請注意,牛頓頗具投資眼光。他在英國鑄幣局任職近 31 年,幫助英鎊在金本位制上持續了兩個多世紀。
所有金融模型都是錯誤的?
我們使用模型來簡化現實世界的複雜性,從而使我們能夠關注自己感興趣的現象有何特點。顯然,地圖無法捕捉到其用於建模的地形的豐富性。統計學家 George Box 有一句著名的妙語:“所有模型都是錯誤的,但有些是有用的。”
這一觀點特別適用於金融學。有一些學者甚至認為,金融模型不僅是錯誤的,而且極其危險;物理科學的表象使經濟模型的擁護者對其預測能力的準確性產生錯誤的肯定。而這種盲目信仰給其擁護者和整個社會帶來了許多災難性的後果 [1]、[2]。作為史上最成功的對衝基金公司,Renaissance Technologies 已將其對金融理論的批判觀點付諸實踐。他們偏向於聘請物理學家、數學家、統計學家和電腦科學家,而不是擁有金融或華爾街背景的人士。他們使用基於非金融理論(如資訊理論、資料科學和機器學習)的定量模型來進行市場交易。
無論金融模型是基於學術理論還是經驗性的資料探勘策略,都會受到下文所述的三種建模誤差的影響。 因此,所有模型都需要量化其預測中固有的不確定性。 分析和預測中的誤差可能來自以下任何建模問題 [1]、[2]、[3]、[4]:使用不恰當的函式形式、輸入不準確的引數或無法適應市場的結構性變化。
三種建模誤差
1. 模型規格中的誤差:
幾乎所有金融理論都在其模型中使用正態分佈。例如,正態分佈是 Markowitz 現代投資組合理論和 Black-Scholes-Merton 期權定價理論的構建基礎 [1]、[2]、[3]。然而,有充分的事實表明,股票、債券、貨幣和大宗商品均存在肥尾分佈 [1]、[2]、[3]。換句話說,極端事件發生的頻率遠遠高於正態分佈預測的頻率。
如果資產價格收益呈現正態分佈,則世界上絕不會發生以下金融災難:黑色星期一、墨西哥比索危機、亞洲貨幣危機、長期資本管理公司破產(順便提一下,這家公司由兩位獲得諾貝爾獎的經濟學家領導)或閃電崩盤。個別股票發生 “小型閃電崩盤” 的頻率甚至高於這些大型事件。
然而,由於正態分佈的簡單性和易於分析性,金融教材、課程和專業人士繼續將其用於資產估值和風險模型。鑑於如今先進的演算法和計算資源,這些原因不再合理。這種不願捨棄正態分佈的行為正是 “醉漢尋物” 的典型事例:這個原則源於一個笑話,有一個醉漢在漆黑的公園丟了鑰匙,卻瘋狂地在路燈柱下尋找,僅僅因為燈柱下有光線。
2. 模型引數估計中的誤差:
出現這類誤差的原因可能是市場參與者能夠訪問傳遞速度不同的各種級別資訊。他們的處理能力水平各有不同,認知偏差也不盡相同。這些因素導致他們對模型引數的認知存在極大的不確定性。
我們看一個有關利率的具體示例。作為所有金融資產的估值基礎,利率用於對資產的不確定未來現金流進行貼現並評估其當前的價值。例如,在消費者層面,信用卡的可變利率與稱為最優惠利率的基準掛鉤。這一利率通常與聯邦基金利率(一種對美國和全球經濟具有重要意義的利率)同步變化。
假設您想估算從現在起一年後的信用卡利率。假設當前的最優惠利率為 2%,而您的信用卡公司向您收取 10% 以上的優惠利率。鑑於當前經濟發展的強勁勢頭,您認為美聯儲很有可能提高利率而非降低利率。美聯儲將在未來 12 個月內召開 8 次會議,並會將聯邦基金利率上調 0.25% 或使其維持之前的水平。
# First we encode our assumptions.
num_times_fed_meets_per_year = 8.
possible_fed_increases = tf.range(
start=0.,
limit=num_times_fed_meets_per_year + 1)
possible_cc_interest_rates = 2. + 10. + 0.25 * possible_fed_increases
prob_fed_raises_rates = tf.constant([0.6, 0.7, 0.8, 0.9])# Now we use TFP to compute probabilities in a vectorized manner.
# Pad a dim so we broadcast fed probs against CC interest rates.
prob_fed_raises_rates = prob_fed_raises_rates[…, tf.newaxis]
prob_cc_interest_rate = tfd.Binomial(
total_count=num_times_fed_meets_per_year,
probs=prob_fed_raises_rates).prob(possible_fed_increases)
在以下圖表中,請留意您的信用卡利率在 12 個月內的概率分佈如何主要取決於您對美聯儲在 8 次會議中每次提高利率的概率估計。您可以看到,對美聯儲在每次會議上提高利率的估計值每增加 0.1%,您的信用卡在 12 個月內的預期利率將增加 0.3% 左右。
即使所有市場參與者都在他們的模型中使用二項分佈,也很容易看出他們對未來的最優利率有何分歧,因為他們對 probs 的估計各有不同。而這個引數確實很難估計。許多機構擁有專門的分析師(包括美聯儲的前僱員),他們會分析美聯儲的每個檔案、演講和活動,以試圖估計這個引數。
回想一下,我們假設模型中的引數 probs 在接下來的 8 次美聯儲會議中均保持不變的情況。這有多大的可能性?作為設定利率的主體,聯邦公開市場委員會 (FOMC) 成員不會只設定一個值。他們可能且確實會根據隨時間變化的經濟情況而改變個人偏差。假設引數 probs 在未來 12 個月內保持不變,不僅不切實際,而且存在風險。
3. 因模型無法適應結構性變化而導致的誤差:
底層資料生成的隨機過程會隨時間而變化,也就是說這並非固定的遍歷過程。我們生活在動態的資本主義經濟環境中,其特徵是各種技術創新和不斷變化的貨幣和財政政策。資產價值和風險的時變分佈是常態,而非例外。對於此類分佈,基於歷史資料的引數值必然會在預測中產生誤差。
在上述示例中,如果經濟呈現衰退跡象,美聯儲可能會在第 4 次會議上採取更為中立的立場,這會讓您將之後的 probs 引數從 70% 改為 50%。對 probs 引數作出的這項更改反過來會改變您對信用卡利率的預測。
有時,時變分佈及其引數會像墨西哥比索危機一樣不斷或突然改變。對於持續或突然的改變,所使用的模型需要適應不斷變化的市場情況。我們可能需要擁有不同引數的新函式形式來解釋和預測新體制中的資產價值和風險。
假設在上述示例中的第 5 次會議之後,美國經濟遭受外部衝擊,例如希臘的新民粹主義政府決定拖欠債務。在這種情況下,美聯儲更有可能降低利率,而非提高利率。鑑於美聯儲態度的這種結構性變化,我們必須將模型中的二項概率分佈改為擁有適當引數的三項分佈。
結論
與物理學不同,金融學不是一門精確的預測學科。二者相差甚遠。因此,我們不應將學術理論和金融模型當作量子力學來看待。
所有金融模型,無論是基於學術理論,或是資料探勘策略,都會受三種建模誤差的影響。雖然我們可以通過適當的建模工具降低這三種誤差,卻無法將其徹底消除。資訊不對稱和認知偏差始終會存在。由於資本主義、人類行為和技術創新的動態性質,資產價值和風險模型會隨著時間而變化。
金融模型需要一個框架來量化時變隨機過程預測中固有的不確定性。同樣重要的是,此框架需要根據實質上的新資料集不斷更新模型或其引數(或兩者)。由於底層環境可能變化過快,因而無法收集大量相關資料,所以此類模型必須使用小型資料集進行訓練。
在下一篇文章中,我們將討論建模框架的需求,從而對三種金融建模誤差產生的不確定性進行量化和建模。
致謝
我們衷心感謝 TensorFlow Probability 團隊,尤其是 Mike Shwe 和 Josh Dillon 對此文章的早期草稿給予的幫助。
參考文獻 [1] The Money Formula,David Orrell 及 Paul Wilmott 著,Wiley 出版,2017 年 [2] Nobels For Nonsense,J.R. Thompson、L.S. Baggett、W.C. Wojciechowski 及 E.E. Williams 著,Journal of Post Keynesian Economics 出版,2006 年秋 [3] Model Error,Katerina Simons 著,New England Economic Review 出版,1997 年 11 月 [4] Bayesian Risk Management,Matt Sekerke 著,Wiley 出版,2015 年