1. 程式人生 > 資訊 >機構利用 AI 演算法分析 CEO 發言的字詞和語氣:可發現比財報更多的細節

機構利用 AI 演算法分析 CEO 發言的字詞和語氣:可發現比財報更多的細節

上市公司的 CEO 一言一行都得謹慎,不然股價分分鐘跌給你看。

回想這輪缺芯潮剛剛開始的時候,IT 行業高管們還在發言中迴避或淡化供應鏈問題

幾個月後,大眾、福特這些老牌車企也遭波及,紛紛出聲警告“我撐不住啦,我要減產”。一輪股市動盪隨之而來。

不過卻有那麼幾家投資機構一點也不慌,因為他們早就捕捉到了 CEO 們信誓旦旦言論背後的遲疑

他們用 AI 演算法對比 CEO 發言稿中選擇的字詞和說話時的語氣,分析出了高度不一致性。使用演算法的基金經理表示 AI 技術能幫他們在競爭中取得優勢。

畢竟頂級投資機構都把財務報表分析的透透的了,很難從中榨取出更多價值。

此外,演算法還產生了一個有趣的副作用。

因為即興發言太容易暴露心理狀態,逼得越來越多的 CEO 提前寫好照稿唸了。

誰在用?

走在前面的有英國曼氏集團旗下的基金 MAN AHL。

從 1983 年開始,這隻基金就靠一個叫 AHL Diversified 的演算法策略自動跟蹤市場變化,到現在已經成了“量化投資界的航母”。

隨著機器學習方法的發展,MAN AHL 也不斷把新技術應用到投資策略中。

對於 CEO 的發言,他們的演算法關注語調、節奏和重音,再結合 NLP 技術與文字轉錄版本作對比,找出口頭和字面表述不一致的部分。

具體演算法細節雖然不公開,不過也可以從 MAN AHL 的機器學習主管 Slavi Marinov 偶爾發表的論文中略作了解。

在證券市場使用 NLP 技術的還有日本野村證券。

他們統計了 2014 年以來公司高管在電話會議上語言的複雜程度和股價的關係,結果是使用簡單措辭的公司股價要比複雜措辭的高出 6%

美國銀行(Bank of America)也利用電話會議中出現的詞彙來預測公司債券違約率。

他們的模型驗證了削減成本(Cost Cutting)、燒錢(Cash Burn)這樣的詞與公司未來違約行為高度相關。

這樣的 AI 系統,開發和執行成本高達數百萬美元,一般小公司還真用不起。

大的投資機構到底能不能用這個賺到錢?他們以商業敏感性為由都沒有透露。

對於小的投資機構,市場上也有一批技術提供商可以出售分析服務,也就是此前火過一陣的概念 FinTech(金融科技)。

用的什麼模型?

金融 NLP 最大的問題就是資料量不夠,把能找到的新聞和電話會議記錄全用上也不夠訓練出效果好的語言模型。

不過得益於預訓練技術的發展,先用大量通用領域文字訓練,再用少量金融新聞和經過標註的電話會議文稿微調取得了效果。

很多金融語言模型都是基於 BERT,像倫敦證券交易所推出了使用路透社新聞訓練的 BERT-RNA 和使用 39 萬份電話會議記錄訓練的 BERT-TRAN。

ICRL 2020 也收錄了一篇金融語言模型論文 FineBERT。

一家投資機構 Sparkline Capital 透露了很多他們的 BERT 模型訓練細節。

預訓練分為用通用文字、未標註的電話會議記錄、帶情緒標註的 IMDb 電影評論三步,最後再用少量帶情緒標註的電話會議記錄微調。

最後,Sparkline Capital 還解釋了為什麼現階段不能直接用深度學習來預測股價。

因為相比 CV 和 NLP 任務的資料來說,金融市場上參與者眾多、交易行為產生的資料信噪比太低。

噪音稀釋了資料中的有效資訊,AI 模型會更容易被隨機性騙到。

按他們的說法,一張貓照片包含的資訊量比 1000 個企業價值倍數(EV/EBITDA)資料還多。