白雪 | NLP加持知識圖譜在金融事件挖掘中的應用
本文轉載自公眾號:阡尋科技。
9月15日訊,涵蓋金融科技、人工智慧及區塊鏈領域的2018恆生技術開放日於今日開幕,阡尋科技聯席CEO、復旦大學人工智慧方向博士白雪受邀出席本次大會,分享了金融領域事件特點分析、常用的事件抽取方法以及金融知識圖譜加持NLP等方面的實踐與心得。與參會人員共同探討了自然語言與知識圖譜未來的發展方向,並對人工智慧技術在金融領域的應用進行了展望。
【金融領域事件特點分析】資本運作,併購、高管動向等事件會對金融產品價格產生衝擊,這些事件會引發股票、期貨等金融產品價格的波動,並且由於各方對事件解讀的觀點不同,對標的價格也會產生不同的影響,故需要對這些事件進行特點分析,通過文字資料解析與語義理解,從多維度建立立體的關聯關係,來滿足投資者對事件更快、更全、更準確的挖掘需求。
事件抽取是對文字進行預處理、觸發詞抽取與論元識別等步驟後,從非結構化資訊中抽取出特定的元素,並以結構化的形式呈現給使用者。白博士向大家展示了事件抽取的大致流程,首先以基於規則或機器學習的方法來判斷句子的屬性,然後抽取事件骨幹,同時圍繞同一事件可能存在的多個表達句子,用實體對齊、同義詞對齊等手段進行泛化,再通過抽取公共子串或“填坑”的方式來“拼湊”完整的事件表示式。
【金融知識圖譜加持NLP】金融行業產業鏈上的各元素之間存在著一定的邏輯關係,這些相近的元素可以從詞庫的擴充,子圖近鄰的相似等方面,進行語義理解與詞法分析處理,對NLP進行加持與助力,進一步的,還能基於圖譜路徑進行事件的關聯和推理。知識圖譜在場景識別、關聯查詢、交叉驗證等各種NLP和AI任務上都能起到積極作用。
在事件沿知識圖譜的推理上,白博士以泰國特大洪水與新能源汽車銷量上漲,分別對橡膠行業和下游碳酸鋰電池生產企業股價的影響為例,分析了沿知識圖譜多步推理的原理,此項技術在金融投資領域具有廣泛的需求,可幫助人們及時發現投資機會與潛在風險。
白博士坦言NLP+知識圖譜、事件抽取和推理等方向,尚處在研發應用初級階段,未來發展空間很廣,仍需大家不斷的努力。
阡尋科技將深度發掘自然語言與知識圖譜在金融科技、工業智慧化、監管科技領域的應用,為市場帶來股票對話機器人、事件預警、智慧資訊、自動報告、智慧公告、知識圖譜構建與推理、智慧礦山系統等多種產品,打造一個全方位覆蓋行業產業鏈的數字資訊平臺。
OpenKG.CN
中文開放知識圖譜(簡稱OpenKG.CN)旨在促進中文知識圖譜資料的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。
點選閱讀原文,進入 OpenKG 部落格。