1. 程式人生 > >Palantir的研究到金融風控(二)

Palantir的研究到金融風控(二)

目前人工智慧已經深入金融、零售、汽車等行業,其中在金融行業的應用場景比較明確,所以AI在金融行業的發展比較快,應用相對要比其它行業來說要成熟。承接上篇文章,這裡著重總結一下知識圖譜在金融領域的應用:

一、知識圖譜能幫金融做什麼?

舉幾個例子:

以股票投研情報分析為例:

通過知識圖譜相關技術從招股書、年報、公司公告、券商研究報告、新聞等半結構化表格和非結構化文字資料中批量自動抽取公司的股東、子公司、供應商、客戶、合作伙伴、競爭對手等資訊,構建出公司的知識圖譜。在某個巨集觀經濟事件或者企業相關事件發生的時候,券商分析師、交易員、基金公司基金經理等投資研究人員可以通過此圖譜做更深層次的分析和更好的投資決策,比如在美國限制向中興通訊出口的訊息釋出之後,如果我們有中興通訊的客戶供應商、合作伙伴以及競爭對手的關係圖譜,就能在中興通訊停牌的情況下快速地篩選出受影響的國際國內上市公司從而挖掘投資機會或者進行投資組合風險控制。

二、金融知識圖譜的資料來源

三、金融領域之風控

金融的核心是風險控制,研究AI金融就必須提及到金融風控,所以首先總結一下風控的基本知識如下:

  • 風控資料的來源

一是客戶授權資料,包括手機裝置資訊、網路節點資訊、瀏覽資料埋點、LBS位置資訊、通訊錄、通話記錄資料等。

二是人行報告資料,包含大量自然屬性、貸款辦理、還款能力、逾期行為、用卡行為、擔保、抵押等大量資訊。

三是外部徵信資料,涵蓋各類黑灰名單、金融資訊、網路借貸行為資料、各類收入資料、個人資產資訊、消費能力、行動通訊詳細資訊、社交資訊等。

四是機構日常積累的其他合規資料來源。

  • 風控場景

常見的業務場景有信貸、支付、登入、註冊、精準營銷等。關於大資料風控的應用,主要從如下場景展開分析:

  信貸場景中為信貸企業預防貸前、貸後等場景的欺詐風險。對借款人的歷史借貸、消費特徵等行為進行分析,前置性判斷使用者的還款能力(經濟實力)和還款意願(道德風險),為信貸決策提供可參考依據。構建整體風控解決方案,提供全方位的大資料分析,協助網際網路信貸企業,尤其是小微金融企業客戶,更廣泛利用大資料提升風控和獲益能力,減少潛在的資金和信用損失。

  支付場景中通過高質量的金融黑名單等海量合規資料,為精準識別風險交易提供風控依據。基於大量風險資料和強大的機器學習技術,建立精準風控模型。通過事前預測,事中監測預警,事後關聯分析,全程實時監測業務潛在威脅,精準識別資金風險、套現、盜卡、盜號、釣魚支付等行為,保護使用者財產安全。同時通過對使用者的個人資訊(姓名、身份證號、手機號、銀行卡號等)進行真實性校驗,幫助第三方支付機構降低稽核個人資訊時的人力和時間成本,有效控制惡意欺詐風險。

  登入及註冊場景中結合目前領先的風控模型,對登入及註冊環節可能存在的賬戶安全隱患進行實時監測並預警。有效防範撞庫攻擊、暴力破解、垃圾註冊等賬號安全風險。

  精準營銷的實現是基於大資料模型從而找到精準使用者,同時識別虛假交易、惡意下單、庫存綁架等欺詐行為,保護平臺交易安全。

  • 創新型應用技術

  風控工具的開發及使用可促進多維度第三方資料充分利用從而提升風控效果。

  裝置指紋技術。基於國際領先的裝置識別技術,通過獲取上網裝置的軟體、硬體、行為等多層次指紋資訊,為每一個操作裝置生成全球唯一的裝置ID,精準分析裝置使用者的操作軌跡,對裝置進行標識、評估欺詐風險。裝置指紋技術普遍用於反欺詐的事前、事中、事後各個環節。

  身份認證技術。身份認證解決方案中融合了數字簽名、人臉識別、時空碼及裝置指紋等多項核心安全技術,從而確保整個身份認證過程的安全性與便捷性。

  兼顧移動端與PC端。使用者無需攜帶除手機外的任何額外認證裝置(如U盾)即可完成身份認證;無需獲取使用者資料(如姓名、身份證等),無資料洩露風險,同時保護使用者隱私資訊。另外,無需使用額外認證裝置(如USB Key),同時減少因使用USB Key而帶來的運維管理,大大降低銀行的業務運營成本。

  身份認證解決了平臺使用者賬號登入、管理授權、轉賬匯款、支付交易、資金提現等關鍵環節的二次身份確認問題。

  流式大資料計算技術。流式大資料計算技術是基於時間視窗移動的動態資料快速處理技術。採用高速的流處理技術及分散式快取技術,可實現超低延時、超高併發、高可靠、高擴充套件、高可運維,支援複雜事件的計算,元件均為鬆耦合設計,能夠跟其他平臺進行無縫對接。目前叢集吞吐能力少量節點即可達百萬筆每秒,平均延時1毫秒。風控系統對資料的分析處理能力,在時效性方面達到毫秒級,才算正真的事中風控,從而實現風險實時識別和攔截。

  智慧決策引擎。智慧決策引擎主要作用是實時對交易進行風險判斷。它是在傳統的規則引擎的基礎上,結合目前主流的模型引擎,使規則引擎與模擬引擎配合使用,將機器學習嵌入到整個反欺詐過程中。提供相關業務策略的全生命週期的統一管理,包括簡單規則、決策表、決策樹和規則流等元件的編輯、部署、執行、監控等功能,為使用者提供高效的決策管理服務。總的來說,模型更多的是輔助規則,並能在某些風險場景下提高規則的準確率。但基於機器學習的智慧決策引擎,將越來越受到重視,並在風險防控中發揮更大的作用。

  • 大資料風控解決方案

  終端環境及應用的安全檢測。應用裝置指紋技術,給予終端唯一裝置ID,對裝置進行root/越獄檢測、修改器及模擬器檢測;同時對終端應用進行安全檢測,幫助主動挖掘未知漏洞、發現惡意程式碼和後門程式。上述檢測過程在手機終端的移動應用開始啟動時自動執行,聯合雲端病毒庫進行掃描檢測,並在檢測完成後向該應用報告掃描結果,掃描結果以風險評級的方式輸出。

  應用行業先進技術構建反欺詐模型。在海量資料的基礎上,採用分散式平行計算、儲存管理和實時檢索,並運用關聯、分析和建模,解決實際業務問題。縱深多重賬戶防護體系,有效識別欺詐分子,有效防範拖庫撞庫、賬號盜用等賬號風險,從而保障賬戶安全;多維資料深度學習,分析裝置行為異常,高效預警垃圾註冊、惡意刷單等欺詐風險;多渠道資料交叉驗證,實時信用監控,及時發現多頭借貸、惡意欠款等業務風險。

  基於生物識別的身份認證與交易驗證。生物特徵具有唯一性,可以測量或可自動識別人類的生理特徵和行為特徵來進行個人身份認證的鑑定。可用於生物識別的生物特徵有手形、指紋、臉形、虹膜、視網膜、脈搏、耳廓等,行為特徵有簽字、聲音、按鍵力度等。基於這些特徵,發展了指紋識別、聲紋識別、面部識別、發音識別、虹膜識別、簽名識別等多種生物識別技術。生物識別技術具有傳統的身份認證手段無法比擬的優點。採用生物識別技術,可不必再記憶和設定密碼,使用更加安全方便。生物識別技術可以在1秒內迅速識別身份資訊,大大高於人類肉眼的識別準確率與速度;通過交叉驗證,可以極大的提升使用者遠端認證的便捷性與流程效率,生物識別技術已經實現了精準身份驗證,包括1:1人臉驗證、身份證真偽驗證、活體驗證等,這就可使其遠端、便捷對使用者身份進行驗證,進而減少惡意欺詐、降低稽核成本、提高金融安全度,構建多因子風險防護,保障金融科技安全。

智慧決策流實現秒級審批。近年來,隨著人工智慧崛起,機器學習技術也得以較快發展,智慧決策引擎就是基於機器學習的基礎上實現的。可以利用海量歷史資料訓練模型,基於客觀的資料進行風險把控,來提升基於專家規則的風控系統的準確率和覆蓋率。同時結合大資料技術,把風控系統提升到了實時反欺詐,通過低延時、高吞吐量的資料處理能力為實時風控系統,尤其是模型的訓練提供了強有力的支援。

四、傳統的風控建模方式

傳統的風控建模是通過FICO信用分以及ABCF卡模型來評價客戶的信用,涉及到的資料量比較少,其建模流程和形式也都比較標準化:

五、基於AI和知識圖譜的風控

目前與人工智慧相關的技術很多,其中大資料、機器學習、深度學習、知識圖譜等比較火熱,於是有人就提出了基於AI的金融風控體系:

該體系以知識圖譜為資料管理工具,把多種異構資料來源進行融合,利用深度神經網路做特徵提取,利用機器學習模型來建模,這應該是比較先進的體系框架了,畢竟每一塊構建起來的成本不小。

金融知識圖譜風控平臺

歡迎關注微信公號:數聯未來(zycnb1)