1. 程式人生 > >某銀行信用卡中心——大資料反欺詐應用案例 2017-06-23 10:54 本篇案例為資料猿推出的大型“金融大資料主題策劃”活動(檢視詳情)第一部分的系列案例/徵文;感謝 百融金服 的投遞 作為整體

某銀行信用卡中心——大資料反欺詐應用案例 2017-06-23 10:54 本篇案例為資料猿推出的大型“金融大資料主題策劃”活動(檢視詳情)第一部分的系列案例/徵文;感謝 百融金服 的投遞 作為整體

某銀行信用卡中心——大資料反欺詐應用案例

2017-06-23 10:54

本篇案例為資料猿推出的大型“金融大資料主題策劃”活動(檢視詳情)第一部分的系列案例/徵文;感謝 百融金服 的投遞

作為整體活動的第二部分,2017年6月29日,由資料猿主辦,上海金融行業資訊協會、網際網路普惠金融研究院聯合主辦,中國資訊通訊研究院、大資料發展促進委員會、上海大資料聯盟、首席資料官聯盟、中國大資料技術與應用聯盟協辦的《「資料猿·超聲波」之金融科技·商業價值探索高峰論壇》還將在上海隆重舉辦【論壇詳情丨上屆回顧】

在論壇現場,也將頒發“技術創新獎”、“應用創新獎”、“最佳實踐獎”、“優秀案例獎”四大類案例獎

來源:資料猿丨投遞:百融金服

2003年以來我國經濟的快速增長,國內信用消費環境的日趨成熟,我國信用卡市場近幾年得到了爆炸性的大發展。根據中國銀行業協會統計,截至2015年末,信用卡累計髮卡量5.3億張,信用卡欺詐損失排名前三型別為偽卡、虛假身份和網際網路欺詐。

隨著網際網路資訊科技的發展與移動互聯時代的到來,信用卡業務的申請受理也逐漸由線下轉移到線上渠道。某銀行信用卡中心申請進件的重心,也逐漸向線上渠道傾斜。這就要求卡中心在審批流程和方法上與時俱進,採用更多渠道通過第三方服務,對申請進件的信用資質、真實性等方面進行核查,以防止欺詐行為的發生。

週期/節奏

1.2014年開始測試.

2.2015年上線第一版髮卡模型,在網申行方A卡中分段的客群上使用。百融評分大於一定分數就髮卡,初期控制總量,驗證6個月後放量。

3.2016年改進版模型上線,全量查詢百融,和自有評分組合使用。

4.2016年底,為滿足人民銀行徵信中心合規要求,調整網申流程。進件通過百融初審,初審通過後邀請到網點面籤,面籤通過再查人行完成終審。

5.2017年針對純線上樣本再次優化模型,目前已完成開發,準備上線。

客戶名稱/所屬分類

某銀行信用卡中心/­風險控制­/反欺詐

任務/目標

信用卡業務競爭本質上就是客戶的競爭,而且是優質客戶的競爭。針對線上審批在客戶發現、客戶提升、客戶保持、忠誠度、反欺詐和個人信用風險等等一系列圍繞客戶的新問題,支援日常運作的信用卡審批無法提供線上實時的、大量的、複雜的申請提供快速的決策分析,希望建立一套以客戶為中心的大資料分析系統以實現上述目的。

挑戰

今年兩會上,總理在《政府工作報告》中指出,當前系統性風險總體可控,但對不良資產、證券違約、影子銀行、網際網路金融等積累風險要高度警惕。金融行業長期面臨欺詐風險和信用風險,欺詐風險和信用風險有著本質的不同,信用風險指借款人因一些原因未能及時、足額償還債務而違約的可能性,信用風險和收益一般是正向關係,金融機構對信用風險是主動承擔的,風險管理的目的在於將風險控制在一定範圍內而獲得更好的收益。

而欺詐風險則是借款人惡意利用金融規則的漏洞以非法佔有為目的,採用虛構事實或者隱瞞事實真相的方法,騙取借款的風險,金融機構是被動承擔的,並不會從承擔欺詐風險中獲得交易收益,風險管理的目的在於將風險減少到最低和嚴防風險發生。但欺詐風險與信用風險又有一定的聯絡,欺詐風險可以引發新的信用風險或增大原有的風險程度,為風險管理帶來一定難度。

金融反欺詐是指金融機構通過藉助技術手段、改善業務流程等方式,檢測、識別並處理欺詐行為,以預防和減少金融欺詐的發生。反欺詐在國內是個剛需,對很多金融機構來說,其所面臨的欺詐風險遠大於信用風險。尤其是近年來網際網路金融和消費金融的快速發展,同時傳統金融機構也不斷向線上轉移業務,很多平臺等在風險管理方面準備不足即開展業務,面臨大量的網貸申請欺詐和交易欺詐。同時對與p2p平臺和消費金融公司來說,低廉的造假成本和風控能力較弱,大大降低了網貸申請過程中的詐騙難度,給其識別風險帶了很大的衝擊和挑戰。

通過對各種場景中常見的欺詐行為的研究,可以對於外部欺詐的主要特徵做出初步判斷,欺詐行為主要可分為以下幾大類:

1、身份欺詐,即利用虛假的身份資訊向金融機構申請貸款。身份造假有以下幾種型別:

第一,盜用或冒用他人身份資訊,欺詐分子通過暴力破解、撞庫等技術手段非法盜取網上銀行/手機銀行賬戶,並採用集碼器等獲取手機驗證碼等校驗資訊,利用賬戶資金進行非法消費、轉賬或提現等操作。

第二,盜用銀行卡,即非法獲取持卡人的銀行卡資訊,繫結支付賬戶,或者通過複製銀行卡,提取銀行卡內資金。

第三,虛假註冊,即利用身份資訊交易黑色產業鏈大量收購身份資訊,線上註冊賬戶,並利用虛假註冊的非本人賬戶進行騙貸或洗錢,這類成本較低的欺詐方式主要用於攻擊風險控制薄弱(例如提供身份證即可放款)的借貸平臺。

隨著放貸機構風險管理手段的升級,近期還有針對性地發展出“虛擬人物養成”的新模式,即花費時間和經濟成本“刷”出各類信用記錄,例如通過作弊手段,將芝麻信用分“養”到600分以上,創造出一個“真實”的有良好信用資訊的人以騙取貸款。

第四,電信詐騙,即通過網路、電話等詐騙方式,誘使客戶主動將資金轉移到欺詐分子賬戶。在身份欺詐中,既有個人實施的單筆騙貸,也有專門的騙貸團伙,專門研究各個金融機構的管理漏洞,利用各種技術手段實施團伙欺詐,例如攻擊某個平臺,大量盜取使用者資訊,或通過一臺主機同時控制幾百部手機或平板電腦,或同一臺手機不斷插拔多個手機號進行申請,其手段更為隱蔽,從單一的身份屬性驗證角度難以識別此類團伙行為或機器行為。

2、資訊隱瞞或造假,即刻意隱藏不良資訊,或徵信不達標的個人,在黑中介的協助下,通過各種手段將自己包裝成“信用合格”人員,從而順利獲得貸款。例如申請人存在電信、公共事業、各類罰款等方面的欠繳行為,或者其名下個人資產是法院的執行物件等負面資訊,或者其配偶在金融機構有過多次逾期或不良記錄,即使申請人本人信用狀況良好,但法律規定的代償義務直接影響到了申請人的還款能力和意願。由於婚姻關係不是申請表的必填資訊,此類資訊不對稱具有相當的隱蔽性,難以被金融機構察覺。

另外,還有欺詐分子通過作弊手段,短時間內大幅提高芝麻分等信用記錄,或偽造高學歷證明、工作證明、通訊資訊、銀行流水資訊等,試圖提高信用稽核的通過率。

3、隱形的欺詐意圖,由於信用意識和超前消費的準備不足,一部分擁有正常信貸需求的人可能出現未能正確評估自身還款能力或喪失還款意願的情況。申請人本人及其密切聯絡人(尤其是有代償義務和代償意願的聯絡人)是否在新的貸款機構提交了借款申請,是否從新的貸款機構借款,借貸產品的型別和借貸渠道是否發生了變更等,尤其是從傳統金融機構轉向風控較為鬆懈的新型貸款機構申請貸款,或新申請了短期高息貸款,或頻繁使用信用卡提現等異常現象,如果出現此類情況,有理由相信,在客戶收入保持現有水平的情況下,難以償還所有這些欠款,很大程度上能夠反映出資金緊張或信用狀況惡化,需要額外加以關注。

4、商戶欺詐,商戶與借款人形成套現、套利的勾結關係,騙取金融機構對於特定消費場景的補貼等。

實施過程/解決方案

技術要點及解決方案

隨著網路和移動通訊技術在金融領域的廣泛應用,網路欺詐也日益複雜多樣,並呈現多種欺詐手段的複合型欺詐和分工精細的團伙化欺詐趨勢。傳統的反欺詐手段通常是每遇到一次欺詐,就將其行為特點記錄下來形成“規則”,再基於規則建立防範機制,通過金融機構自有業務資料進行分析建模做反欺詐風控,但由於我國目前徵信體系並不完善,資料滯後性和資料不全面問題導致金融機構只能做到一定程度的預防,不能跟上日益隱蔽和變化的欺詐手段,起不到真正的全面風險控制。

百融金服憑藉服務銀行等金融機構的行業先入優勢、超強的大資料處理和建模能力,為信貸行業使用者提供包括反欺詐、貸前信審、貸中管控以及貸後管理在內的客戶全生命週期產品和服務。通過大資料的方式進行篩選、整合、聚類等處理,針對未來可能產生欺詐行為的異常資訊進行判定,為使用者做全方位畫像,就成為金融機構防範欺詐風險和信貸決策的重要補充。

影響反欺詐效果的因素包括資料的來源及質量、 演算法模型的有效性、 系統構架以及對應的反制措施。

圖1 百融反欺詐框架

在反欺詐系統中,能否形成全面的使用者畫像, 進而對使用者下一步的欺詐風險進行預測, 多維度和深度的大資料是必不可少的條件。

隨著網際網路和移動網際網路渠道的不斷髮展,從各類場景識別欺詐行為的重要性將日漸突顯。百融擁有詳盡且經過檢驗的預置規則集,對於不同的業務場景,可以基於測試樣本的測試效果,選擇適用規則進行使用,還可以通過對金融機構具體應用場景和客群的特徵分析,開發客製化規則並檢驗效果,擇優選用、部署,確保貸前反欺詐效果。

圖2 不同場景下的欺詐方式

一般來說,反欺詐模型有兩種,一是使用大量欺詐樣本,應用規則引擎及統計分析技術,進行多維度多規則的組合,根據對欺詐識別和預測能力的貢獻,每條規則被賦予相應的權重,命中相關規則的行為會得到累積的分值,即對單次信貸申請行為的欺詐度的綜合量化結果,從而來預測欺詐的概率。

圖3 反欺詐­專家判斷模型(規則引擎)

另一種是反欺詐機器學習模型,它指的是採用資料探勘方法,基於歷史(即已知的欺詐申請和正常申請)而建立的分類模型,通過機器訓練利用海量資料來對借款人進行判斷。

圖4 反欺詐­機器學習模型

機器學習主要有兩種學習方式,監督學習和無監督學習。監督學習模型,通過已有的訓練樣本(即已知資料以及其對應的輸出)去訓練得到一個最優模型,具有對未知資料進行推測和分類的能力,比如在已知“好”和“壞”標籤的前提下,嘗試從歷史資料中,挖掘出欺詐團伙的典型特徵和行為模式,從而遇到相似的行為時可以分辨是否是欺詐團伙。

監督模型雖然在預測準確性上有不錯的表現,但是,實際情況中,“好”和“壞”的標籤往往很難得到。因此,在沒有額外資訊的時候,就需要通過無監督學習模型進行分析。無監督式學習網路在學習時並不知道其分類結果是否正確,也沒有告訴它何種學習是正確的),僅提供輸入範例,而它會自動從這些範例中找出其潛在類別規則。當學習完畢並經測試後,便可以將之應用到新的案例上。

在反欺詐規則引擎中,這些甄別欺詐行為的規則依賴於從大量歷史案例中總結出來的“專家知識”,而機器學習模型採用更復雜的演算法建立的模型,需要大量資料建立一個良好的訓練集,以保證輸出結果的準確。基於兩類模型各自的優劣勢,在應用其評分結果時,百融建議根據金融機構的實際情況,制定分階段應用策略,並持續監控和改進模型。

圖5 兩種模型的應用策略

上文提到欺詐行為呈現團伙化特徵,關係網路提供了全新的反欺詐分析角度,通過無監督學習演算法,挖掘詐騙團伙的特徵,從而識別詐騙團伙。

亞里士多德提出“人是社會性動物”,社會個體成員之間因為互動而形成的相對穩定的關係體系,關係網路關注的是人們之間的互動和聯絡,社會關係包括朋友關係、同學關係、生意夥伴關係、種族信仰關係等,經由這些社會關係,把從偶然相識的泛泛之交到緊密結合的家庭關係的各種人們或組織串連起來。

關係網路指的是一種基於圖的資料結構,由節點和邊組成,每個節點代表一個個體,每條邊為個體與個體之間的關係。關係網路把不同的個體按照其關係連線在一起,從而提供了從“關係”的角度分析問題的能力,這就讓我們可以從正常行為中識別出到異常的團伙欺詐行為。

圖6 關係網路圖

異常檢測是在無監督模型學習中比較有代表性的方法,即在資料中找出具有異常性質的點或團體。在檢測欺詐團體的情況下,異常檢測被認為是比較有效果的。比如一般情況下在關係網路中,正常的個體應該是與另一個節點組成一度關係,如果出現與其它眾多節點關係密切,關係在二度以上,且網路中有多個節點具有欺詐嫌疑,則這個關係網路的團體可以看作是異常,其每個節點均有可能是欺詐團伙的參與者,發生借貸行為時,可以進行重點審查或直接拒絕。異常檢測並不能夠明確的給出一個團體是否欺詐,但是可以通過這種方法排查出可疑的團伙,從而進行調查。

綜上所述,從金融機構的業務流程來看,風險是存在於信貸行為的整個生命週期的,百融通過使用者畫像、反欺詐識別、信用評估等手段建立貸前稽核、貸中監控、貸後管理的信貸全生命週期風控體系,幫助金融機構降低潛在風險。

圖7 全生命週期管理方案

實施過程

1、客群分析

在建立模型前,百融金服將根據信用卡中心的業務模式和客戶群體特徵,明確客群分類,以此來確定模型的種類,確保模型準確性的前提下避免重複工作。根據信用卡中心的客群分析研究結果,識別其風險特徵,確定與其信用風險強相關的變數,與百融金服進行聯合建模。

2、客製化建模

在建模的過程中,百融金服的專業人員該信用卡中心的業務人員共同對貸前反欺詐、信用評估、建模、貸中監控等環節進行深入研究和探討,及時根據其信用卡中心的需求對模型進行調整。

欺詐檢測方面,通過收集和整理各行業、機構的黑名單資訊,通過多樣化的機器學習模型及大資料關聯分析等技術,給銀行、個人等企業提供風險管控和反欺詐的服務。

風險評級方面,使用專業技術和工具,評估風險賬戶相關資料的客觀性、準確度,量化其信用風險、履約等能力;在控制風險前提下,使個人能夠實現安全匯款。

建模方面,根據該銀行信用卡的業務特徵以及百融在同業的實踐經驗,本專案將主要採用廣義線性模型框架下的邏輯迴歸模型來實現。邏輯迴歸模型具有穩定性高、解釋性強、部署簡易的優點,使得其廣泛的應用於風險評估、市場營銷等諸多領域。評分將基於科學且嚴密的建模流程,同時建模過程中將充分吸收百融金服積累的專家經驗與行業經驗,形成最終的最適用於其信用卡中心的定製化評分。定製化評分將助力其信用卡中心提升信用風險評估的精準性,提升審批效率和稽核通過率。

貸中監控方面,發掘與相關賬戶的信用相關的預警資訊,形成預警訊號並向相關風險管理系統主動推送,進而跟蹤預警訊號處置流程,直至形成最終結論或風險管控方案,形成一個風險預警、通知、處置和關閉的閉環處理流程。

3、查詢介面

百融將根據該銀行信用卡中心的需求,提供網頁查詢和專線介面查詢兩種方式。

1)介面查詢方式

百融提供相應的介面程式,介面可支援不同業務系統開發不同介面查詢功能,保證拓展性的基礎上,可實現單筆查詢和批量查詢兩種功能,滿足該銀行信用卡中心發起一次查詢返回所有結果的需求。其中,單筆查詢和批量查詢都可滿足實時返回查得結果需求。

2)網頁查詢方式

百融將為該銀行信用卡中心提供網頁查詢方式,使用者可通過網頁輸入相關資訊進行查詢,網頁版是百融自主研發的風險羅盤系統,同樣支援單筆和批量兩種查詢方式。其中,單筆查詢和批量查詢都可滿足實時返回查得結果需求。

結果/效果總結

百融徵信局評分在銀行客群上具有優秀的風險區分度和穩定的排序能力,與銀行申請評分交叉使用後可以更精準得區分出好壞客戶。對於無央行徵信報告的客戶,百融仍能對75%以上的客戶實現風險區分,經過百融評分,找回了原本認為壞的客戶,拒絕了原本認為好的客戶,在保持通過率基本不變的情況下,審批通過率提升了8%,實現不良率由1.54%下降至1.25%,降低銀行約20%的損失。

相關推薦

銀行信用卡中心——資料欺詐應用案例 2017-06-23 10:54 案例資料推出大型金融資料主題策劃活動檢視詳情第一部分系列案例/徵文感謝 投遞 作為整體

某銀行信用卡中心——大資料反欺詐應用案例 2017-06-23 10:54 本篇案例為資料猿推出的大型“金融大資料主題策劃”活動(檢視詳情)第一部分的系列案例/徵文;感謝 百融金服 的投遞 作為整體活動的第二部分,2017年6月29日,由資料猿主辦,上海金融

Python學習筆記從零開始到放棄Python 入門第一部分

目錄 前言 python基礎 變數 宣告變數 變數定義的規則: 九九乘法表實現 註釋: Pycharm設定: 程式碼開頭自動生成資訊: pycharm多行註釋快捷鍵ctrl+? 格式化輸出 佔位符 賬號密碼登陸器(for,while,break,c

[譯] React 的今天和明天圖文版 —— 第一部分

原視訊地址:React Today and Tomorrow and 90% Cleaner React with Hooks 中英文字幕視訊地址:React Today And Tomorrow Part I —— 中英雙語字幕 英文原文地址:React Today and Tom

資訊學奧賽一C++版第一部分 C++語言 第五章 陣列

第五章 陣列 第一節 一維陣列 T1102 : 與指定數字相同的數的個數 時間限制: 1000 ms 記憶體限制: 65536 KB 【題目描述】   輸出一個整數序列中與指定數字相同的數的個數。 【輸入】   輸入包含三行:   第一行為N(N≤100)N

資訊學奧賽一C++版第一部分 C++語言 第四章 迴圈結構的程式設計

第四章 迴圈結構的程式設計 第一節 for語句 T1059 : 求平均年齡 時間限制: 1000 ms 記憶體限制: 65536 KB 【題目描述】   班上有學生若干名,給出每名學生的年齡(整數),求班上所有學生的平均年齡,保留到小數點後兩位。 【輸入】

資訊學奧賽一C++版 第一部分 C++語言 第四章 迴圈結構的程式設計

//1091 求階乘的和#include <stdio.h>int f(int n){    int i,ans=1;    for(i=1;i<=n;i++)        ans*=i;    return ans;}int main(){    int n,i,sum=0;    sc

資訊學奧賽一C++版第一部分 C++語言 第三章 程式的控制結構

第三章 程式的控制結構 第一節 if選擇結構 T1039 : 判斷數正負 【題目描述】   給定一個整數NNN,判斷其正負。如果N&gt;0N&gt;0N>0,輸出positive;如果N=0N=0N=0,輸出zero;如果N&lt

獨家 | 資料與AI技術助力金融科技:的探索例項

[導讀]本文選自百融金服CEO張韶峰和CRO季元於2017年9月14日晚在清華大資料“技術·前沿

招商銀行信用卡中心2019秋招IT筆試資料方向第一批

1.關於資料完整性的說法正確的是 實體完整性要求每個實體都必須有一個主鍵或其他的唯一標識列 2.Python如何定義一個函式 def&lt;name&gt;(arg1,arg2,...argN) 3.有關資料倉庫的開發特點,不正確的描述是 資料倉庫開發要從資料出發

演算法題1:《招商銀行信用卡中心AI方向第一程式設計題:L、R狀態改變

** 題目描述 **題目描述:用‘.’表示諾骨牌站立,‘L’表示該位置以前往左倒,‘R’表示該位置之後往右倒。 **如:…L… 得到的結果即為LLLLL…; …R… 得到的結果是…RRRR; # 如果L、R相遇,則各佔一半,剩餘的為.,如…R…L…得到的結果即為…

資料整理——Oracle基本概念、術語Glossary from Oracle Concepts——第一部分

資料來源: https://docs.oracle.com/database/121/CNCPT/toc.htm 中文部分為本人的翻譯,僅供參考。 概念 中文 描述 access driver 訪問驅動程

招商銀行信用卡中心2019秋招IT筆試開發方向第二批

import java.util.*; public class Main { public static void main(String[] args){

《招商銀行信用卡中心AI方向第一程式設計第二題

題目描述:用‘.’表示諾骨牌站立,‘L’表示該位置以前往左倒,‘R’表示該位置之後往右倒。 如:....L... 得到的結果即為LLLL....;....R...L..得到的結果即為....RR.LL.. 輸入:一行字串,只包含‘.’、‘R’、‘L’三種字元 輸出:一行

招商銀行信用卡中心資訊科技部暑期實習筆試題

時間:4月11日晚18:00-19:30 地點:東華大學 試卷:(拿到卷子,掃了一眼,持續懵逼中) 第一部分選擇題: 1、作業系統程序相關的,2、哈夫曼樹,3、哪個排序初始狀態對系統系能沒影響(差不多就是這個,記不大清了),4、資料庫六種正規化,5、java正則表示式,6、

資料結構、演算法與應用C++語言描述第二版 第一部分練習參考答案

1、 void swap(int& x,int& y) {//交換x,y int temp=x; x=y; y=temp; } 2、 template<class T,unsigned N> size_t count(const T (

乾頤堂安德全新HCNA真題解析版本背好必過華HCNA第一部分共享

所有 ica 分支 net 中文 cer 診斷 邏輯 等級 少見的題庫解析版,既有答案也有解釋,希望對您考取HCNA有幫助。另外一點忠告小白,千萬別信那些NA、NP包過,本身NA、NP也就是最初級的內容而已,背一背都會過,當然學習知識是主要的 1.STP 在提高網絡可靠性的

Python調用度地圖API路線規劃、POI檢索——第一部分

api mil 申請 eap pos ice poi檢索 pytho 例如 項目的目的是為了查詢某個點附近某些POI的最近距離,例如查詢天安門到附近最近的商場的距離(時間) 1.百度地圖API 程序中用到百度地圖的兩個API,分別是 (1)路線規劃服務(又名Directio

網絡工程師成長日記383-銀行某市中心支行市縣網絡擴容項目工程感想

網絡工程師 網絡技術 項目案例 cisco huawei 網絡工程師成長日記383-某銀行某市中心支行市縣網絡擴容項目工程感想 這是我的第383篇原創文章,記錄網絡工程師行業的點點滴滴,結交IT行業有緣之人 某銀行某市中心支行市縣網絡擴容項目工程感想 接到老大短信告知有項目後,當時正好在

資料教程8.4移動流量分析案例

        前面分享了使用mapreduce做wordcount單詞統計的實現與原理。本篇博主將繼續分享一個移動流量分析的經典案例,來幫助在實際工作中理解和使用hadoop平臺。     &n

數字影象處理的筆記第一部分:概念和應用領域

影象處理的部分先做一個大概的記錄,後續深入學習後展開。內容圍繞影象的分割和增強展開。 只是相關技術的某些應用,也可能不盡準確,為了記錄和學習。 第一部分:概念和應用領域 第二部分:相關的程式碼實現 ----------------------------針對畫素本身的操作,非