關於深度學習,這裏有一份入門公開課(文末福利)
點擊圖片購書
參與文末話題討論,每日贈送異步圖書
——異步小編
前不久,“逃犯看張學友演唱會被抓”的新聞讓不少人都感慨,原來演唱會還能用來幹這個!其實這都是AI面部識別技術的功勞,在支付、安防等領域,AI面部識別技術有著廣泛的應用。在互聯網金融信貸風險控制中,我們也會借助機器學習和統計分析的模型,對信貸申請者進行“AI面部識別”。即使一個微博、一條朋友圈這些看似平常的個人社交信息,經過AI模型計算後,也能幫助我們識別出那些可能的“逃犯”——信貸欺詐者。
本次公開課將從建模的角度,介紹互聯網金融反欺詐模型的關鍵——如何從信貸申請數據中提取出有用的特征。實際的建模結果表明,信貸申請人的“社交網絡”特征往往是最有效的。
1|分享嘉賓介紹
我是誰?我為什麽要開公開課
唐亙,數據科學家,《精通數據科學:從線性回歸到深度學習》一書作者。熱愛並積極參與Apache Spark、 scikit-learn等開源項目。作為講師和技術顧問為多家機構(包括惠普,華為,復旦大學等)提供百余場技術培訓。
在此之前,工作和研究集中於經濟和量化金融,曾參與經合組織(OECD)的研究項目並發表論文,並擔任英國在線出版社Packt的技術審稿人。
曾獲得復旦大學的數學和計算機雙學士學位;巴黎綜合理工的金融碩士學位;法國國立統計與經濟管理學校的數據科學碩士學位。
掃碼識別,進入直播間
2|分享題目
適合零基礎的你?
分享題目:“社交網絡”分析在互聯網金融反欺詐中的應用
分享概要
在互聯網金融信貸風險控制中,反欺詐識別是很重要的一環。在實踐中,我們常常借助機器學習和統計分析的模型從信貸申請中識別出那些可能的欺詐者。從建模的角度來講,如何從申請數據中提取出有用的特征是模型成功的關鍵,而實際的建模結果表明,申請人或者申請的“社交網絡”特征是最有效的。
此次分享主要分為兩個部分,第一部分主要介紹互聯網金融反欺詐所用的數據源和模型框架,為分享的第二部分做鋪墊;第二部分是分享的重點,將依次介紹
利用申請數據搭建申請人或者申請的“社交網絡”
利用染色等方法找到網絡中可能的欺詐團夥
利用深度學習(deepwalk)的方法將網絡向量化,並和其他特征一起搭建模型
分享的技術和模型即包含業內最有效的反欺詐手段,也包含了前沿的研究實驗方向,具有很大的實用性。
分享大綱
互聯網金融反欺詐簡介
搭建社交網絡
挖掘欺詐團夥
深度學習在社交網絡中的應用
大綱詳解
在互聯網金融反欺詐簡介中將介紹如下三個內容。
互聯網金融的業務簡介以及欺詐案例介紹:互聯網金融的業務模式、特點以及公司模型介紹;信貸欺詐特點、規模以及宜人貸欺詐案例介紹
互聯網金融反欺詐(風控)數據源介紹:從來源的角度來看,數據可以分為內部數據和外部數據;從分類的角度來看,數據可以分為個人信息數據、通訊數據、行為數據。這一部分將簡單介紹不同數據的大致用法,並為後面的社交網絡做準備
反欺詐模型架構以及模型產出物介紹:與風控模型類似,反欺詐的模型產出大概有兩個,一是基於邏輯回歸生成相應的欺詐評分模型;二是利用決策樹生成反欺詐規則。這兩種產出都嚴重依賴於特征提取,特別是社交網絡的特征提取
在搭建社交網絡這個部分,將主要介紹如下兩個內容。
? 搭建社交網絡的一般步驟:定義節點和邊、搭建異構網絡、折疊同構網絡、社區發現和染色。
? 常用的異構網絡以及同構網絡舉例:利用第一聯系人、家庭地址等搭建網絡;折疊成申請為結點的網絡
在挖掘欺詐團夥的這個部分,將介紹如下的兩個部分
? 一度、二度關聯的特征提取
? 利用社區發現以及page rank算法(染色算法)進行半監督的學習:LPA算法介紹以及效果展示,page rank算法效果展示。
在深度學習在社交網絡中的應用這一部分,將介紹如下的內容:
? 向量化社交網絡的意義:向量化社交網絡是關鍵的一步,使得社交網絡可以和其他特征一起使用,也方便使用經典的算法對社交網絡進行聚類或分類。
? word2Vec的模型簡介
? deepwalk簡介以及模型效果展示
3|聽課福利
不僅有免費公開課,還有禮物送?
福利一:公開課結束,將選出提問的3名讀者,贈送唐亙作品《精通數據科學:從線性回歸到深度學習》一本。
福利二:選出10名讀者,贈送異步社區20元e讀版圖書現金券一張。
福利三:關註【異步圖書】微信公眾號,回復“公開課”進入此次公開課微信群,活動結束後獲取此次演講PPT。
福利四:今日在異步社區購買《精通數據科學:從線性回歸到深度學習》暢享7折優惠,點擊領取優惠券購書。
4|嘉賓作品
《精通數據科學:從線性回歸到深度學習》
《精通數據科學:從線性回歸到深度學習》
唐亙 著
京東購書 當當購書
數據科學入門到實戰,介紹數據科學常用的工具——Python、數學基礎及模型,討論數據科學的前沿領域——大數據和人工智能,包括機器學習領域經典的模型、分布式機器學習、神經網絡和深度學習等。
在數據學科的角度,融合了數學、計算機科學、計量經濟學的精髓
為讀者闡釋了數據科學所要解決的核心問題—數據模型、算法模型的理論內涵和適用範圍
以常用的IT工具—Python為基礎,教會讀者如何建模以及通過算法實現數據模型,具有很強的實操性。
本書還為讀者詳解了分布式機器學習、神經網絡、深度學習等大數據和人工智能的前沿技術。
今日互動
針對今天的公開課,有什麽想法?有哪些疑問?為什麽?截止時間6月6日12時,留言+轉發本活動到朋友圈,小編將抽獎選出3名讀者贈送紙書1本和2張e讀版80元異步社區代金券,(留言點贊最多的自動獲得一張)。
異步圖書後臺回復“5月新書”進入新書交流群,獲得第一手新書信息
推薦閱讀
2018年5月新書書單(文末福利)
2018年4月新書書單
異步圖書最全Python書單
一份程序員必備的算法書單
第一本Python神經網絡編程圖書
每天與你分享IT好文。
在“異步圖書”微信後臺回復“關註”,即可免費獲得2000門在線視頻課程
點擊閱讀原文,購買《精通數據科學:從線性回歸到深度學習》
閱讀原文
關於深度學習,這裏有一份入門公開課(文末福利)