深入了解機器學習
深入了解機器學習
https://www.jianshu.com/p/2fafcdebf915
摘要: 了解機器學習發展史、機器學習是什麽?機器學習有什麽?看看本文就夠了。
如今機器學習已經成為了這個時代的熱門話題。機器學習已經存在了幾十年,但直到最近我們才得以利用這項技術。
接下來,讓我們一起回顧一下機器學習的發展歷史:
它是怎麽運行的呢?
機器學習(ML)的處理系統和算法主要通過在數據和通過找出數據裏隱藏的模式進而做出預測的識別模式。這裏值得一提的是,機器學習屬於人工智能(AI)領域,而人工智能又與更廣泛的數據挖掘和知識發現領域相交叉。
機器學習(ML)其他用法的例子:
機器學習還可以用於下列內容:
·醫療保健:識別高危客戶;優化診斷準確性;改進健康計劃成本。
·社會:預測廣告活動效果;預測消費者情緒或其反饋。
·航空:預測火箭發動機爆炸;預測試點能力;預測航線。
還有其他一些行業也希望通過利用這種技術來獲得商業價值。事實上,根據普華永道2017年全球數字智商調查,54%的機構正在大量投資人工智能和機器學習。
它是如何完成的呢?
機器學習任務分為三類。
1. 監督ML:
大多數情況下,機器學習依賴於被標記為真或假的數據。
示例:教計算機學會根據人類完成的交易標簽來識別潛在的欺詐性或非欺詐性交易,以確保獲得高質量的數據。了解到欺詐性交易與非欺詐性交易之間的差異後,ML會自動對新交易數據進行分類以獲得潛在的欺詐性活動。
2. 未受監督的ML:
與監督學習依賴於標簽有所不同,該種類型的算法需要對象的各個方面提供大量的數據。
示例:在欺詐發生的情況下,提供欺詐者的各種屬性以及一些交易價值,根據交易的固有特征和描述特征,無監督ML可以將交易分為兩個不同的組。
3. 強化學習的ML:
示例:學習玩流行的棋盤遊戲奧賽羅,ML會收到關於玩家是贏還是輸的信息。該程序沒有將數據庫中的所有的動作都標記為贏了或輸了,但卻能知道整個遊戲的最終結果。然後,ML可以進行多種遊戲,每次都重視那些導致獲勝組合的動作。
一些流行的方法:
ML中采用了多種學習方法,下面將為大家介紹一些最為常見的方法。
決策樹學習:
一個預測模型,通過映射關於項目的觀察結果,得出結論;使用決策節點的層次結構,當逐步回答時,可以將交易分類為欺詐或非欺詐。
回歸學習:
回歸學習是最重要和廣泛使用的機器學習和統計工具之一。它能夠通過學習依賴變量和預測變量之間的關系做出數據預測。
樸素貝葉斯學習:
這是一個概率圖形模型,表示一組隨機變量及其條件獨立性;例如,欺詐者與交易金額,年齡,行為等之間的概率關系。
神經網絡學習:
神經網絡學習由多個隱藏層組成,模仿人腦的行為。深度學習包括多個一個接一個的神經網絡。
使用機器學習打擊金融詐騙:
由於金融詐騙給企業帶了很大的信譽損失和財務破壞,引起了全球很多方面的關註。每年都有數百萬的家庭遭受金融詐騙,經濟損失達數億美元。
曾經,有一家金融界被稱為佼佼者的機構同意支付165億美元來解決金融詐騙案。考慮到所有這些情況,將數據挖掘工具和技術用於檢測可能的欺詐活動或事件變得很重要。
在研究可幫助我們識別欺詐活動的數據挖掘技術之前,首先根據2016年普華永道經濟犯罪調查來查看欺詐行為。
排名前三的風險預測算法和案例:
三大風險預測算法和案例如下:
·分類方法:用於生成可能的值(即true,false,yes,no,o,1等)。這種機器學習技術可以根據各種預測變量來分類特定債務會變成“好”還是“壞”。
·神經網絡:在包含神經元和具有輸入、輸出和隱藏層節點的大型數據集上顯示更好的結果。這種方法通常用於使用各種人口學,年齡和其他變量作為輸入來執行信用評級預測。
·隨機決策森林:分類的集合學習方法。他們在培訓和輸出種類時(即分類模式)構建了許多決策樹。這被廣泛用於執行信用風險預測。
Beneish M-Score是另一個在財務報表欺詐領域受歡迎的新興數學模型。該模型使用財務比率和八個變量來確定一個組織是否操縱了其收入。這些變量是根據公司財務報表中的數據構建的,一旦計算出來,就會創建一個M-Score來描述盈余被操縱的程度。請註意,作為概率模型,它不會識別100%準確度的操縱器。
結論:
機器學習的好處主要是:
·通過快速集成進行數據驅動的決策:機器學習利用各種數據,幫助企業根據最新的數據模式不斷升級其策略。
·加速洞察力:機器學習能夠加快識別相關數據的速度使得利益相關者能夠及時行動。例如,機器學習可以不斷優化客戶的下一個最佳報價,因此客戶在中午可能看到的內容可能與同一個客戶在晚上看到的內容不同。
·風險規避:機器學習給企業提供了防止詐騙者陷入困境並減輕潛在貨幣和監管復雜化的能力。
本文由阿裏雲雲棲社區組織翻譯。
文章原標題《Deep Dive Into Machine Learning》
作者:Sunil Kappal
譯者:烏拉烏拉,審校:袁虎。
深入了解機器學習