林軒田機器學習基石入門(三)
上一節我們主要向大家介紹我們身邊機器學習的例子,這一節我們將探討機器學習由什麼元素組成(機器學習的模型結構)。
首先我們先看個信用卡的例子。
假設我們想用機器學習來判斷“是否同意貸款給這個客戶?”,我們會將使用者的資訊資料輸給模型(比如年齡,性別,職業,工齡,是否為該市久住居民,欠款資訊,年薪,資產等),然後通過模型給出判斷(這些動作其實和人工判斷相差不大)。
而我們發現大多機器學習模型都是相似的步驟(資料->模型->技能),於是我們想能否標準化學習模型以便我們學習。
於是我們將輸入的一條具體資料化為x;而是否批准貸款設為y;理想中的目標函式化為f;我們模型得出的技能則設為g;而其中g屬於H。下面我們用詳細圖示給出解釋。
於是整理簡化後得出下圖的模型。
上面兩張圖詳細給出了關於f,g和H解釋,下面我們來看看全部整合後的模型長什麼樣。
因此我們也可以得出機器學習在實際應用中的定義:使用資料去計算出假設g,而其中我們想要的g和理想f接近。
關注我們 | 獲取更多系統性學習文章|從零開始
相關推薦
林軒田機器學習基石入門(三)
上一節我們主要向大家介紹我們身邊機器學習的例子,這一節我們將探討機器學習由什麼元素組成(機器學習的模型結構)。 首先我們先看個信用卡的例子。 假設我們想用機器學習來判斷“是否同意貸款給這個客戶?”,我們會將使用者的資訊資料輸給模型(比如年齡,性別,職業,工
林軒田機器學習基石入門(二)
上一節中我們主要講到機器學習的應用場景,而這一節主要向大家介紹我們身邊機器學習的例子,讓大家對機器學習有更多的直觀瞭解。 機器學習如今已滲透在我們的日行中,這很讓人驚訝,你每天都能夠接觸到它。 對於人們來說“衣食住行”是每天的基礎要求。 當你肚子餓想
林軒田機器學習基石(Machine Learning Foundation)
第一課 機器學習問題 什麼是機器學習? 什麼是“學習”?學習就是人類通過觀察、積累經驗,掌握某項技能或能力。就好像我們從小學習識別字母、認識漢字,就是學習的過程。而機器學習(Machine Learning),顧名思義,就是讓機器(計算機)也能向人類一樣,通過觀察大量
臺灣大學林軒田機器學習基石課程學習筆記8 -- Noise and Error
上一節課,我們主要介紹了VC Dimension的概念。如果Hypotheses set的VC Dimension是有限的,且有足夠多N的資料,同時能夠找到一個hypothesis使它的Ein≈0Ein≈0,那麼就能說明機器學習是可行的。本節課主要講了資料集
林軒田-機器學習基石-作業3-python原始碼
大家好,以下是林軒田機器學習基石--作業3的Python的參考程式碼,自己碼的。Python方面沒有工程經驗,如有錯誤或者更好的程式碼優化方法,麻煩大家留言提醒一下下,大家互相交流學習,謝謝。 13-15題主要考察在分類問題上的線性迴歸和特徵轉換,所使用的樣
臺灣大學林軒田機器學習基石課程學習筆記1 -- The Learning Problem
最近在看NTU林軒田的《機器學習基石》課程,個人感覺講的非常好。整個基石課程分成四個部分: When Can Machine Learn? Why Can Machine Learn? How Can Machine Learn? How Can M
臺灣大學林軒田機器學習基石課程學習筆記6 -- Theory of Generalization
上一節課,我們主要探討了當M的數值大小對機器學習的影響。如果M很大,那麼就不能保證機器學習有很好的泛化能力,所以問題轉換為驗證M有限,即最好是按照多項式成長。然後通過引入了成長函式mH(N)mH(N)和dichotomy以及break point的概念,提出
林軒田--機器學習技法--SVM筆記2--對偶支援向量機(dual+SVM)
對偶支援向量機 咦?怎麼還有關於支援向量機的內容,我們不是在上一講已經將支援向量機解決了麼?怎麼又引入了對偶這個概念? 1.動機 我們在上一講已經講過,可以使用二次規劃來解決支援向量機的問題。如果現在想要解決非線性的支援向量機的問題,也很簡單,如下圖所
林軒田--機器學習技法--SVM筆記5--核邏輯迴歸(Kernel+Logistic+Regression)
核邏輯迴歸 這一章節主要敘述的內容是如何使用SVM來做像logistics regression那樣的soft binary classification(輸出正類的概率值),如何在此基礎上加上核方法。 1. 把SVM看成一種regularization
臺大林軒田機器學習課程筆記4----訓練 VS. 測試
引言 上一篇講到了在有限的hypotheses下,學習錯誤的發生率,即E_in與E_out不同的概率邊界,本篇將會探討在infinite hypotheses情況下的概率邊界。 線的有效數字(Effective Number of Lines) 我們先將學習劃分為兩個核心的問題
臺大林軒田機器學習課程筆記3----機器學習的可行性
引例 先引入一個矛盾問題: 圖3.1 圖案學習問題 這是一道推理題,根據第一行和第二行圖形的規律分別輸出-1和+1,然後通過上述規則學習推理出第三行圖形的輸出。每個人通過學習所獲得的答案是會不一致的,例如通過對稱的規律可以得到第三行的圖形f=+1,而如果通過圖案
臺大林軒田機器學習課程筆記2----機器學習的分類
1. 根據輸出集合 二分類 根據輸出空間,二分類的輸出結果只有兩種,即y={-1,1},具體的應用包括: *信用卡申請問題:Client Data=>Accept or Deny 郵件分類問題:Email Text=>Rubbish or Not 病人生病問
臺大林軒田機器學習課程筆記----機器學習初探及PLA演算法
機器學習初探 1、什麼是機器學習 學習指的是一個人在觀察事物的過程中所提煉出的技能,相比於學習,機器學習指的就是讓計算機在一堆資料中通過觀察獲得某些經驗(即數學模型),從而提升某些方面(例如推薦系統的精度)的效能(可測量的)。 2、機器學習使用的條件 需要有規則可以學習 有事先準
臺灣大學林軒田機器學習技法課程學習筆記1 -- Linear Support Vector Machine
關於臺灣大學林軒田老師的《機器學習基石》課程,我們已經總結了16節課的筆記。這裡附上基石第一節課的部落格地址: 本系列同樣分成16節課,將會介紹《機器學習基石》的進階版《機器學習技法》,更深入地探討機器學習一些高階演算法和技巧。 Large-Marg
臺灣大學林軒田機器學習技法課程學習筆記8 -- Adaptive Boosting
上節課我們主要開始介紹Aggregation Models,目的是將不同的hypothesis得到的gtgt集合起來,利用集體智慧得到更好的預測模型G。首先我們介紹了Blending,blending是將已存在的所有gtgt結合起來,可以是uniformly
臺大林軒田·機器學習技法記要
6/1/2016 7:42:34 PM 第一講 線性SVM 廣義的SVM,其實就是二次規劃問題 把SVM問題對應到二次規劃的係數 這就是線性SVM,如果想變成非
臺灣大學林軒田機器學習技法課程學習筆記10 -- Random Forest
上節課我們主要介紹了Decision Tree模型。Decision Tree演算法的核心是通過遞迴的方式,將資料集不斷進行切割,得到子分支,最終形成數的結構。C&RT演算法是決策樹比較簡單和常用的一種演算法,其切割的標準是根據純度來進行,每次切割都
機器學習讀書筆記(三)決策樹基礎篇之從相親說起
方法 事務 家裏 分類 筆記 判斷 都是 rom tro 一、決策樹 決策樹是什麽?決策樹(decision tree)是一種基本的分類與回歸方法。舉個通俗易懂的例子,如下圖所示的流程圖就是一個決策樹,長方形代表判斷模塊(decision block),橢圓形成代
機器學習之旅(三)
吳恩達教授的機器學習課程的第三週相關內容: 1、邏輯迴歸(Logistic Regression) 1.1、分類問題 在分類問題中,你要預測的變數 y 是離散的值,我們將學習一種叫做邏輯迴歸 (Logistic Regression) 的演算法,這是目前最流行使用最廣泛的一種學習
機器學習系列:(三)特徵提取與處理
第一個SURF描述符: [ 1.15299134e+02 2.56185453e+02 3.51230841e+00 3.32786485e+02 1.00000000e+00 1.75644866e+00 -2.94268692e-03 3.30736379e-03 2