林軒田機器學習基石入門（三）

阿新 • • 發佈：2018-12-13

上一節我們主要向大家介紹我們身邊機器學習的例子，這一節我們將探討機器學習由什麼元素組成（機器學習的模型結構）。

首先我們先看個信用卡的例子。

假設我們想用機器學習來判斷“是否同意貸款給這個客戶？”，我們會將使用者的資訊資料輸給模型（比如年齡，性別，職業，工齡，是否為該市久住居民，欠款資訊，年薪，資產等），然後通過模型給出判斷（這些動作其實和人工判斷相差不大）。

而我們發現大多機器學習模型都是相似的步驟（資料->模型->技能），於是我們想能否標準化學習模型以便我們學習。

於是我們將輸入的一條具體資料化為x;而是否批准貸款設為y;理想中的目標函式化為f；我們模型得出的技能則設為g；而其中g屬於H。下面我們用詳細圖示給出解釋。

於是整理簡化後得出下圖的模型。

上面兩張圖詳細給出了關於f,g和H解釋，下面我們來看看全部整合後的模型長什麼樣。

因此我們也可以得出機器學習在實際應用中的定義：使用資料去計算出假設g，而其中我們想要的g和理想f接近。

關注我們 | 獲取更多系統性學習文章|從零開始

林軒田機器學習基石入門（三）

上一節我們主要向大家介紹我們身邊機器學習的例子，這一節我們將探討機器學習由什麼元素組成（機器學習的模型結構）。首先我們先看個信用卡的例子。假設我們想用機器學習來判斷“是否同意貸款給這個客戶？”，我們會將使用者的資訊資料輸給模型（比如年齡，性別，職業，工

林軒田機器學習基石入門（二）

上一節中我們主要講到機器學習的應用場景，而這一節主要向大家介紹我們身邊機器學習的例子，讓大家對機器學習有更多的直觀瞭解。機器學習如今已滲透在我們的日行中，這很讓人驚訝，你每天都能夠接觸到它。對於人們來說“衣食住行”是每天的基礎要求。當你肚子餓想

林軒田機器學習基石（Machine Learning Foundation）

第一課機器學習問題什麼是機器學習？什麼是“學習”？學習就是人類通過觀察、積累經驗，掌握某項技能或能力。就好像我們從小學習識別字母、認識漢字，就是學習的過程。而機器學習（Machine Learning），顧名思義，就是讓機器（計算機）也能向人類一樣，通過觀察大量

臺灣大學林軒田機器學習基石課程學習筆記8 -- Noise and Error

上一節課，我們主要介紹了VC Dimension的概念。如果Hypotheses set的VC Dimension是有限的，且有足夠多N的資料，同時能夠找到一個hypothesis使它的Ein≈0Ein≈0，那麼就能說明機器學習是可行的。本節課主要講了資料集

林軒田-機器學習基石-作業3-python原始碼

大家好，以下是林軒田機器學習基石--作業3的Python的參考程式碼，自己碼的。Python方面沒有工程經驗，如有錯誤或者更好的程式碼優化方法，麻煩大家留言提醒一下下，大家互相交流學習，謝謝。 13-15題主要考察在分類問題上的線性迴歸和特徵轉換，所使用的樣

臺灣大學林軒田機器學習基石課程學習筆記1 -- The Learning Problem

最近在看NTU林軒田的《機器學習基石》課程，個人感覺講的非常好。整個基石課程分成四個部分： When Can Machine Learn? Why Can Machine Learn? How Can Machine Learn? How Can M

臺灣大學林軒田機器學習基石課程學習筆記6 -- Theory of Generalization

上一節課，我們主要探討了當M的數值大小對機器學習的影響。如果M很大，那麼就不能保證機器學習有很好的泛化能力，所以問題轉換為驗證M有限，即最好是按照多項式成長。然後通過引入了成長函式mH(N)mH(N)和dichotomy以及break point的概念，提出

林軒田--機器學習技法--SVM筆記2--對偶支援向量機（dual+SVM）

對偶支援向量機咦？怎麼還有關於支援向量機的內容，我們不是在上一講已經將支援向量機解決了麼？怎麼又引入了對偶這個概念？ 1.動機我們在上一講已經講過，可以使用二次規劃來解決支援向量機的問題。如果現在想要解決非線性的支援向量機的問題，也很簡單，如下圖所

林軒田--機器學習技法--SVM筆記5--核邏輯迴歸(Kernel+Logistic+Regression)

核邏輯迴歸這一章節主要敘述的內容是如何使用SVM來做像logistics regression那樣的soft binary classification(輸出正類的概率值)，如何在此基礎上加上核方法。 1. 把SVM看成一種regularization

臺大林軒田機器學習課程筆記4----訓練 VS. 測試

引言上一篇講到了在有限的hypotheses下，學習錯誤的發生率，即E_in與E_out不同的概率邊界，本篇將會探討在infinite hypotheses情況下的概率邊界。線的有效數字（Effective Number of Lines）我們先將學習劃分為兩個核心的問題

臺大林軒田機器學習課程筆記3----機器學習的可行性

引例先引入一個矛盾問題：圖3.1 圖案學習問題這是一道推理題，根據第一行和第二行圖形的規律分別輸出-1和+1，然後通過上述規則學習推理出第三行圖形的輸出。每個人通過學習所獲得的答案是會不一致的，例如通過對稱的規律可以得到第三行的圖形f=+1，而如果通過圖案

臺大林軒田機器學習課程筆記2----機器學習的分類

1. 根據輸出集合二分類根據輸出空間，二分類的輸出結果只有兩種，即y={-1,1}，具體的應用包括： *信用卡申請問題：Client Data=>Accept or Deny 郵件分類問題：Email Text=>Rubbish or Not 病人生病問

臺大林軒田機器學習課程筆記----機器學習初探及PLA演算法

機器學習初探 1、什麼是機器學習學習指的是一個人在觀察事物的過程中所提煉出的技能，相比於學習，機器學習指的就是讓計算機在一堆資料中通過觀察獲得某些經驗（即數學模型），從而提升某些方面（例如推薦系統的精度）的效能（可測量的）。 2、機器學習使用的條件需要有規則可以學習有事先準

臺灣大學林軒田機器學習技法課程學習筆記1 -- Linear Support Vector Machine

關於臺灣大學林軒田老師的《機器學習基石》課程，我們已經總結了16節課的筆記。這裡附上基石第一節課的部落格地址：本系列同樣分成16節課，將會介紹《機器學習基石》的進階版《機器學習技法》，更深入地探討機器學習一些高階演算法和技巧。 Large-Marg

臺灣大學林軒田機器學習技法課程學習筆記8 -- Adaptive Boosting

上節課我們主要開始介紹Aggregation Models，目的是將不同的hypothesis得到的gtgt集合起來，利用集體智慧得到更好的預測模型G。首先我們介紹了Blending，blending是將已存在的所有gtgt結合起來，可以是uniformly

臺大林軒田·機器學習技法記要

6/1/2016 7:42:34 PM 第一講線性SVM 廣義的SVM，其實就是二次規劃問題把SVM問題對應到二次規劃的係數這就是線性SVM，如果想變成非

臺灣大學林軒田機器學習技法課程學習筆記10 -- Random Forest

上節課我們主要介紹了Decision Tree模型。Decision Tree演算法的核心是通過遞迴的方式，將資料集不斷進行切割，得到子分支，最終形成數的結構。C&RT演算法是決策樹比較簡單和常用的一種演算法，其切割的標準是根據純度來進行，每次切割都

機器學習讀書筆記（三）決策樹基礎篇之從相親說起

方法事務家裏分類筆記判斷都是 rom tro 一、決策樹決策樹是什麽？決策樹(decision tree)是一種基本的分類與回歸方法。舉個通俗易懂的例子，如下圖所示的流程圖就是一個決策樹，長方形代表判斷模塊(decision block)，橢圓形成代

機器學習之旅（三）

吳恩達教授的機器學習課程的第三週相關內容： 1、邏輯迴歸(Logistic Regression) 1.1、分類問題在分類問題中，你要預測的變數 y 是離散的值，我們將學習一種叫做邏輯迴歸 (Logistic Regression) 的演算法，這是目前最流行使用最廣泛的一種學習

機器學習系列：（三）特徵提取與處理

第一個SURF描述符： [ 1.15299134e+02 2.56185453e+02 3.51230841e+00 3.32786485e+02 1.00000000e+00 1.75644866e+00 -2.94268692e-03 3.30736379e-03 2

林軒田機器學習基石入門（三）

相關推薦