機器學習課程筆記 (1)
Concept Learning
- supervised, eager learning
- target problem: whether something belongs to the target concept or not
Find-S Algorithm
這個算法得到的是對於數據集最貼切的描述。
優點:
- 這個算法的 output 一定是最符合 positive 的訓練數據集,只要訓練數據都正確,output 也同樣符合 negative 的訓練數據集。
缺點:
- 對於訓練數據中的噪音十分敏感,如果訓練數據中含有錯誤數據,最後得出的 output 會受到很大的影響。
- 不能保證只有這一種 output 符合訓練數據。可能有很多種描述都符合,但這個算法只會得出一種。
Candidate-Elimination Algorithm
相對於 Find-S,這個算法得出兩個假設,一個是最貼近數據集的,一個是最 general 的。
機器學習課程筆記 (1)
相關推薦
機器學習課程筆記 (1)
something gen 很多 可能 sed pos 算法 put down Concept Learning supervised, eager learning target problem: whether something belongs to the tar
Stanford機器學習課程筆記1-Linear Regression與Logistic Regression
轉載請註明出處: http://xiahouzuoxin.github.io/notes/課程計劃主講人Andrew Ng是機器學習界的大牛,創辦最大的公開課網站coursera,前段時間還聽說加入了百度。他講的機器學習課程可謂每個學計算機的人必看。整個課程的大綱大致如下:I
Coursera 斯坦福吳恩達機器學習課程筆記 (1)
看了課程一週後發現忘光了,決定做一個筆記用作複習。如果涉及到侵權問題請聯絡我,我會立馬刪除並道歉。同時,禁止任何形式的轉載,包括全文轉載和部分轉載。如需使用請聯絡本人 [email protected]。如若發現侵權行為,我學過智慧財產權法的,嘿嘿第一週:基礎概念和
李巨集毅機器學習課程筆記-1.機器學習概論
# 機器學習是什麼 **機器學習就是讓機器能自動找到一個函式(function)** - 語音識別(Speech Recognition) 輸入是音訊,輸出是音訊對應的文字。 - 影象分類 輸入是圖片,輸出是類別(比如貓、狗)。 - AlphaGo下圍棋 輸入是當前棋盤的狀態,輸出是下一步
李巨集毅老師機器學習課程筆記_ML Lecture 3-1: Gradient Descent
####引言: 這個系列的筆記是臺大李巨集毅老師機器學習的課程筆記 視訊連結(bilibili):[李巨集毅機器學習(2017)](https://www.bilibili.com/video/av10590361?from=search&seid=4930602846193099298) 另外已經有
李巨集毅機器學習課程筆記-4.1分類簡介及其與迴歸的區別
[TOC] # 分類模型應用案例(Classification Cases) - 信用評分(Credit Scoring) - 輸入:收入、儲蓄、職業、年齡、信用歷史等等 - 輸出:是否貸款 - 醫療診斷(Medical Diagnosis) - 輸入:現在症狀、年齡、性別、病史 - 輸出:哪種疾病
Andrew Ng機器學習課程筆記(四)之神經網絡
sca 優化 介紹 www 之間 output 現在 利用 href Andrew Ng機器學習課程筆記(四)之神經網絡 版權聲明:本文為博主原創文章,轉載請指明轉載地址 http://www.cnblogs.com/fydeblog/p/7365730.html 前言
機器學習基石筆記1
網絡日誌 所有 手動 cli 次數 poc 基於 mat 概率問題 機器學習基石筆記1 lecture 1: The Learning Problem 1. 機器學習是什麽 通過對數據的經驗計算(experience computed),提升性能度量 3個關鍵性質 a)
Andrew機器學習課程 章節1——初識機器學習
問題1:什麼是機器學習以及機器學習的通用演算法 如今一般使用的是Tom Mitchell對機器學習的定義: 原文為: A computer program is said to learn from experience E with respecet to some task T and
斯坦福CS229機器學習課程筆記一:線性迴歸與梯度下降演算法
機器學習三要素 機器學習的三要素為:模型、策略、演算法。 模型:就是所要學習的條件概率分佈或決策函式。線性迴歸模型 策略:按照什麼樣的準則學習或選擇最優的模型。最小化均方誤差,即所謂的 least-squares(在spss裡線性迴歸對應的模組就叫OLS即Ordinary Least Squares):
吳恩達機器學習課程筆記02——處理房價預測問題(梯度下降演算法詳解)
建議記住的實用符號 符號 含義 m 樣本數目 x 輸入變數 y 輸出變數/目標變數
吳恩達機器學習課程筆記章節二單變數線性迴歸
1、模型描述 Univariate(One variable)Linear Regression m=訓練樣本的數目,x's=輸入的變數/特徵,y's=輸出變數/目標變數 2、代價函式 基本定義: 3、代價函式(一) 回顧一下,前面一些定義: 簡化的假設函式,theta0=0,得到假
【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 10—Advice for applying machine learning
Lecture 10—Advice for applying machine learning 10.1 如何除錯一個機器學習演算法? 有多種方案: 1、獲得更多訓練資料;2、嘗試更少特徵;3、嘗試更多特徵;4、嘗試新增多項式特徵;5、減小 λ;6、增大 λ 為了避免一個方案一個方
CS229機器學習課程筆記---監督學習之線性模型
監督學習 首先,我們考慮以下資料集,基於此資料集預測房價。 可以畫出如下散點圖: 定義符號 m — 訓練集樣本總數 x — 輸入變數/輸入特徵 (例,living area) y — 輸出/目標變數(例,price) { (x(i),y(i)) ;i =
機器學習課程筆記(2)
分類問題(接1) logistic迴歸中的代價函式: 對於原來的迴歸方程, J(θ)=1/m∑1/2(hθ(x)-y)2 與線性迴歸相同,所不同的是線性迴歸中hθ(x)為f(x),logistics中hθ(x)為sigmoid-f(x) 我們先設cost(h
【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 11—Machine Learning System Design
Lecture 11—Machine Learning System Design 11.1 垃圾郵件分類 本章中用一個實際例子: 垃圾郵件Spam的分類 來描述機器學習系統設計方法。首先來看兩封郵件,左邊是一封垃圾郵件Spam,右邊是一封非垃圾郵件Non-Spam:垃圾郵件有很多features。如果我
模式識別和機器學習讀書筆記1
2017-03-17 1.1 曲線擬合 用下式來擬合數據. 其中M是多項式的階數(order),$x^j$表⽰x的j次冪。多項式係數$w_0…w_M$整體記作向量w。 注意,雖然多項式函式$y(x,w)$是x的⼀個⾮線性函
Stanford機器學習課程筆記4-Kmeans與高斯混合模型
這一部分屬於無監督學習的內容,無監督學習內容主要包括:Kmeans聚類演算法、高斯混合模型及EM演算法、Factor Analysis、PCA、ICA等。本文是Kmeans聚類演算法、高斯混合模型的筆記,EM演算法是適用於存在latent/hidden變數的通用演算法,高斯混
吳恩達機器學習課程筆記——第二週
1. 多變數線性迴歸(Linear Regression with Multiple Variables) 也稱為多元線性迴歸,一元就是一個變數,多元就是多個變數,在這裡也可以叫做多個特徵 1.1 多維特徵(Multiple Features) 之前,
臺大林軒田機器學習課程筆記4----訓練 VS. 測試
引言 上一篇講到了在有限的hypotheses下,學習錯誤的發生率,即E_in與E_out不同的概率邊界,本篇將會探討在infinite hypotheses情況下的概率邊界。 線的有效數字(Effective Number of Lines) 我們先將學習劃分為兩個核心的問題