Coursera華盛頓大學機器學習課程總結
一、基礎匯入課程
1、迴歸:房價預測
2、分類:亞馬遜商品評價分類
3、檢索:wikipedia文章檢索
二、迴歸
模型:線性迴歸、L1/L2正則化迴歸、最近鄰迴歸和核迴歸
演算法:梯度下降、座標下降
概念:損失函式、偏差-方差折中、交叉驗證、稀疏性、過擬合、模型選擇
三、分類
模型:線性分類器(邏輯迴歸分類器、SVM、神經網路)、核、決策樹decision tree
演算法:梯度下降、boosting
概念:決策邊界、MLE最大似然估計、隨機森林、CART、線上學習
四、聚類
模型:NN最近鄰(1NN、KNN)、聚類:高斯混合模型、LDA
演算法:KD-tree/LSH、k-means、EM期望最大化
案例:wikipedia文章尋找最近鄰、LBH尋找最近鄰、自己實現k-means、
擴充套件:
決策樹(ID3, C4.5,CART)
相關推薦
Coursera華盛頓大學機器學習課程總結
一、基礎匯入課程 1、迴歸:房價預測 2、分類:亞馬遜商品評價分類 3、檢索:wikipedia文章檢索 二、迴歸 模型:線性迴歸、L1/L2正則化迴歸、最近鄰迴歸和核迴歸 演算法:梯度下降、座標下降 概念:損失函式、偏差-方差折中、交叉驗證、稀疏性、過
Coursera吳恩達機器學習課程 總結筆記及作業程式碼——第5周神經網路續
Neural Networks:Learning 上週的課程學習了神經網路正向傳播演算法,這周的課程主要在於神經網路的反向更新過程。 1.1 Cost function 我們先回憶一下邏輯迴歸的價值函式 J(θ)=1m[∑mi=1y(i)log(hθ
Coursera吳恩達機器學習課程 總結筆記及作業程式碼——第1,2周
Linear’regression 發現這個教程是最入門的一個教程了,老師講的很好,也很通俗,每堂課後面還有程式設計作業,全程用matlab程式設計,只需要填寫核心程式碼,很適合自學。 1.1 Model representation 起始給出了
Coursera吳恩達機器學習課程 總結筆記及作業程式碼——第6周有關機器學習的小建議
1.1 Deciding what to try next 當你除錯你的學習演算法時,當面對測試集你的演算法效果不佳時,你會怎麼做呢? 獲得更多的訓練樣本? 嘗試更少的特徵? 嘗試獲取附加的特徵? 嘗試增加多項式的特徵? 嘗試增加λ? 嘗試減小λ?
【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 10—Advice for applying machine learning
Lecture 10—Advice for applying machine learning 10.1 如何除錯一個機器學習演算法? 有多種方案: 1、獲得更多訓練資料;2、嘗試更少特徵;3、嘗試更多特徵;4、嘗試新增多項式特徵;5、減小 λ;6、增大 λ 為了避免一個方案一個方
【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 11—Machine Learning System Design
Lecture 11—Machine Learning System Design 11.1 垃圾郵件分類 本章中用一個實際例子: 垃圾郵件Spam的分類 來描述機器學習系統設計方法。首先來看兩封郵件,左邊是一封垃圾郵件Spam,右邊是一封非垃圾郵件Non-Spam:垃圾郵件有很多features。如果我
華盛頓大學機器學習基礎:案例研究week2
利用Python學習簡單的資料操作 import graphlab sales = graphlab.SFrame('home_data.gl/') #exploring the data for
【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 12—Support Vector Machines 支援向量機
Lecture 12 支援向量機 Support Vector Machines 12.1 優化目標 Optimization Objective 支援向量機(Support Vector Machine) 是一個更加強大的演算法,廣泛應用於工業界和學術界。與邏輯迴歸和神經網路相比, SVM在學習複雜的非
【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 14—Dimensionality Reduction 降維
Lecture 14 Dimensionality Reduction 降維 14.1 降維的動機一:資料壓縮 Data Compression 現在討論第二種無監督學習問題:降維。 降維的一方面作用是資料壓縮,允許我們使用較少的記憶體或磁碟空間,也加快演算法速度。 例子: 假設我們用兩個特徵描述一個物
【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 15—Anomaly Detection異常檢測
Lecture 15 Anomaly Detection 異常檢測 15.1 異常檢測問題的動機 Problem Motivation 異常檢測(Anomaly detection)問題是機器學習演算法的一個常見應用。這種演算法雖然主要用於無監督學習問題,但從某些角度看,它又類似於一些監督學習問題。舉例:
【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 16—Recommender Systems 推薦系統
Lecture 16 Recommender Systems 推薦系統 16.1 問題形式化 Problem Formulation 在機器學習領域,對於一些問題存在一些演算法, 能試圖自動地替你學習到一組優良的特徵。通過推薦系統(recommender systems),將領略一小部分特徵學習的思想。
【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 17—Large Scale Machine Learning 大規模機器學習
Lecture17 Large Scale Machine Learning大規模機器學習 17.1 大型資料集的學習 Learning With Large Datasets 如果有一個低方差的模型, 通常通過增加資料集的規模,可以獲得更好的結果。 但是如果資料集特別大,則首先應該檢查這麼大規模是否真
【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 18—Photo OCR 應用例項:圖片文字識別
Lecture 18—Photo OCR 應用例項:圖片文字識別 18.1 問題描述和流程圖 Problem Description and Pipeline 影象文字識別需要如下步驟: 1.文字偵測(Text detection)——將圖片上的文字與其他環境物件分離開來2.字元切分(Character
Stanford coursera Andrew Ng 機器學習課程程式設計作業(Exercise 1)Python3.x
Exercise 1:Linear Regression---實現一個線性迴歸 在本次練習中,需要實現一個單變數的線性迴歸。假設有一組歷史資料<城市人口,開店利潤>,現需要預測在哪個城市中開店利潤比較好? 歷史資料如下:第一列表示城市人口數,單位為萬人;第二
斯坦福大學機器學習課程第二周筆記
線性 line bili tla oct linear 基礎語 大學 學習 簡記 軟件安裝 Octave matlab 多元線性回歸multiple linear regression 多元梯度下降 特征縮放feature scaling 學習速率learning
【原】Coursera—Andrew Ng機器學習—彙總(課程筆記、測驗習題答案、程式設計作業原始碼)
一、Coursera 斯坦福機器學習課程,Andrew Ng Coursera連線不上,修改hosts檔案 機器學習工具Octave安裝(Win10環境) 課程地址和軟體下載
斯坦福大學(Andrew Ng)機器學習課程講義
Lecture notes 1 (ps)(pdf) Supervised Learning, Discriminative Algorithms Lecture notes 2 (ps)(pdf) Generative Algorithms Lecture notes 3 (ps)(pd
吳恩達斯坦福大學機器學習 CS229 課程學習筆記(一)
說到機器學習總繞不過幾個鼎鼎大名的人物,他們都創造了不少的機器學習資料,斯坦福吳恩達Andrew Ng的公開課CS229;Google李飛飛的CS231、周志華的、李航的《統計學習方法》、林軒田的《機器學習基石》、Peter Harringtond 的《機器學習實戰》、周志華
coursera機器學習課程第六週——課程筆記
本週的內容主要分為兩部分,第一部分:主要內容是偏差、方差以及學習曲線相關的診斷方法,為改善機器學習演算法的決策提供依據;第二部分:主要內容是機器學習演算法的錯誤分析以及數值評估標準:準
斯坦福大學公開課機器學習課程(Andrew Ng)五生成學習演算法
課程概要: 1.生成學習演算法(Generative learning algorithm) 2.高斯判別分析(GDA,Gaussian Discriminant Analysis) 3.GDA與logistic模型的聯絡 4.樸素貝葉斯(Naive Bayes) 5.