1. 程式人生 > >吳恩達機器學習筆記 —— 7 Logistic迴歸

吳恩達機器學習筆記 —— 7 Logistic迴歸

本章主要講解了邏輯迴歸相關的問題,比如什麼是分類?邏輯迴歸如何定義損失函式?邏輯迴歸如何求最優解?如何理解決策邊界?如何解決多分類的問題?

有的時候我們遇到的問題並不是線性的問題,而是分類的問題。比如判斷郵件是否是垃圾郵件,信用卡交易是否正常,腫瘤是良性還是惡性的。他們有一個共同點就是Y只有兩個值{0,1},0代表正類,比如腫瘤是良性的;1代表負類,比如腫瘤是惡性的。當然你想用1代表良性也可以,而且輸出的值不僅僅侷限為0和1兩類,有可能還有多類,比如手寫體識別是從0到9。

如果使用線性的方法來判斷分類問題,就會出現圖上的問題。我們需要人工的判斷中間的分界點,這個很不容易判斷;如果在很遠的地方有樣本點,那麼中心點就會發生漂移,影響準確性。

如果我們想要結果總是在0到1之間,那麼就可以使用sigmoid函式,它能保證資料在0-1之間。並且越趨近於無窮大,資料越趨近於1。

回到我們假設的問題上來,如果腫瘤是依賴於大小來判斷良性惡性,如果超過0.7*平均值,就判斷是惡性的,那麼平均來算30%的是惡性的,70%是良性的,他們相加總會是100%。再來看看上面的sigmoid的影象,每個點都表示它屬於1的概率是x,屬於0的概率是1-x。這樣一個分類的問題,就變成了曲線值得問題了。

如果想讓y=1,即g(z)的值要大於0.5,那麼z的值就需要大於0;相反,y=0,就是z的值小於0。因此整個分類問題,就變成了尋找決策邊界的問題了。

那麼如何確定邏輯迴歸的損失函式呢?如果使用均方誤差,由於最終的值都是0和1,就會產生震盪,此時是無法進行求導的。

因此需要尋找一個方法,使得代價函式變成凸函式,從而易於求解。

如果把損失函式定義為上面的形式,當真實的值是1時,我們預測的值越靠近1,cost的值越小,誤差越小。如果真實值是0,那麼預測的值越靠近1,cost的值越大。完美的表達了損失的概念。而且,由於0和1的概念,可以把上面的公式合併成下面統一的寫法。直接基於這個統一的寫法,做梯度下降求解即可。

在求解最優化的問題時,不僅僅只有一種梯度下降Gradient descenet,還可以使用Conjugate gradient,BFGS,L-BFSGS。

多分類問題,可以理解為採用多個logistic分類器,進行分類。針對每個樣本點進行一個預測,給出概率值,選擇概率值最高的那個進行分類的標識。

相關推薦

機器學習筆記 —— 7 Logistic迴歸

本章主要講解了邏輯迴歸相關的問題,比如什麼是分類?邏輯迴歸如何定義損失函式?邏輯迴歸如何求最優解?如何理解決策邊界?如何解決多分類的問題? 有的時候我們遇到的問題並不是線性的問題,而是分類的問題。比如判斷郵件是否是垃圾郵件,信用卡交易是否正常,腫瘤是良性還是惡性的。他們有一個共同點就是Y只有兩個值{0,

機器學習練習2——Logistic迴歸

Logistic迴歸 代價函式 Logistic迴歸是分類演算法,它的輸出值在0和1之間。 h(x)的作用是,對於給定的輸入變數,根據選擇的引數計算輸出變數等於1的可能性(estimated probablity)即h(x)=P(y=1|x;

[機器學習筆記]15非監督學習異常檢測7-8使用多元高斯分布進行異常檢測

進行 平均值 info 錯誤 blog 占用 ron 關系 http 15.異常檢測 Anomaly detection 覺得有用的話,歡迎一起討論相互學習~Follow Me 15.7-8 多變量高斯分布/使用多元高斯分布進行異常檢測 -Multivariate Gaus

Coursera-AndrewNg()機器學習筆記——第三周

訓練 ros 方便 font 就是 梯度下降 全局最優 用法 郵件 一.邏輯回歸問題(分類問題) 生活中存在著許多分類問題,如判斷郵件是否為垃圾郵件;判斷腫瘤是惡性還是良性等。機器學習中邏輯回歸便是解決分類問題的一種方法。二分類:通常表示為y?{0,1},0:“Negat

機器學習筆記 —— 5 多變量線性回歸

擬合 進行 image 價格 常用 從表 cnblogs 優化 深度 本篇主要講的是多變量的線性回歸,從表達式的構建到矩陣的表示方法,再到損失函數和梯度下降求解方法,再到特征的縮放標準化,梯度下降的自動收斂和學習率調整,特征的常用構造方法、多維融合、高次項、平方根,最後基

機器學習筆記 —— 9 神經網絡學習

滿了 線性回歸 復雜 amp 技術分享 tps 機器 神經網絡 前饋型神經網絡 本章講述了神經網絡的起源與神經元模型,並且描述了前饋型神經網絡的構造。 更多內容參考 機器學習&深度學習 在傳統的線性回歸或者邏輯回歸中,如果特征很多,想要手動組合很多有效的特征是不

機器學習筆記(六) —— 支持向量機SVM

次數 括號 圖片 最小 我們 支持向量機svm UNC 意思 strong 主要內容: 一.損失函數 二.決策邊界 三.Kernel 四.使用SVM 一.損失函數 二.決策邊界 對於: 當C非常大時,括號括起來的部分就接近於0,所以就變成了:

機器學習筆記 —— 17 推薦系統

htm 特征 問題 這就是 ref 圖片 系統 得出 工業 本章講述了推薦系統相關的知識,比如基於內容的推薦算法、基於協同過濾的推薦算法以及實踐中遇到的問題。 更多內容參考 機器學習&深度學習 推薦系統是機器學習在工業界應用最廣泛的方向,很多電子商務類、咨詢類的

機器學習筆記 —— 12 機器學習系統設計

不知道 cor 算法 項目 詞語 樣本 我們 們的 ... http://www.cnblogs.com/xing901022/p/9362339.html 本章主要圍繞機器學習的推薦實踐過程以及評測指標,一方面告訴我們如何優化我們的模型;另一方面告訴我們對於分類的算法

機器學習筆記 —— 14 無監督學習

www 最簡 業務 一次 曲線 logs img 下一個 com http://www.cnblogs.com/xing901022/p/9368432.html 本章講述的是第一個無監督的機器學習算法,在無監督的算法中,樣本數據只有特征向量,並沒有標註的y值。比如聚類

機器學習筆記 —— 19 應用舉例:照片OCR(光學字符識別)

參考 https ocr 噪聲 也說 字符 www. 定位 cnblogs http://www.cnblogs.com/xing901022/p/9374258.html 本章講述的是一個復雜的機器學習系統,通過它可以看到機器學習的系統是如何組裝起來的;另外也說明了一

機器學習筆記 —— 11 應用機器學習的建議

切分 image 們的 正則化 如果 mage 樣本 獲得 建議 http://www.cnblogs.com/xing901022/p/9356783.html 本篇講述了在機器學習應用時,如何進行下一步的優化。如訓練樣本的切分驗證?基於交叉驗證的參數與特征選擇?在訓

機器學習筆記

叠代 公式 spec end webkit 測量 ase letter s函數 1 機器學習的含義 (1)Field of study that gives computers the ability to learn without being explicitly p

機器學習筆記1-機器學習概述

可能 perf hat 定義 視頻 nbsp 這樣的 spec 學習能力 今天看了視頻的第一章-緒論:初識機器學習(Machine Learning) 1、定義: Arthur Samuel(1959).Machine Learning:Field of study tha

機器學習筆記2-監督學習

word ins problems 一個 should regress ssi pri read 英文; Supervised Learning   In supervised learning, we are given a data set and already kn

機器學習筆記4-單變量線性回歸

alt 方法 bsp 目標 .com 函數 bubuko 機器學習 絕對值 今天看個5個課時的視頻,對假設函數、代價函數、以及梯度下降有了一個大概的了解。 假設函數: 代價函數: 我們的目標就是求得J的最小值 梯度下降:在一個上坡上找一個點,求得這個點周圍的絕對值最大的導數

[機器學習筆記]11機器學習系統設計5數據量對機器學習的影響

ril 預測 數據 教程 擬合 mic 因此 效果 數據集 11. 機器學習系統的設計 覺得有用的話,歡迎一起討論相互學習~Follow Me 參考資料 斯坦福大學 2014 機器學習教程中文筆記 by 黃海廣 11.5 數據量對機器學習的影響 Data For Mac

[機器學習筆記]13聚類K-means

沒有 rand 幫助 聯系 method ima 運用 重新 function 13.聚類 覺得有用的話,歡迎一起討論相互學習~Follow Me 13.1無監督學習簡介 從監督學習到無監督學習 在一個典型的監督學習中,我們有一個有標簽的訓練集,我們的目標是找到能夠區分正

[機器學習筆記]15.1-3非監督學習異常檢測算法/高斯回回歸模型

閾值 訓練集 jpg -a 情況 color 訓練 ase 需要 15.異常檢測 Anomaly detection 覺得有用的話,歡迎一起討論相互學習~Follow Me 15.1問題動機 Problem motivation 飛機引擎異常檢測 假想你是一個飛機引擎制造

機器學習筆記一_單變量線性回歸

gre ima 梯度下降算法 line 公式 delta mat 所有 pan 單變量線性回歸 綱要 代價函數 梯度下降算法 全局最優與局部最優 代價函數 函數定義: \[ J(\theta_0,\theta_1,...)=\frac{1}{2m}\sum_{i=1}^