李航《統計學習方法》CH02

阿新 • • 發佈：2018-11-10

三元由於 nis mir 集合體會 .com 測試 git

CH02 感知機

前言

章節目錄

感知機模型
感知機學習策略
1. 數據集的線性可分性
2. 感知機學習策略
3. 感知機學習算法
感知機學習算法
1. 感知機學習算法的原始形式
2. 算法的收斂性
3. 感知機學習算法的對偶形式

導讀

感知機是二類分類的線性分類模型。

$L(w,b)$的經驗風險最小化
本章中涉及到向量內積，有超平面的概念，也有線性可分數據集的說明，在策略部分有說明損關於失函數的選擇的考慮，可以和CH07一起看。
本章涉及的兩個例子，思考一下為什麽$\eta=1$，進而思考一下參數空間，這兩個例子設計了相應的測試案例實現，在後面的內容中也有展示。
在收斂性證明那部分提到了偏置合並到權值向量的技巧，這點在LR和SVM中都有應用。

第一次涉及Gram Matrix $G=[x_i\cdot x_j]_{N\times N}$
感知機的激活函數是符號函數.
感知機是神經網絡和支持向量機的基礎.
當我們討論決策邊界的時候, 實際上是在考慮算法的幾何解釋.
關於感知機為什麽不能處理異或問題, 可以借助下圖理解.

技術分享圖片

上面紫色和橙色為兩類點, 線性的分割超平面應該要垂直於那些紅粉和紫色的線.

三要素

模型

輸入空間：$\mathcal X\sube \bf R^n$

輸出空間：$\mathcal Y={+1,-1}$

決策函數：$f(x)=sign (w\cdot x+b)$

策略

確定學習策略就是定義**(經驗)**損失函數並將損失函數最小化。

註意這裏提到了經驗，所以學習是base在訓練數據集上的操作

損失函數選擇

損失函數的一個自然選擇是誤分類點的總數，但是，這樣的損失函數不是參數$w,b$的連續可導函數，不易優化

損失函數的另一個選擇是誤分類點到超平面$S$的總距離，這是感知機所采用的

感知機學習的經驗風險函數(損失函數) $$ L(w,b)=-\sum_{x_i\in M}y_i(w\cdot x_i+b) $$ 其中$M$是誤分類點的集合

給定訓練數據集$T$，損失函數$L(w,b)$是$w$和$b$的連續可導函數

算法

原始形式

輸入：$T={(x_1,y_1),(x_2,y_2),\dots,(x_N,y_N)}\ x_i\in \cal X=\bf R^n\mit , y_i\in \cal Y\it ={-1,+1}, i=1,2,\dots,N; \ \ 0<\eta\leqslant 1$

輸出：$w,b;f(x)=sign(w\cdot x+b)$

選取初值$w_0,b_0$

訓練集中選取數據$(x_i,y_i)$

如果$y_i(w\cdot x_i+b)\leqslant 0$ $$ w\leftarrow w+\eta y_ix_i \nonumber\ b\leftarrow b+\eta y_i $$

轉至(2)，直至訓練集中沒有誤分類點

註意這個原始形式中的叠代公式，可以對$x$補1，將$w$和$b$合並在一起.

對偶形式

輸入：$T={(x_1,y_1),(x_2,y_2),\dots,(x_N,y_N)}\ x_i\in \cal X=\bf R^n\mit , y_i\in \cal Y\it ={-1,+1}, i=1,2,\dots,N; \ \ 0<\eta\leqslant 1$

輸出： $$ \alpha ,b; f(x)=sign\left(\sum_{j=1}^N\alpha_jy_jx_j\cdot x+b\right)\nonumber\ \alpha=(\alpha_1,\alpha_2,\cdots,\alpha_N)^T $$

$\alpha \leftarrow 0,b\leftarrow 0$

訓練集中選取數據$(x_i,y_i)$

如果$y_i\left(\sum_{j=1}^N\alpha_jy_jx_j\cdot x+b\right) \leqslant 0?$ $$ \alpha_i\leftarrow \alpha_i+\eta \nonumber\ b\leftarrow b+\eta y_i $$

轉至(2)，直至訓練集中沒有誤分類點

Gram matrix

對偶形式中，訓練實例僅以內積的形式出現。

為了方便可預先將訓練集中的實例間的內積計算出來並以矩陣的形式存儲，這個矩陣就是所謂的Gram矩陣 $$ G=[x_i\cdot x_j]_{N\times N} \nonumber $$

例子

例2.1

這個例子裏面$\eta = 1$

感知機學習算法由於采用不同的初值或選取不同的誤分類點，解可以不同。

另外，在這個例子之後，證明算法收斂性的部分，有一段為了便於敘述與推導的描述，提到了將偏置並入權重向量的方法，這個在涉及到內積計算的時候可能都可以用到，可以擴展閱讀CH06，CH07部分的內容描述。

例2.2

這個例子也簡單，註意兩點

$\eta=1$
$\alpha_i\leftarrow \alpha_i+1, b\leftarrow b+y_i$

以上：

為什麽$\eta$選了1，這樣得到的值數量級是1
這個表達式中用到了上面的$\eta=1$這個結果，已經做了簡化

所以，這裏可以體會下，調整學習率$\eta $的作用。學習率決定了參數空間。

Logic_01

經常被舉例子的異或問題^1，用感知機不能實現，因為對應的數據非線性可分。但是可以用感知機實現其他邏輯運算，也就是提供對應的邏輯運算的數據，然後學習模型。

這個例子的數據是二元的，其中NOT運算只針對輸入向量的第一個維度

Logic_02

這個例子的數據是三元的.

MNIST_01

這個選擇兩類數據進行區分，不同的選擇應該得到的結果會有一定差異，數據不上傳了，在sklearn裏面有相應的數據，直接引用了，註意測試案例裏面用的是01，相對來講好區分一些。

李航《統計學習方法》CH02

李航—統計學習方法筆記（一）

什麼是獨立同分布？百度：在概率統計理論中，指隨機過程中，任何時刻的取值都為隨機變數，如果這些隨機變數服從同一分佈，並且互相獨立，那麼這些隨機變數是獨立同分布。如果隨機變數X1和X2獨立，是指X1的取值不影響X2的取值，X2的取值也不影響X1的取值且隨機變數X1和X2服從同一分佈，這意味著X1和X2具有

李航統計學習方法查缺補漏

矩陣的微積分 https://zhuanlan.zhihu.com/p/28956839 獨立同分布歐式空間標註問題聯合概率分佈貝葉斯統計 https://www.zhihu.com/question/21134457 似然函式和概率密度函式 https://www.zhihu.co

李航統計學習方法之樸素貝葉斯法（含python及tensorflow實現）

樸素貝葉斯法樸素貝葉斯法數學表示式後驗概率最大化的含義樸素貝葉斯是一個生成模型。有一個強假設：條件獨立性。我們先看下樸素貝葉斯法的思想，然後看下條件獨立性具體數學表示式是什麼樣的。

李航-統計學習方法-習題-第九章

9.2 證明引理 9.2. 引理 9.2 若P~θ(Z)=P(Z∣Y,θ)\widetilde P_\theta(Z)=P(Z|Y,\theta)Pθ(Z)=P(Z∣Y,θ)，則 F(P~,θ)=lo

演算法工程師修仙之路：李航統計學習方法（一）

第1章統計學習方法概論統計學習統計學習的特點統計學習（statistical learning）是關於計算機基於資料構建概率統計模型並運用模型對資料進行預測與分析的一門學科，統計學習也稱為統計機器學習（statistical machine learnin

李航·統計學習方法筆記·第6章 logistic regression與最大熵模型（1）·邏輯斯蒂迴歸模型

第6章 logistic regression與最大熵模型（1）·邏輯斯蒂迴歸模型標籤（空格分隔）：機器學習教程·李航統計學習方法邏輯斯蒂：logistic 李航書中稱之為：邏輯斯蒂迴歸模型周志華書中稱之為：對數機率迴歸模

李航統計學習方法習題5.1

定義5.3（資訊增益比）特徵A對訓練資料集D的資訊增益比定義為其資訊增益與訓練資料集D關於特徵A的值的熵之比，即

李航統計學習方法第五章決策樹課後習題答案

決策樹是一種基本的分類和迴歸方法。決策樹呈樹形結構，在分類問題中，表示基於特徵對例項進行分類的過程。它可以認為是if-then規則的集合，也可以認為是定義在特徵空間和類空間上的條件概率分佈。學習時，利用訓練資料，根據損失函式最小化的原則建立決策樹模型。預測時，對

李航-統計學習方法筆記（一）：統計學習方法概論

對象統計學技術分享精確結束人的發生 abs 速度本系列筆記，主要是整理統計學習方法的知識點和代碼實現各個方法，來加強筆者對各個模型的理解，為今年找到好工作來打下基礎。計劃在一個月內更新完這本書的筆記，在此立一個flag: 從2019/2/17開始到 20

李航統計學習採用C4.5演算法構建決策樹

from numpy import * from math import log import operator def calcShannonEnt(dataset): numdataset=len(dataset) labelCount={}

李航《統計學習方法》CH02

三元由於 nis mir 集合體會 .com 測試 git CH02 感知機前言章節目錄感知機模型感知機學習策略數據集的線性可分性感知機學習策略感知機學習算法感知機學習算法感知機學習算法的原始形式算法的收斂性感知機學習

《統計學習方法（李航）》講義第04章樸素貝葉斯

ima .cn 效率常用 1-1 估計實現技術 com 樸素貝葉斯(naive Bayes) 法是基於貝葉斯定理與特征條件獨立假設的分類方法。對於給定的訓練數據集，首先基於特征條件獨立假設學習輸入/輸出的聯合概率分布；然後基於此模型，對給定的輸入x，利用貝

《統計學習方法（李航）》講義第05章決策樹

lan 定義 if-then 利用建立 then 統計來源根據決策樹(decision tree) 是一種基本的分類與回歸方法。本章主要討論用於分類的決策樹。決策樹模型呈樹形結構，在分類問題中，表示基於特征對實例進行分類的過程。它可以認為是if-then

李航老師的《統計學習方法》第二章算法的matlab程序

com b+ -1 print nbsp 一個 while alpha 學習參考了http://blog.sina.com.cn/s/blog_bceeae150102v11v.html#post % 感知機學習算法的原始形式，算法2.1參考李航《統計學習方法》書中第

李航《統計學習方法》CH03

CH03 k近鄰法前言章節目錄 k近鄰演算法 k近鄰模型模型距離度量 k值選擇分類決策規則 k近鄰法的實現: KDTree 構造KDTree 搜尋KDTree 導讀 kNN是一種基本分類與迴歸方法

統計學習方法李航讀書筆記

************************************************************ 李航教授《統計學習方法》統計學教材總結主要介紹監督學習方法 ***************************************************

《統計學習方法》(李航)讀書筆記(完結)超級火爆的總結

閱讀目錄知識點感知機 k近鄰法樸素貝葉斯決策樹 logistic迴歸和最大熵模型支援向量機提升方法 EM演算法隱馬爾可夫模型(HMM) 統計學習方法總結神經網路 K-Means

深度學習，周志華，機器學習，西瓜書，TensorFlow，Google，吳軍，數學之美，李航，統計學習方法，吳恩達，深度學習筆記，pdf下載

1. 機器學習入門經典，李航《統計學習方法》 2. 周志華的《機器學習》pdf 3.《數學之美》吳軍博士著pdf 4. Tensorflow 實戰Google深度學習框架.pdf 5.《TensorFlow實戰》黃文堅高清完整PDF 6. 復旦大

統計學習方法_李航_筆記

統計學習方法_李航因本人剛開始寫部落格，學識經驗有限，如有不正之處望讀者指正，不勝感激；也望藉此平臺留下學習筆記以溫故而知新。這一篇文章介紹的是李航的統計學習方法一書的第一遍學習筆記。統計學習方法概論統計學習方法概論統計學習的物件是資

統計學習方法（李航）筆記

感知機/k近鄰/貝葉斯/決策樹前言：有時候公式實在不好理解的時候可以看一道例題理解，或者執行程式debug除錯逐步看輸入輸出變化進行理解！第二章感知機感知機概念輸入到輸出空間的對映：f(x) =sign(w*x+b) sign函式如下：感知器是一種線性分類器模型，屬於

李航《統計學習方法》CH02

CH02 感知機

前言

章節目錄

導讀

三要素

模型

策略

損失函數選擇

算法

原始形式

對偶形式

例子

例2.1

例2.2

Logic_01

Logic_02

MNIST_01

相關推薦