感知機(Perceptron)是二分類問題的線性分類模型，其輸入為例項的特徵向量，輸出為例項的類別，取+1和-1二值。

感知機於輸入空間（特徵空間）中將例項劃分為正負兩類的分離超平面，屬於判別模型。感知機於1957年由Rosenblatt提出，是神經網路和支援向量機的基礎。

在這裡，不用《統計學習方法》書中的變量表示方式，我們用 $技術分享$ 表示資料集，一共 $技術分享$ 個樣本， $技術分享$ 個維度，用 $技術分享$ 表示資料集中的第 $技術分享$ 個樣本，用 $技術分享$ 表示標記（類別）向量， $技術分享$ 代表第 $技術分享$ 個樣本 $技術分享$ 的標記。

我們將要學習的目標函式是：

$技術分享$

稱為感知機。其中， $技術分享$ 和 $技術分享$ 為感知機模型引數， $技術分享$ 為權值向量， $技術分享$ 叫作偏置（bias）， $技術分享$ 表示 $技術分享$ 和 $技術分享$ 的內積。 $技術分享$ 是符號函式，即：

$技術分享$

所以，在這裡 $技術分享$ ，根據上式可知 $技術分享$ 時為分類的邊界（超平面

）。

對於資料集 $技術分享$ ，如果能夠將資料集的正負樣例完全正確地劃分到超平面的兩側，即對於所有 $技術分享$ 的例項 $技術分享$ 有 $技術分享$ ，對於所有 $技術分享$ 的例項 $技術分享$ 有 $技術分享$ ，則稱這個資料集為線性可分的資料集，否則資料集線性不可分。

假設資料集是線性可分的，感知機的學習目標是求得一個能夠將訓練集正負樣例能夠完全分開的超平面。找出這樣的超平面，其實就是要確定感知機的模型引數 $技術分享$ 和 $技術分享$ 。所以我們首先要定義損失函式，再將其最小化。

感知機的損失函式是針對誤分類的點，最小化誤分類的點到超平面的距離，不斷進行調整。

對於輸入空間的任一一個樣例 $技術分享$ ，所要計算的距離就是這個點到 $技術分享$ 的距離。

根據點到直線的距離公式：

技術分享

代入其中，可以得到：

$技術分享$

進一步，進行簡化約等，可以得到如下式子：

$技術分享$

其中， $技術分享$

是 $技術分享$ 的 $技術分享$ 範數。

對於誤分類的樣例 $技術分享$ 來說， $技術分享$ 成立。所以誤分類的點到超平面的距離為：

$技術分享$

假如對於所有的誤分類點集合為 $技術分享$ ，那麼所有的誤分類點到超平面的總距離為：

$技術分享$

不考慮 $技術分享$ ，就得到了感知機的損失函式：

$技術分享$

顯然，損失函式 $技術分享$ 是非負的，如果沒有誤分類的點，損失函式的值為0。並且，誤分類點越少，誤分類點離超平面越近，損失函式越小。所以對於完全線性可分的資料集，當損失函式 $技術分享$ 為0時，即達到了完全正確分類。

這個損失函式可以用梯度下降法來解，對於 $技術分享$ 和 $技術分享$ 的梯度用偏導可以直接求出來，具體過程不再贅述。

感知機學習策略

給定一個線性可分的資料集

T={(x1,y1),(x2,y2),...(xN,yN)} 其中xi∈X=Rn，yi∈Y={

+1,−1}，i=1,2,3,...N 。
為了確定感知機模型的引數w和b，需要確定一個學習策略，即定義一個損失函式並將損失函式極小化。感知機採用的損失函式為誤分類點到超平面的總距離。首先寫出輸入空間Rn中任一點x0到分離超平面的距離 1∥w∥|w⋅x0+b| 這裡∥w∥ 是w的L2範數。
其次對於誤分類的資料(xi,yi)來說， −yi(w⋅xi+b)>0 因為當w⋅xi+b>0，yi=−1，而當w⋅xi+b<0，yi=+1。因此誤分類點xi到超平面的距離是 −1∥w∥yi(w⋅xi+b) 這樣假設誤分類點的集合為M，那麼所有誤分類點到超平面的總距離為 −1∥w∥∑xi∈Myi(w⋅xi+b) 不考慮1∥w∥，就得到感知機學習的損失函式 L(w,b)=−∑xi∈Myi(w⋅xi+b) 顯然，損失函式L(w,b)是非負的。如果沒有誤分類點，損失函式值為0，而且，誤分類點越少，誤分類點離超平面越近，損失函式的值越小。
感知機學習的策略是在假設空間中選取使損失函式最小的模型引數w,b。

感知機學習演算法

感知機學習演算法是誤分類驅動的，具體採用隨機梯度下降法。首先，任意選取一個超平面w0,b0，然後用梯度下降法不斷地極小化損失函式。極小化過程中不是一次使M中所有誤分類點的梯度下降，而是一次隨機選取一個誤分類點使其梯度下降。損失函式L(w,b)的梯度為

∇wL(w,b)=−∑xi∈Myixi ∇bL(w,b)=−∑xi∈Myi 隨機選取一個誤分類點(xi,yi)，對w,b進行更新： w←w+ηyixi b←b+ηyi 式中η(0<η≤1)是步長，在統計學習中又稱為學習率。

綜上所述，得到如下演算法(感知機學習演算法的原始形式)
輸入：訓練集T={(x1,y1),(x2,y2),...(xN,yN)}，其中xi∈X=Rn，yi∈Y={+1,−1}，i=1,2,3,...N ；學習率η(0<η≤

感知機演算法原理及推導

感知機學習策略

感知機學習演算法

感知機演算法原理及推導

【機器學習】支援向量機SVM原理及推導

《李航：統計學習方法》--- 感知機演算法原理與實現

帶你搞懂感知機演算法原理

多層感知機（MLP）演算法原理及Spark MLlib呼叫例項（Scala/Java/Python）

MLlib--多層感知機（MLP）演算法原理及Spark MLlib呼叫例項（Scala/Java/Python）

【支援向量機SVM】演算法原理公式推導 python程式設計實現

機器學習整合演算法XGBoost原理及推導

感知機演算法及實現

機器學習演算法原理與實踐（六）、感知機演算法

【機器學習】演算法原理詳細推導與實現(四):支援向量機(上)

【機器學習】演算法原理詳細推導與實現(五):支援向量機(下)

光纖鐳射打標機的原理及特點

感知機演算法（Perceptron Learning Algorithm）和程式碼實現（Python）

教你6步從頭寫機器學習演算法——以感知機演算法為例

Canny邊緣檢測演算法原理及C語言實現詳解

【GAN】GAN的原理及推導

加密演算法原理及DNS服務原理

【機器學習】Apriori演算法——原理及程式碼實現（Python版）

SVM演算法原理及Python實現

感知機演算法原理及推導

感知機學習策略

感知機學習演算法

相關推薦