自己寫簡單的感知機演算法

阿新 • • 發佈：2019-02-20

自己動手寫感知機

1 什麼是感知機?

感知機（perceptron）是一種二分類的線性分類模型，可以將所有輸入的例項劃分為True或是False兩類。感知機模型的輸入向量是例項的特徵向量，其任務就是在N維空間中尋找一個平面，讓這個平面可以正好將例項劃分為正負兩類，這個平面我們稱其為超平面。感知機是神經網路與支援向量機的基礎。

2 感知機模型

輸入空間： $χ \subseteq R^{n}$

輸出空間： $y = {+ 1, - 1}$

輸入空間到輸出的函式：

f (x) = s i g n (w \cdot x + b)

其中：

s i g n (x) = {\begin{array}{rcl} + 1 & x \geq 0 \\ - 1 & x < 0 \end{array}

幾何解釋：

函式中的 $w$ 可以理解為超平面的法向量， $b$ 為超平面的截距，超平面將整個空間分為兩部分，就是分類出來的正、負兩類。

3 感知機學習演算法

感知機學習演算法的具體策略就是使用誤分類點到超平面的距離和為損失函式，並使用梯度下降法最小化損失函式，即可求解出超平面。

原始形式

首先初始化所有引數為0，然後根據梯度下降法，用每個誤分類點來更新引數，封裝成類：

class PreceptronClassifier:
  def __init__(self,learning_rate) 
:
      self.b = 0
      self.w = []
      self.rate = learning_rate

  def func(self, x):
      # 定義模型
      res = 0.0
      for i in range(len(x)):
          res += self.w[i]*x[i]
      res += self.b
      return res

  def update(self,error_x,error_y):
      # 更新引數
      for i in range(len(error_x)):
          self.w[i] += self.rate*error_x[i]*error_y
      self.b += self.rate*error_y

  def 
 error_label(self,temp_res:list,trainY):
      # 標記誤分類點
      for i in range(len(self.w)):
          if temp_res[i] == trainY[i]:
              temp_res[i] = 0
          else:

              temp_res[i] = 1
      return temp_res

  def fit(self, trainX,trainY):
      # 初始化引數
      self.w = [0]*len(trainX[0])
      self.b = 0
      temp_res = self.prediction(trainX)
      temp_res = self.error_label(temp_res, trainY)
      train_iter = 0
      while(1 in temp_res):
          # 顯示迭代過程
          print('第'+str(train_iter)+'次迭代','w:',self.w,'b:',self.b)
          error_index = temp_res.index(1)
          self.update(trainX[error_index],trainY[error_index])
          temp_res = self.prediction(trainX)
          temp_res = self.error_label(temp_res, trainY)

  def prediction(self, testX):
      # 進行預測
      res  = []
      for x in testX:
          res.append(1 if self.func(x) > 0 else -1 )
      return res


if __name__ == '__main__':
  # 準備訓練資料和測試資料
  trainX = [[3,3],[4,3],[1,1]]
  trainY = [1,1,-1]
  testX  = [[1,2],[3,4]]
  # 建立物件，指定學習率
  pc = PreceptronClassifier(0.5)
  pc.fit(trainX,trainY)       # 訓練
  print(pc.prediction(testX)) # 測試

對偶形式

前面提到過，每次更新 $w$ 引數，使用 $w = w + η y_{i} x_{i}$ 這個式子是模型對求的偏導， $η$ 表示學習率。

所以相對於每一個例項，他們的 $y_{i} x_{i}$ 是不會變的，所以最終的的模型引數可以表示為：

w = \sum_{i - 1}^{N} α_{i} y_{i} x_{i} b = \sum_{i - 1}^{N} α_{i} y_{i}

α_{i}

表示第

i

個點被誤分類用來更新模型的次數，這就是對偶形式，下面放程式碼：

class PreceptronClassifier:
  def __init__(self,learning_rate):
      self.b = 0
      self.w = []
      self.rate = learning_rate

  def func(self, x):
      # 定義模型
      res = 0.0
      for i in range(len(x)):
          res += self.w[i]*x[i]
      res += self.b
      return res

  def update(self,error_index, trainY):
      # 更新引數
      self.a[error_index] += 1
      for i in range(len(self.w)):
          self.w[i] += self.rate*self.matrix[error_index][i]
      self.b += self.rate*trainY[error_index]

  def error_label(self,temp_res:list,trainY):
      # 標記誤分類點
      for i in range(len(self.w)):
          if temp_res[i] == trainY[i]:
              temp_res[i] = 0
          else:

              temp_res[i] = 1
      return temp_res

  def fit(self, trainX,trainY):
      # 初始化引數
      self.w = [0]*len(trainX[0])
      self.a = [0]*len(trainX)
      self.b = 0
      self.matrix = []
      for i in range(len(trainX)):
          self.matrix.append([xi*trainY[i] for xi in trainX[i]])
      temp_res = self.prediction(trainX)
      temp_res = self.error_label(temp_res, trainY)
      train_iter = 0
      while(1 in temp_res):
          train_iter += 1
          error_index = temp_res.index(1)
          self.update(error_index,trainY)
          temp_res = self.prediction(trainX)
          temp_res = self.error_label(temp_res, trainY)
          print('第'+str(train_iter)+'次迭代','w:',self.w,'b:',self.b)

  def prediction(self, testX):
      # 進行預測
      res  = []
      for x in testX:
          res.append(1 if self.func(x) > 0 else -1 )
      return res


if __name__ == '__main__':
  # 準備訓練資料和測試資料
  trainX = [[3,3],[4,3],[1,2]]
  trainY = [1,1,-1]
  testX  = [[1,2],[3,4]]
  # 建立物件，指定學習率
  pc = PreceptronClassifier(0.5)
  pc.fit(trainX,trainY)       # 訓練
  print(pc.prediction(testX)) # 測試

4 總結

感知機模型簡單且易於實現，是入門級演算法，同時又是神經網路和支援向量機的基礎。比如說神經網路的全連線層就和感知機很相似，所以這個演算法還是值得理解一下的。

初學乍練，請多多指正！

自己寫簡單的感知機演算法

自己動手寫感知機 1 什麼是感知機? 感知機（perceptron）是一種二分類的線性分類模型，可以將所有輸入的例項劃分為True或是False兩類。感知機模型的輸入向量是例項的特徵向量，其任務就是在N維空間中尋找一個平面，讓這個平面可以正

教你6步從頭寫機器學習演算法——以感知機演算法為例

自己從頭寫一個演算法，不僅能給你帶來成就感，也能幫你真正理解演算法的原理。可能你之前用 Scikit-learn 實現過演算法，但是從零開始寫個演算法簡單嗎？絕對不簡單。有些演算法要比其它演算法複雜的多，所以在寫演算法時可以先從簡單的開始，比如單層的感知機。下面就介紹機器學家 John S

感知機演算法（Perceptron Learning Algorithm）和程式碼實現（Python）

PLA演算法是機器學習中最為基礎的演算法，與SVM和Neural Network有著緊密的關係。 &n

線性判別--感知機演算法（perceptron algorithm）

感知器演算法是一種線性判別演算法，它適用於二分類模型。在這個模型中，輸入向量x\mathbf{x}x首先使用一個固定的非線性變換得到一個特徵向量ϕ(x)\phi(\mathbf{x})ϕ(x)，接著用這個特徵向量構造一個線性模型： (1)y(x)=f(wTϕ

感知機演算法

目錄簡介感知機模型感知機學習策略感知機學習演算法感知機預測感知機變體感知機演算法簡介感知機演算法是最簡單最基礎的機器學習演算法，可以用於處理最簡單的二分類任務，並且模型和學習演算法都十分簡單。感知機1957年由Rosenblatt提出，是神經網路與

機器學習入門實戰——感知機演算法實戰Iris資料集

感知機演算法實戰Iris資料集關於感知機的相關理論知識請檢視：感知機關於Iris資料集 Iris也稱鳶尾花卉資料集，是一類多重變數分析的資料集。資料集包含150個數據集，分為3類，每類50個數據，每個資料包含4個屬性。可通過花萼長度，花萼寬度，花

感知機演算法原理及推導

感知機(Perceptron)是二分類問題的線性分類模型，其輸入為例項的特徵向量，輸出為例項的類別，取+1和-1二值。感知機於輸入空間（特徵空間）中將例項劃分為正負兩類的分離超平面，屬於判別模型。感知機於1957年由Rosenblatt提出，是神經網路和支援向量機的基礎

統計學習方法——感知機演算法（基於R語言）

演算法2.1 train <- function(mat) { nr <- nrow(mat) nc <- ncol(mat) w0 <- matrix(0,nc - 1,1) b0 <- 0

感知機演算法（SVM簡化版）

1 演算法概述 1.1 工作原理感知機是二類分類線性模型，在特徵空間中，用一個超平面將正類、負類分離，我們所要做的就是求得這個超平面。使用指示函式sign作為輸入到輸出的對映，sign(w·x+b)

機器學習演算法【感知機演算法PLA】【5分鐘讀完】

本來想說3分鐘可以讀完的，但是想到自己的表達水平。我覺得可能需要多出2分鐘來理解我說的話。感知機演算法一開始這個名字，不懂的人覺得這個逼格很高，感覺很厲害的樣子，其實這個演算法很水的…. 對於這個演算法，我們只需要知道下面這幾樣東西： 1.

感知機演算法的收斂證明，詳細

之前零零散散學習機器學習，沒細扣一些證明之類的東西，感覺能夠支撐我對演算法的理解就好，最近想出去找實習了，想想還是找本書扣一下細節。推薦大家一本李航教授寫的《統計學習》寫的很通俗，本文也是對該書相應部分進行詳細備註的。（因為中間一些節點不說破看不懂，本人也是看了別人部落格才弄

感知機演算法及實現

感知機演算法定義1：假設輸入空間是χ⊆Rn\chi \subseteq R^{n}χ⊆Rn,輸出空間為γ\gammaγ={+1,-1}.輸入x∈χ\in \chi∈χ表示例項的特徵向量，對應於輸入空間的點；輸出y∈γy\in \gammay∈γ表示例項的類別。

《李航：統計學習方法》--- 感知機演算法原理與實現

感知機模型感知機是一個二類分類的線性分類模型。所謂二類分類就是它只能將例項分為正類和負類兩個類別。那麼為什麼是線性分類模型呢，我的理解是感知機學習旨在求出可以將資料進行劃分的分離超平面，而分離超平面的方程 w⋅x+b=0 為線性方程，所以感知機為線性分類模型

帶你搞懂感知機演算法原理

很多人可能聽過大名鼎鼎的SVM，這裡介紹的正是SVM演算法的基礎——感知機，感知機是一種適用於二類線性分類問題的演算法原理問題的輸入與輸出： X = {x1,x2,...,xnx1,x2,...,xn} Y = {+1, -1} 模型

Python 純手寫實現感知機模型及對偶形式

根據《統計學習方法》P29頁演算法2.1，實現感知機模型及對偶形式。演算法2.1：輸入：訓練資料集，learning rate alpha。輸出：權重w，偏置b。（1）初始化w0，b0 （2）在資料集中選定Xi，Yi帶入（3）計算Yi * (Xi * w

機器學習演算法原理與實踐（六）、感知機演算法

感知機感知機是二分類的線性分類模型，輸入為例項的特徵向量，輸出為例項的類別（取+1和-1）。感知機對應於輸入空間中將例項劃分為兩類的分離超平面。感知機旨在求出該超平面，為求得超平面匯入了基於誤分類的損失函式，利用梯度下降法對損失函式進行最優化（最優

機器學習總結2_感知機演算法(PLA)

1.正式開始之前的描述 (1) PLA：Perceptron Learning Algorithm。在正式開始之前，我想先說一下，PLA到底是幹嘛的。大部分機器學習的書以及視訊都是以感知機演算法作為開頭的。既然放在最前面，它應該就是一個很簡單的機器學

機器學習筆記（1）感知機演算法之實戰篇

我們在上篇筆記中介紹了感知機的理論知識，討論了感知機的由來、工作原理、求解策略、收斂性。這篇筆記中，我們親自動手寫程式碼，使用感知機演算法解決實際問題。先從一個最簡單的問題開始，用感知機演算法解決OR邏輯的分類。 import numpy as np import matplotlib.pyplot as

感知機演算法（PLA）程式碼實現

[TOC] ### 1. 引言在這裡主要實現感知機演算法（PLA）的以下幾種情況： - PLA演算法的原始形式（二分類） - PLA演算法的對偶形式（二分類） - PLA演算法的作圖（二維） - PLA演算法的多分類情況（包括one vs. rest 和one vs. one 兩種情況） - PLA演算法

寫給大家看的機器學習書【Part3】直觀易懂的感知機學習演算法PLA

本篇綜述前兩篇我們已經學習了機器學習的概念和組成：學習演算法 (Learning Algorithm) 根據訓練資料，從假設集合 (Hypothesis Set) 中選出最優的那個對映g : χ → Y 作為最終學得的模型，使得 g 越接近 f 越好（ g

自己寫簡單的感知機演算法

自己動手寫感知機

1 什麼是感知機?

2 感知機模型

3 感知機學習演算法

4 總結

相關推薦