基於kNN的人臉識別演算法

阿新 • • 發佈：2021-08-15

摘要：

本次實驗嘗試通過將人臉的影象轉化為特徵向量，然後訓練資料集，通過計算尤拉距離找到與待測人臉最接近的k個人臉，這樣對人臉進行歸類識別實現一個基於KNN 的人臉識別演算法，來達到人臉識別的入門級學習。
演算法簡介:

KNN演算法假設給定一個訓練資料集，其中的例項類別已定。分類時，對新的例項，根據其 k 個最近鄰的訓練例項的類別，通過多數表決等方式進行預測。因此，KNN演算法不具有顯式的學習過程。
KNN演算法實際上利用訓練資料集對特徵向量空間進行劃分，並作為其分類的“模型”。 k值的選擇、距離度量以及分類決策規則是k近鄰演算法的三個基本要素。
演算法流程:

1.假設有一個帶有標籤的樣本資料集（訓練樣本集），其中包含每條資料與所屬分類的對應關係。遍歷訓練資料集，計算預測樣本與其他每一個樣本點的距離，按照由近到遠排序。完成訓練得到訓練後的資料集After training Data Set

2.定義一個KNN引數k 值（1<=k<=20）,表示納入投票決策的樣本數

3.輸入沒有標籤的新資料後，將新資料的每個特徵與樣本集中資料對應的特徵進行比較(進行測試集的測試)。
4.取前 k個樣本資料對應的分類標籤。求 k 個數據中出現次數最多的分類標籤作為新資料的分類。
實驗環境:

python版本為：python-3.8.1，所需執行庫有matplotlib、numpy及pillow

原始碼：

import matplotlib.pyplot as plt
from PIL import Image, ImageFilter
import numpy
import heapq

dataBase="data_base"
persons=[]
faces=[]
for i in range(1, 41):
    persons.append("s" + str(i))
for i in range(1, 11):
    faces.append(str(i) + ".pgm")

def parseImageToVector(path):
    """
    功能：將影象轉換為特徵向量
    輸入：影象的路徑
    返回值：特徵向量（numpy一維陣列)
    """
    img = numpy.array(Image.open(path)) 
    return img.flatten()

def eularDistance(vec1, vec2):
    """
    功能：計算兩個特徵向量的eular距離
輸入：特徵向量1，2
返回值：尤拉距離
    """
    return numpy.sum(numpy.square(vec1-vec2))

def trainSetInitialization(faces):
    """
    功能：初始化訓練資料集
 輸入：用作訓練集的人臉ID列表
 返回值：初始化的資料集，（資料, 標籤, 影象）元組列表
    """
    trainSet = []
    for person in persons:
        for face in faces:
            imgPath = dataBase + "/" + person + "/" + str(face) + ".pgm"
            imgVec = parseImageToVector(imgPath)
            trainSet.append((imgVec, person, str(face)))
    return trainSet

def faceRecognition(face, trainSet, k):
    """
    功能：識別人臉，計算訓練資料集中的哪張臉與此臉相同（KNN實現）
    輸入：face陣列中的測試臉，trainDataSet訓練後的資料，kNN引數
返回：資料集中最相同的面孔的標籤
    """
    heap = [] #小根堆，儲存（距離，標號，人臉）元組
    neighbors = [] # 儲存前k個點的資訊
    result = {} # { key : val } 表示一組k近鄰點中 { 標籤 : 標籤數量(1<=n<=k) }
    # 計算前k個最近的點，壓入小根堆heap
    for trainData in trainSet:
        # trainData[1]對應person標籤, trainData[0]對應該標籤下的某個特徵向量
        heapq.heappush(heap, (eularDistance(face, trainData[0]), trainData[1], trainData[2]) ) 

    # 找到前k個最近的點中數量最多的標籤，並加入結果result
    for i in range(k):
        first = heapq.heappop(heap)
        top = first[1] # 標籤
        topImg = first[2] # 影象
        neighbors.append((top, topImg))
        if top in result:
            result[top] = result[top] + 1
        else:
            result[top] = 1
    maximum = (None, 0)
    for label in result:
        if result[label] > maximum[1]:
            maximum = (label, result[label])
    # 顯示資訊
    print("測試所屬標籤:" + maximum[0])
    print("各標籤對應的數量" + str(result))
    print("與目標k近鄰的人臉資訊:")
    for neighbor in neighbors:
        path = dataBase + "/" + neighbor[0] + "/" + neighbor[1] + ".pgm"
        print(path)
    print("-------------分界線--------------")
    return maximum[0]

def main():
    fault = 0
    total = 0
    kList = []
    misclassificationRateList = []
    for k in range(1, 21):
        for testIndex in range(1, 11):
            # 初始化訓練集
            trainImages = []
            for trainImage in range(1,11):
                trainImages.append(trainImage)
            trainImages.remove(testIndex)
            trainSet = trainSetInitialization(trainImages)

            # 測試
            for person in persons:
                path = dataBase + "/" + person + "/" + str(testIndex) + ".pgm"
                faceVec = parseImageToVector(path)
                print("測試人臉的路徑:" + path)
                result = faceRecognition(faceVec, trainSet, k)
                if person != result:
                    fault = fault + 1
                total = total + 1
        kList.append(k)
        misclassificationRateList.append(fault / total)
        print("misclassification rate:", fault / total)
    # 顯示影象   
    plt.plot(kList, misclassificationRateList, alpha=0.7)
    plt.xticks(kList, kList)
    plt.ylabel("Misclassification Rate")
    plt.show()

if __name__ == "__main__":
    main()

實驗結果及分析:

報告pdf

基於kNN的人臉識別演算法

摘要：本次實驗嘗試通過將人臉的影象轉化為特徵向量，然後訓練資料集，通過計算尤拉距離找到與待測人臉最接近的k個人臉，這樣對人臉進行歸類識別實現一個基於KNN 的人臉識別演算法，來達到人臉識別的入門級學習。

基於matlab車牌識別演算法

牌照自動識別是一項利用車輛的動態視訊或靜態影象進行牌照號碼、牌照顏色自動識別的模式識別技術。其硬體基礎一般包括觸發裝置、攝像裝置、照明裝置、影象採集裝置、識別車牌號碼的處理機等，其軟體核心包括

利用GO整合百度AI人臉識別演算法的開發實踐

隨著人工智慧技術的普遍應用，越來越多的行業也融入了AI智慧檢測分析技術，開啟智慧化時代。TSINGSEE青犀視訊也積極在旗下視訊平臺中融入AI技術，比如人臉識別、車輛識別、車牌識別、行為分析等。目前我們正在基於Ea

AI智慧視訊平臺如何切換人臉識別演算法？

人工智慧的細分領域很廣泛，市場目前比較普及的是計算機視覺、語音識別、自然語言處理、深度學習、智慧機器人、自動駕駛等等。隨著AI技術的階段性成熟，人工智慧應用已經在社會發展中的方方面面發揮著重要的作用。

Python基於Dlib的人臉識別系統的實現

之前已經介紹過人臉識別的基礎概念，以及基於opencv的實現方式，今天，我們使用dlib來提取128維的人臉嵌入，並使用k臨近值方法來實現人臉識別。

基於語法樹的語句識別演算法

>>> 需求分析自然語言處理的人機對話中，使用者的語句表達具有多樣性，例如“我喜歡你”、“你被我喜歡著”表達的是同一個意思，如何讓計算機理解識別這些多樣化的句子，面對各式各樣的同

基於Python與命令列人臉識別專案

Face Recognition 人臉識別摘要：本專案face_recognition是一個強大、簡單、易上手的人臉識別開源專案，並且配備了完整的開發文件和應用案例，方便大家使用。對於本專案可以使用Python和命令列工具提取、識別、操作

人臉識別（基於阿里雲）

技術標籤：JAVA阿里雲人臉識別視訊截圖LiveChannel工具LiveChannel推流通道 pom.xml

opencv(python)使用knn最近鄰演算法識別手寫數字

技術標籤：OPenCVopencvpythonknn手寫數字識別 knn最近鄰演算法是一種分類以及迴歸演算法，演算法原理是一個樣本與樣本集中k個樣本最相似，如果這k個樣本的大多數也屬於同一個類別，則該樣本也屬於這一類。關於k

python基於opencv實現人臉識別

將opencv中haarcascade_frontalface_default.xml檔案下載到本地，我們呼叫它輔助進行人臉識別。

詳解基於Facecognition+Opencv快速搭建人臉識別及跟蹤應用

人臉識別技術已經相當成熟，面對滿大街的人臉識別應用，像單位門禁、刷臉打卡、App解鎖、刷臉支付、口罩檢測........

基於Facecognition+Opencv快速搭建人臉識別及跟蹤應用

技術標籤：python人臉識別機器學習人臉識別技術已經相當成熟，面對滿大街的人臉識別應用，像單位門禁、刷臉打卡、App解鎖、刷臉支付、口罩檢測........

python基於opencv庫的人臉識別總結

一、基本過程 1人臉檢測2影象獲取3模型訓練（包含人臉特徵值）4讀取模型進行人臉識別

【人臉識別】基於matlab GUI BP神經網路人臉識別（含識別率）【含Matlab原始碼 891期】

一、簡介 1 概述 BP（Back Propagation）神經網路是1986年由Rumelhart和McCelland為首的科研小組提出，參見他們發表在Nature上的論文 Learning representations by back-propagating errors 。

【人臉識別】基於matlab GUI Gabor+SVM比較PCA+SVM人臉識別【含Matlab原始碼 685期】

一、簡介 Gabor+SVM：利用Gabor程式實現對人臉的特徵提取，然後用SVM進行分類；

【人臉識別】基於matlab PCA+LDA人臉識別【含Matlab原始碼 680期】

一、簡介 1 PCA 1.1 資料降維降維的方法包括：主成分分析（PCA）、因子分析（FA）、和獨立成分分析（ICA）

【人臉識別】基於matlab GUI膚色人臉識別定位【含Matlab原始碼 674期】

一、簡介人臉檢測是人臉識別、人機互動、智慧視覺監控等:工作的前提。近年來,在模式識別與計算機視覺領域,人臉檢測已經成為一個受到普遍重視、研究十分活躍的方向。本文針對複雜背景下的彩色正面人臉影象，將膚色分

【人臉識別】基於matlab GUI人臉實時檢測與跟蹤【含Matlab原始碼 673期】

一、簡介如何在視訊流中檢測到人臉以及人臉追蹤。物件檢測和跟蹤在許多計算機視覺應用中都很重要，包括活動識別，汽車安全和監視。所以這篇主要總結MATLAB的人臉檢測和跟蹤。

【人臉識別】基於matlab HOG特徵提取人臉識別【含Matlab原始碼 641期】

一、簡介方向梯度直方圖(Histogram of Oriented Gradient,HOG)是用於在計算機視覺和影象處理領域，目標檢測的特徵描述子。該項技術是用來計算影象區域性出現的方向梯度次數或資訊進行計數。此種方法跟邊緣方向直方圖

【人臉識別】基於GUI FISHER人臉識別【含Matlab原始碼 605期】

一、簡介應用統計方法解決模式識別問題時，一再碰到的問題之一就是維數問題。在低維空間裡解析上或計算上行得通的方法，在高維空間裡往往行不通。因此，降低維數有時就會成為處理實際問題的關鍵。

基於kNN的人臉識別演算法

相關推薦