OpenCV人臉識別之二：模型訓練

阿新 • • 發佈：2022-05-03

本系列人臉識別文章用的是opencv2，最新版的opencv3.2的程式碼請參考文章：

OpenCV之識別自己的臉——C++原始碼放送（請在上一篇文章末尾檢視）

在該系列第一篇《OpenCV人臉識別之一：資料收集和預處理》文章中，已經下載了ORL人臉資料庫，並且為了識別自己的人臉寫了一個拍照程式自拍。之後對拍的照片進行人臉識別和提取，最後我們得到了一個包含自己的人臉照片的資料夾s41。在部落格的最後我們提到了一個非常重要的檔案——at.txt。

1、csv檔案的生成

當我們寫人臉模型的訓練程式的時候，我們需要讀取人臉和人臉對應的標籤。直接在資料庫中讀取顯然是低效的。所以我們用csv檔案讀取。csv檔案中包含兩方面的內容，一是每一張圖片的位置所在，二是每一個人臉對應的標籤，就是為每一個人編號。這個at.txt就是我們需要的csv檔案。生成之後它裡面是這個樣子的：

前面是圖片的位置，後面是圖片所屬人臉的人的標籤。

要生成這樣一個檔案直接用手工的方式一個一個輸入顯然不可取的，畢竟這裡有400多張圖片。而且這種重複性的工作估計也沒人想去做。所以我們可以用命令列的方式簡化工作量；或者用opencv自帶的Python指令碼來自動生成。

命令列方式是這樣的。比如我的資料集在C:UsersbingbuyuDownloadsatt_faces資料夾下面，我就用下面兩行命令：

然後資料集資料夾下面就多出了一個at.txt檔案，但是現在是隻有路徑沒有標籤的。像下面這樣：

標籤需要手動敲上去。。。也挺麻煩的。

好在opencv教程裡面為我們提供了自動生成csv檔案的指令碼。路徑類似這樣：F:opencvsourcesmodulescontribdocfacerecsrccreate_csv.py。我不知道怎麼用命令列引數的形式執行Python指令碼，所以只能把程式碼裡面的BASE_PATH手動的改成自己的資料集路徑，改完大致是這樣：

#!/usr/bin/env python
 import sys
import os.path
 # This is a tiny script to help you creating a CSV file from a face
# database with a similar hierarchie:
#
#  philipp@mango:~/facerec/data/at$ tree
#  .
#  |-- README #  |-- s1
#  |   |-- 1.pgm #  |   |-- ...
#  |   |-- 10.pgm
 #  |-- s2
#  |   |-- 1.pgm
#  |   |-- ...
#  |   |-- 10.pgm
#  ...
#  |-- s40
 #  |   |-- 1.pgm
#  |   |-- ...
#  |   |-- 10.pgm
#
 if __name__ == "__main__":      
#if len(sys.argv) != 2:     
#    print "usage: create_csv <base_path>"     
#    sys.exit(1)      
#BASE_PATH=sys.argv[1]     
BASE_PATH="C:/Users/bingbuyu/Downloads/att_faces"      
SEPARATOR=";"      
fh = open("../etc/at.txt",'w')      
label = 0     
for dirname, dirnames, filenames in os.walk(BASE_PATH):         
for subdirname in dirnames:             
subject_path = os.path.join(dirname, subdirname)             
for filename in os.listdir(subject_path):                 
abs_path = "%s/%s" % (subject_path, filename)                 
print "%s%s%d" % (abs_path, SEPARATOR, label)                
 fh.write(abs_path)                 
fh.write(SEPARATOR)                
 fh.write(str(label))                
 fh.write("n")                   
label = label + 1
 fh.close()

然後執行這個指令碼就可以生成一個既有路徑又有標籤的at.txt了。

2、訓練模型

現在資料集、csv檔案都已經準備好了。接下來要做的就是訓練模型了。

這裡我們用到了opencv的Facerecognizer類。opencv中所有的人臉識別模型都是來源於這個類，這個類為所有人臉識別演算法提供了一種通用的介面。文件裡的一個小段包含了我們接下來要用到的幾個函式：

OpenCV 自帶了三個人臉識別演算法：Eigenfaces，Fisherfaces 和區域性二值模式直方圖 (LBPH)。這裡先不去深究這些演算法的具體內容，直接用就是了。如果有興趣可以去看相關論文。接下來就分別訓練這三種人臉模型。這個時候就能體現出Facerecognizer類的強大了。因為每一種模型的訓練只需要三行程式碼：

  Ptr<FaceRecognizer> model = createEigenFaceRecognizer();     model->train(images, labels);     model->save("MyFacePCAModel.xml");      Ptr<FaceRecognizer> model1 = createFisherFaceRecognizer();     model1->train(images, labels);     model1->save("MyFaceFisherModel.xml");      Ptr<FaceRecognizer> model2 = createLBPHFaceRecognizer();     model2->train(images, labels);     model2->save("MyFaceLBPHModel.xml");
當然在這之前要先把之前圖片和標籤提取出來。這時候就是at.txt派上用場的時候了。
//使用CSV檔案去讀影象和標籤，主要使用stringstream和getline方法
static void read_csv(const string& filename, vector<Mat>& images, vector<int>& labels, char separator = ';') {     
std::ifstream file(filename.c_str(), ifstream::in);     
if (!file) {         
string error_message = "No valid input file was given, please check the given filename.";         CV_Error(CV_StsBadArg, error_message);     
}     
string line, path, classlabel;     
while (getline(file, line)) {         
stringstream liness(line);         
getline(liness, path, separator);         
getline(liness, classlabel);        
 if (!path.empty() && !classlabel.empty()) {             
images.push_back(imread(path, 0));             
labels.push_back(atoi(classlabel.c_str()));        
 }
    }
}

在模型訓練好之後我們拿資料集中的最後一張圖片做一個測試，看看結果如何。

Mat testSample = images[images.size() - 1]; int testLabel = labels[labels.size() - 1]; <span style="white-space:pre"> </span>//。。。。這裡省略部分程式碼。。。。。。。。 // 下面對測試影象進行預測，predictedLabel是預測標籤結果 int predictedLabel = model->predict(testSample); int predictedLabel1 = model1->predict(testSample); int predictedLabel2 = model2->predict(testSample); // 還有一種呼叫方式，可以獲取結果同時得到閾值: // int predictedLabel = -1; // double confidence = 0.0; // model->predict(testSample, predictedLabel, confidence); string result_message = format("Predicted class = %d / Actual class = %d.", predictedLabel, testLabel); string result_message1 = format("Predicted class = %d / Actual class = %d.", predictedLabel1, testLabel); string result_message2 = format("Predicted class = %d / Actual class = %d.", predictedLabel2, testLabel); cout << result_message << endl; cout << result_message1 << endl; cout << result_message2 << endl;

由於本來的資料集中是40個人，加上自己的人臉集就是41個。標籤是從0開始標的，所以在這裡我是第40個人。也即是說Actual class應該40。Predicted class也應該是40才說明預測準確。這裡我們可以看到結果：

結果正確。

模型訓練的全部程式碼:

//#include "stdafx.h"
#include <opencv2/opencv.hpp>
 #include <iostream>
#include <fstream>
#include <sstream>
#include <math.h>
using namespace cv;
using namespace std;
static Mat norm_0_255(InputArray _src) {     
Mat src = _src.getMat();     
// 建立和返回一個歸一化後的影象矩陣:     
Mat dst;     
switch (src.channels()) {     
case1:         
cv::normalize(_src, dst, 0, 255, NORM_MINMAX, CV_8UC1);         
break;     
case3:        
 cv::normalize(_src, dst, 0, 255, NORM_MINMAX, CV_8UC3);         
break;     
default:         
src.copyTo(dst);        
break;     
}    
 return dst; }
//使用CSV檔案去讀影象和標籤，主要使用stringstream和getline方法
static void read_csv(const string& filename, vector<Mat>& images, vector<int>& labels, char separator = ';') {     
std::ifstream file(filename.c_str(), ifstream::in);     
if (!file) {         
string error_message = "No valid input file was given, please check the given filename.";         CV_Error(CV_StsBadArg, error_message);    
 }     
string line, path, classlabel;     
while (getline(file, line)) {         
stringstream liness(line);         
getline(liness, path, separator);         
getline(liness, classlabel);         
if (!path.empty() && !classlabel.empty()) {             
images.push_back(imread(path, 0));             
labels.push_back(atoi(classlabel.c_str()));        
 }   
  }
 }
 int main()
 {     
//讀取你的CSV檔案路徑.     
//string fn_csv = string(argv[1]);     
string fn_csv = "at.txt";     
// 2個容器來存放影象資料和對應的標籤     
vector<Mat> images;     
vector<int> labels;     
// 讀取資料. 如果檔案不合法就會出錯     
// 輸入的檔名已經有了.    
 try    
 {         
read_csv(fn_csv, images, labels);     
}    
 catch (cv::Exception& e)     
{         
cerr << "Error opening file "" << fn_csv << "". Reason: " << e.msg << endl;         
// 檔案有問題，我們啥也做不了了，退出了         
exit(1);     
}     
// 如果沒有讀取到足夠圖片，也退出.    
 if (images.size() <= 1) {         
string error_message = "This demo needs at least 2 images to work. Please add more images to your data set!";         
CV_Error(CV_StsError, error_message);     
}     
// 下面的幾行程式碼僅僅是從你的資料集中移除最後一張圖片     
//[gm:自然這裡需要根據自己的需要修改，他這裡簡化了很多問題]     
Mat testSample = images[images.size() - 1];     
int testLabel = labels[labels.size() - 1];     
images.pop_back();     
labels.pop_back();     
// 下面幾行建立了一個特徵臉模型用於人臉識別，     
// 通過CSV檔案讀取的影象和標籤訓練它。    
 // T這裡是一個完整的PCA變換     
//如果你只想保留10個主成分，使用如下程式碼    
 //      cv::createEigenFaceRecognizer(10);     
//     
// 如果你還希望使用置信度閾值來初始化，使用以下語句：    
 //      cv::createEigenFaceRecognizer(10, 123.0);     
//     
// 如果你使用所有特徵並且使用一個閾值，使用以下語句：    
 //      cv::createEigenFaceRecognizer(0, 123.0);     
Ptr<FaceRecognizer> model = createEigenFaceRecognizer();     
model->train(images, labels);     
model->save("MyFacePCAModel.xml");     
Ptr<FaceRecognizer> model1 = createFisherFaceRecognizer();     
model1->train(images, labels);     
model1->save("MyFaceFisherModel.xml");    
 Ptr<FaceRecognizer> model2 = createLBPHFaceRecognizer();     
model2->train(images, labels);     
model2->save("MyFaceLBPHModel.xml");    
 // 下面對測試影象進行預測，predictedLabel是預測標籤結果    
int predictedLabel = model->predict(testSample);    
 int predictedLabel1 = model1->predict(testSample);     
int predictedLabel2 = model2->predict(testSample);     
// 還有一種呼叫方式，可以獲取結果同時得到閾值:     
//      int predictedLabel = -1;     
//      double confidence = 0.0;     
//      model->predict(testSample, predictedLabel, confidence);     
string result_message = format("Predicted class = %d / Actual class = %d.", predictedLabel, testLabel);     
string result_message1 = format("Predicted class = %d / Actual class = %d.", predictedLabel1, testLabel);     
string result_message2 = format("Predicted class = %d / Actual class = %d.", predictedLabel2, testLabel);     
cout << result_message << endl;

cout << result_message1 << endl;     
cout << result_message2 << endl;    
 waitKey(0);     
return 0;
 }

OpenCV人臉識別之二：模型訓練

OpenCV之識別自己的臉——C++原始碼放送（請在上一篇文章末尾檢視）

模型訓練的全部程式碼:

OpenCV人臉識別之二：模型訓練

OpenCV人臉識別之三：識別自己的臉

ubuntu16.04下如何訓練PySOT(二)：模型下載

雲原生的彈性 AI 訓練系列之二：PyTorch 1.9.0 彈性分散式訓練的設計與實現

Linux動態頻率調節系統CPUFreq之二：核心（core）架構與API【轉】

k8s學習筆記之二：使用kubeadm配置Ingress

k8s學習筆記之二：Pod

java演算法篇之二：棧和佇列

君正X2000開發板試用體驗之二：君正X2000引導過程分析

Modbus協議棧應用例項之二：Modbus RTU從站應用

Java變數與資料型別之二：Java常量與變數

syslog之二：syslog協議及rsyslog服務全解析

Java反射之二：例項化物件、介面與父類、修飾符和屬性

Object類學習之二：equals()

Node.js 學習筆記之二：基本使用

SAP CDS view自學教程之二：當SAP CDS view被啟用時，背後發生了什麼

OpenStack大規模部署優化之二：穩態優化

基於NFS實現lamp的負載均衡之二：部署NFS伺服器

從零開始部署bind9伺服器之二：部署快取伺服器

FR上的OSPF之二：BMA模式

OpenCV人臉識別之二：模型訓練

OpenCV之識別自己的臉——C++原始碼放送（請在上一篇文章末尾檢視）

模型訓練的全部程式碼:

相關推薦