PCA人臉識別學習及C語言實現

http://blog.csdn.net/jinshengtao/article/details/18599165

人臉識別主要方法：

.Eigenfaces，PCA（Principal Component Analysis），Turk and Pentland，1991

.Fisherfaces，LDA（Linear Discriminant Analysis），Belhumeur, Hespanha and Kriegman，1997

.LBPH，Local Binary Pattern Histograms，Ahonen, Hadid and Pietikäinen，2004

本文的目的，是結合人臉識別體驗一把PCA，體會其內涵：降維。另外文獻說，PCA的識別效果一般比神經網路ANN好。本文有20張人臉用於訓練，10張人臉用於測試。

訓練樣本和測試樣本來自：http://cswww.essex.ac.uk/mv/allfaces/faces94.zip

1.PCA人臉識別方法

將PCA方法用於人臉識別，其實是假設所有的人臉都處於一個低維線性空間，而且不同的人臉在這個空間中具有可分性。其具體做法是由高維影象空間經PCA變換後得到一組新的正交基，對這些正交基做一定的取捨，保留其中的一部分生成低維的人臉空間，也即是人臉的特徵子空間。PCA人臉識別演算法步驟包括：

a.人臉影象預處理【我沒做，人臉大小都是高200，寬180】

b.讀入人臉庫，訓練形成特徵子空間【特徵值、特徵向量的求法，採用我上一篇文章的QR演算法】

c.把訓練影象和測試影象投影到上一步驟中的特徵子空間上【矩陣相乘】

d.選擇一定的距離函式進行判別【歐氏距離，挑最小的匹配】

2.PCA人臉識別流程

a.讀入人臉庫，讀入每一個二維的人臉影象並轉化為一維的向量，每個人選定一定數量的人臉照片構成訓練集【共20張】，則訓練集是一個36000*20的矩陣。測試集共10張影象，每次選一張，則測試集是一個36000*1的矩陣。

樣本集：

測試集：

程式碼：

void load_data(double *T,IplImage *src,int k)
{
int i,j;
//一副影象壓縮成一維的，存在T的一列裡
for (i=0;i<IMG_HEIGHT;i++)
{
for (j=0;j<IMG_WIDTH;j++)
{
T[(i*IMG_WIDTH+j)*TRAIN_NUM+k-1]= (double)(unsigned char)src->imageData[i*IMG_WIDTH+j];
}
}
}

b.計算 PCA變換的生成矩陣Q。首先計算訓練集的協方差矩陣X，其中x1,x2,...,xn為第i副影象的描述，即xi為一個36000*1的列向量。

，

由於這個矩陣太大36000*36000，求特徵值和特徵向量比較坑，所以改為求 P=X^TX 的特徵向量和特徵值，且有如下性質：

設e是矩陣P的特徵值λ對應的特徵向量，則有：

這裡，X*e也是矩陣Q的特徵值λ對應的特徵向量，可以如此變換。

程式碼：

void calc_mean(double *T,double *m)
{
int i,j;
double temp;
for (i=0;i<IMG_WIDTH*IMG_HEIGHT;i++)
{
temp=0;
for (j=0;j<TRAIN_NUM;j++)
{
temp = temp + T[i*TRAIN_NUM+j];
}
m[i] = temp/TRAIN_NUM;
}
}
void calc_covariance_matrix(double *T,double *L,double *m)
{
int i,j,k;
double *T1;
//T = T -m
for (i=0;i<IMG_WIDTH*IMG_HEIGHT;i++)
{
for (j=0;j<TRAIN_NUM;j++)
{
T[i*TRAIN_NUM+j] = T[i*TRAIN_NUM+j] - m[i];
}
}
T1 = (double *)malloc(sizeof(double)*IMG_HEIGHT*IMG_WIDTH*TRAIN_NUM);
//L = T' * T
matrix_reverse(T,T1,IMG_WIDTH*IMG_HEIGHT,TRAIN_NUM);
matrix_mutil(L,T1,T,TRAIN_NUM,IMG_HEIGHT*IMG_WIDTH,TRAIN_NUM);
free(T1);
}

c.計算生成矩陣P的特徵值和特徵向量，並挑選合適的特徵值和特徵向量，構造特徵子空間變化矩陣。這裡P是實對稱矩陣，可以採用上一篇的方法，先進行Household變換將P變成三對角矩陣，然後使用QR迭代演算法求解特徵值和特徵向量，迭代次數60，誤差eps=0.000001，程式碼：

void cstrq(double a[],int n,double q[],double b[],double c[])
{
int i,j,k,u,v;
double h,f,g,h2;
for (i=0; i<=n-1; i++)
for (j=0; j<=n-1; j++)
{ u=i*n+j; q[u]=a[u];}
for (i=n-1; i>=1; i--)
{ h=0.0;
if (i>1)
for (k=0; k<=i-1; k++)
{ u=i*n+k; h=h+q[u]*q[u];}
if (h+1.0==1.0)
{ c[i]=0.0;
if (i==1) c[i]=q[i*n+i-1];
b[i]=0.0;
}
else
{ c[i]=sqrt(h);
u=i*n+i-1;
if (q[u]>0.0) c[i]=-c[i];
h=h-q[u]*c[i];
q[u]=q[u]-c[i];
f=0.0;
for (j=0; j<=i-1; j++)
{ q[j*n+i]=q[i*n+j]/h;
g=0.0;
for (k=0; k<=j; k++)
g=g+q[j*n+k]*q[i*n+k];
if (j+1<=i-1)
for (k=j+1; k<=i-1; k++)
g=g+q[k*n+j]*q[i*n+k];
c[j]=g/h;
f=f+g*q[j*n+i];
}
h2=f/(h+h);
for (j=0; j<=i-1; j++)
{ f=q[i*n+j];
g=c[j]-h2*f;
c[j]=g;
for (k=0; k<=j; k++)
{ u=j*n+k;
q[u]=q[u]-f*c[k]-g*q[i*n+k];
}
}
b[i]=h;
}
}
for (i=0; i<=n-2; i++) c[i]=c[i+1];
c[n-1]=0.0;
b[0]=0.0;
for (i=0; i<=n-1; i++)
{ if ((b[i]!=0.0)&&(i-1>=0))
for (j=0; j<=i-1; j++)
{ g=0.0;
for (k=0; k<=i-1; k++)
g=g+q[i*n+k]*q[k*n+j];
for (k=0; k<=i-1; k++)
{ u=k*n+j;
q[u]=q[u]-g*q[k*n+i];
}
}
u=i*n+i;
b[i]=q[u]; q[u]=1.0;
if (i-1>=0)
for (j=0; j<=i-1; j++)
{ q[i*n+j]=0.0; q[j*n+i]=0.0;}
}
相關推薦

PCA人臉識別學習及C語言實現

http://blog.csdn.net/jinshengtao/article/details/18599165 人臉識別主要方法： .Eigenfaces，PCA（Principal Component Analysis），Turk and P

OpenCv學習筆記（五）-數學形態學2（灰度級膨脹和腐蝕及c語言實現）

一基本概念所謂的灰度級膨脹和腐蝕即將而知影象的二值形態學運算推廣到灰度影象上。對於一幅影象的腐蝕（膨脹）運算定義為對每個畫素賦值為某個領域內輸入影象灰度級的最小（或最大值）。在二值變換中的結構元素只代表一個領域，而在灰度級變化中，結構元素是一個二元函式，它規定了希

機器學習中K-means聚類演算法原理及C語言實現

本人以前主要focus在傳統音訊的軟體開發，接觸到的演算法主要是音訊訊號處理相關的，如各種編解碼演算法和回聲消除演算法等。最近切到語音識別上，接觸到的演算法就變成了各種機器學習演算法，如GMM等。K-means作為其中比較簡單的一種肯定是要好好掌握的。今天就講講K-means的基本原理和程式碼實現。其中基本原

數據結構8: 雙向鏈表(雙向循環鏈表)的建立及C語言實現

clas truct 開始麻煩使用解釋 display 表頭後繼之前接觸到的鏈表都只有一個指針，指向直接後繼，整個鏈表只能單方向從表頭訪問到表尾，這種結構的鏈表統稱為 “單向鏈表”或“單鏈表”。如果算法中需要頻繁

數據結構11: 棧(Stack)的概念和應用及C語言實現

next ret 額外轉換 lib 順序存儲順序棧就是函數棧，線性表的一種特殊的存儲結構。與學習過的線性表的不同之處在於棧只能從表的固定一端對數據進行插入和刪除操作，另一端是封死的。圖1 棧結構示意圖由於棧只有一邊開口存取數據，稱開口的那一端

順序表(線性表的順序儲存結構)及C語言實現

1.邏輯結構上呈線性分佈的資料元素在實際的物理儲存結構中也同樣相互之間緊挨著，這種儲存結構稱為線性表的順序儲存結構。也就是說，邏輯上具有線性關係的資料按照前後的次序全部儲存在一整塊連續的記憶體空間中，之間不存在空隙，這樣的儲存結構稱為順序儲存結構。使用順序儲存結構儲存的資料，第一個元素所在的地

Canny邊緣檢測演算法原理及C語言實現詳解

Canny運算元是John Canny在1986年提出的，那年老大爺才28歲，該文章發表在PAMI頂級期刊上的(1986. A computational approach to edge detection. IEEE Transactions on Pattern Analy

回溯法（八皇后問題）及C語言實現

回溯法，又被稱為“試探法”。解決問題時，每進行一步，都是抱著試試看的態度，如果發現當前選擇並不是最好的，或者這麼走下去肯定達不到目標，立刻做回退操作重新選擇。這種走不通就回退再走的方法就是回溯法。回溯VS遞迴很多人認為回溯和遞迴是一樣的，其實不然。在回溯

順序棧的基本操作（入棧和出棧）及C語言實現詳解

棧，可以理解為遵循“後入先出”原則的線性表，因此棧結構可以採用順序表或連結串列實現。順序棧的實現採用的是順序表，也就是陣列。順序棧的實現思想是：在陣列中設定一個隨時指向棧頂元素的變數（一般命名為 top ），當 top 的值為 -1 時，說明陣列中沒有資料，即棧中沒有資料元素，為“空棧”；只要資料元素

鏈棧的基本操作（入棧和出棧）及C語言實現完全攻略

鏈棧，即用線性表的連結串列結構實現棧的功能。實現過程中，鏈棧不需要建立頭結點，增加頭結點反而會增加程式的複雜性，因此連結串列中只需要建立一個頭指標就可以了。鏈棧的實現思想是：用連結串列頭結點的一端作為棧的棧頂端，這樣做的好處是當資料元素壓棧或者彈棧時，直接使用頭指標就可以完成，不需要增設額外的指標。例

鏈佇列的基本操作及C語言實現

佇列，可以理解為遵循“先進先出”原則的線性表，即資料元素依次從表的一端進，從表的另一端出。鏈佇列，即用鏈式的儲存結構（連結串列）實現的佇列，其實現思想是：用連結串列的表頭一端表示佇列的隊頭，另一端表示佇列的隊尾（實現程式碼更加簡單）。反過來的話，當佇列增加元素時，要採用頭插法，在刪除資料元素的時候，需

二叉樹後序遍歷（遞迴與非遞迴）演算法及C語言實現

二叉樹後序遍歷的實現思想是：從根節點出發，依次遍歷各節點的左右子樹，直到當前節點左右子樹遍歷完成後，才訪問該節點元素。圖 1 二叉樹如圖 1 中，對此二叉樹進行後序遍歷的操作過程為：從根節點 1 開始，遍歷該節點的左子樹（以節點 2 為根節點）；遍歷節點 2 的左子樹（以節點 4 為根

二叉樹中序遍歷（遞迴和非遞迴）演算法及C語言實現

二叉樹中序遍歷的實現思想是：訪問當前節點的左子樹；訪問根節點；訪問當前節點的右子樹；圖 1 二叉樹以圖 1 為例，採用中序遍歷的思想遍歷該二叉樹的過程為：訪問該二叉樹的根節點，找到 1；遍歷節點 1 的左子樹，找到節點 2；遍歷節點 2 的左子樹，找到節點 4；

二叉樹先序遍歷（遞迴與非遞迴）及C語言實現

二叉樹先序遍歷的實現思想是：訪問根節點；訪問當前節點的左子樹；若當前節點無左子樹，則訪問當前節點的右子樹；圖 1 二叉樹以圖 1 為例，採用先序遍歷的思想遍歷該二叉樹的過程為：訪問該二叉樹的根節點，找到 1；訪問節點 1 的左子樹，找到節點 2；訪問節點 2 的左子

雜湊查詢演算法及C語言實現

上一節介紹了有關雜湊表及其構造過程的相關知識，本節將介紹如何利用雜湊表實現查詢操作。在雜湊表中進行查詢的操作同雜湊表的構建過程類似，其具體實現思路為：對於給定的關鍵字 K，將其帶入雜湊函式中，求得與該關鍵字對應的資料的雜湊地址，如果該地址中沒有資料，則證明該查詢表中沒有儲存該資料，查詢失敗：如果雜湊地址中

插入排序演算法及C語言實現

插入排序演算法是所有排序方法中最簡單的一種演算法，其主要的實現思想是將資料按照一定的順序一個一個的插入到有序的表中，最終得到的序列就是已經排序好的資料。直接插入排序是插入排序演算法中的一種，採用的方法是：在新增新的記錄時，使用順序查詢的方式找到其要插入的位置，然後將新記錄插入。很多初學者所說的插入排

快速排序演算法（QSort，快排）及C語言實現

上節介紹瞭如何使用起泡排序的思想對無序表中的記錄按照一定的規則進行排序，本節再介紹一種排序演算法——快速排序演算法（Quick Sort）。 C語言中自帶函式庫中就有快速排序——qsort函式，包含在 <stdlib.h> 標頭檔案中。快速排序演算法是在起泡排序的基礎上進行改進的一種演算

希爾排序演算法（縮小增量排序）及C語言實現

希爾排序，又稱“縮小增量排序”，也是插入排序的一種，但是同前面幾種排序演算法比較來看，希爾排序在時間效率上有很大的改進。在使用直接插入排序演算法時，如果表中的記錄只有個別的是無序的，多數保持有序，這種情況下演算法的效率也會比較高；除此之外，如果需要排序的記錄總量很少，該演算法的效率同樣會很高。希爾排序就是

排序系列之（4）希爾排序及C語言實現

希爾排序(Shell Sort)也稱為遞減增量排序演算法，是插入排序的一種高速而安定的改良版。因希爾(Donald L. Shell)於1959年提出而得名。各種實現在如何進行遞減上有所不同。希爾排序是基於插入排序的以下兩點性質而提出改進方法的：插入排序在對幾乎已經排好序的資料操作時，效率高，即可以達

圖 | 儲存結構：鄰接表、鄰接多重表、十字連結串列及C語言實現

上一節介紹瞭如何使用順序儲存結構儲存圖，而在實際應用中最常用的是本節所介紹的鏈式儲存結構：圖中每個頂點作為連結串列中的結點，結點的構成分為資料域和指標域，資料域儲存圖中各頂點中儲存的資料，而指標域負責表示頂點之間的關聯。使用鏈式儲存結構表示圖的常用方法有 3 種：鄰接表、

PCA人臉識別學習及C語言實現

相關推薦