解析PCA算法在人臉識(shí)別技術(shù)的研究

出處：華北電力大學(xué) 張寧發(fā)布于：2011-09-02 12:41:54

　　1 人臉識(shí)別的發(fā)展及現(xiàn)狀

　　人臉識(shí)別的研究已經(jīng)有很長的歷史，在19世紀(jì)，法國人Galton就曾對(duì)此問題進(jìn)行了研究，他用一組數(shù)字代表不同的人臉側(cè)面特征來實(shí)現(xiàn)對(duì)人臉側(cè)面圖像的識(shí)別。國內(nèi)外對(duì)于人臉識(shí)別的研究發(fā)展，分別經(jīng)歷了三個(gè)階段：傳統(tǒng)的人機(jī)交互式階段、機(jī)器自動(dòng)識(shí)別初級(jí)階段、機(jī)器自動(dòng)識(shí)別階段。人臉識(shí)別是一個(gè)被廣泛研究著的熱門問題，大量的研究論文層出不窮，在一定程度上有泛濫成"災(zāi)"之嫌。為了更好地對(duì)人臉識(shí)別研究的歷史和現(xiàn)狀進(jìn)行介紹，本文將AFR的研究歷史按照研究內(nèi)容、技術(shù)方法等方面。

　　1.1 傳統(tǒng)的人機(jī)交互式階段

　　這一階段盡管時(shí)間相對(duì)短暫，但卻是人臉識(shí)別研究的高潮期，可謂碩果累累：不但誕生了若干代表性的人臉識(shí)別算法，美國軍方還組織了著名的FERET人臉識(shí)別算法測試，并出現(xiàn)了若干商業(yè)化運(yùn)作的人臉識(shí)別系統(tǒng)，比如為著名的Visionics（現(xiàn)為Identix）的FaceIt系統(tǒng)。

　　1.2 自動(dòng)識(shí)別初級(jí)階段

　　這一時(shí)期的另一個(gè)重要工作是麻省理工學(xué)院人工智能實(shí)驗(yàn)室的布魯內(nèi)里（Brunelli）和波基奧（Poggio）于1992年左右做的一個(gè)對(duì)比實(shí)驗(yàn)，他們對(duì)比了基于結(jié)構(gòu)特征的方法與基于模板匹配的方法的識(shí)別性能，并給出了一個(gè)比較確定的結(jié)論：模板匹配的方法優(yōu)于基于特征的方法。這一導(dǎo)向性的結(jié)論與特征臉共同作用，基本中止了純粹的基于結(jié)構(gòu)特征的人臉識(shí)別方法研究，并在很大程度上促進(jìn)了基于表觀（Appearance-based）的線性子空間建模和基于統(tǒng)計(jì)模式識(shí)別技術(shù)的人臉識(shí)別方法的發(fā)展，使其逐漸成為主流的人臉識(shí)別技術(shù)。

　　1.3 機(jī)器自動(dòng)識(shí)別階段

　　第三階段是真正利用機(jī)器進(jìn)行對(duì)人臉的自動(dòng)識(shí)別，隨著計(jì)算機(jī)的大型化、高速化和人臉識(shí)別的方法的發(fā)展，提出了許多人臉自動(dòng)識(shí)別的系統(tǒng)。

　　2 PCA算法的原理

　　PCA（主成分分析）算法是人臉識(shí)別中比較新的一種算法，該算法的優(yōu)點(diǎn)是識(shí)別率高，識(shí)別速度快。PCA算法是一個(gè)統(tǒng)計(jì)學(xué)概念，是關(guān)于控制過程的在線監(jiān)測與故障診斷。

　　2.1 PCA算法介紹

　　2.1.1 PCA原理

　　令x為表示環(huán)境的m維隨機(jī)向量。假設(shè)x均值為零，即：

　　E[x]=O.

　　令w表示為m維單位向量，x在其上投影。這個(gè)投影被定義為向量x和w的內(nèi)積，表示為：

　　而主成分分析的目的就是尋找一個(gè)權(quán)值向量w使得表達(dá)式E[y2]的值化：

　　根據(jù)線性代數(shù)的理論，可以知道滿足式子值化的訓(xùn)應(yīng)該滿足下式：

　　即使得上述式子化的w是矩陣Cx的特征值所對(duì)應(yīng)的特征向量。

　　2.1.2 主成分的求解步驟

　　在PCA中主要的是要求出使得方差的轉(zhuǎn)化方向，其具體的求解步驟如下：

　?。?）構(gòu)建關(guān)聯(lián)矩陣：Cx=E[x*xT],Cx∈Pn*n.

　　在實(shí)際應(yīng)用中，由于原始數(shù)據(jù)的數(shù)學(xué)期望不容易求解，我們可以利用下式來近似構(gòu)造關(guān)聯(lián)矩陣：

　?。ㄆ渲衳1,x2,…，xN,是各個(gè)原始灰度圖像所有象素點(diǎn)對(duì)應(yīng)的向量，N是原始圖像的個(gè)數(shù)）

　?。?）先計(jì)算出Cx的各個(gè)特征值

　　（3）把特征值按大小排序

　?。?）計(jì)算出前m個(gè)特征值對(duì)應(yīng)正交的特征向量構(gòu)成w.

　　（5）將原始數(shù)據(jù)在特征向量w上進(jìn)行投影，即可獲得原始圖像的主特征數(shù)據(jù)。

　　2.1.3 主成分的求解方法

　　通過上面的分析我們可以知道，對(duì)于主成分分析的問題轉(zhuǎn)化為求解協(xié)方差矩陣的特征值和特征向量的問題，主成分的正交化分解的算法或求XXT特征值問題的算法常用的有雅可比方法和NIPALS方法。

　　2.2 Eigenface算法

　　在利用PCA進(jìn)行特征提取的算法中，特征臉方法（Eigenface）是其中的一個(gè)經(jīng)典算法。Eigenface算法和EBGM算法是人臉識(shí)別的兩種重要算法。前者基于圖像的整體特征，后者通過Gabor變換提取圖像的局部特征。在實(shí)際應(yīng)用中，光照的變化、人物表情的變化和物體對(duì)人臉的遮蓋等因素造成了人臉識(shí)別的困難。文章對(duì)上述兩種算法在這些變化因素下的識(shí)別性能進(jìn)行了研究和比較。實(shí)驗(yàn)結(jié)果表明EBGM算法對(duì)環(huán)境變化具有更好的適應(yīng)性，能夠在小樣本條件下獲得良好的識(shí)別能力。而Eigenface算法對(duì)環(huán)境變化較為敏感，需要大量的訓(xùn)練樣本來保證識(shí)別效果。特征臉方法是從主成分分析導(dǎo)出的一種人臉識(shí)別和描述技術(shù)。特征臉方法就是將包含人臉的圖像區(qū)域看作是一種隨機(jī)向量，因此可以采用K-L變換獲得其正交K-L基底。對(duì)應(yīng)其中較大特征值的基底具有與人臉相似的形狀，因此又稱為特征臉。利用這些基底的線性組合可以描述、表達(dá)和逼近人臉圖像，因此可以進(jìn)行人臉識(shí)別與合成。識(shí)別過程就是將人臉圖像映射到由特征臉構(gòu)成的子空間上，比較其與己知人臉在特征空間中的位置，具體步驟如下：

　?。?）初始化，獲得人臉圖像的訓(xùn)練集并計(jì)算特征臉，定義為人臉空間，存儲(chǔ)在模板庫中，以便系統(tǒng)進(jìn)行識(shí)別；

　?。?）輸入新的人臉圖像，將其映射到特征臉空間，得到一組關(guān)于該人臉的特征數(shù)據(jù)；

　?。?）通過檢查圖像與人臉空間的距離判斷它是否是人臉；

　　（4）若為人臉，根據(jù)權(quán)值模式判斷它是否為數(shù)據(jù)庫中的某個(gè)人，并做出具體的操作。

　　2.2.1 計(jì)算特征臉

　　設(shè)人臉圖像I（x,y）為二維N*N灰度圖像，用N維向量R表示。人臉圖像訓(xùn)練集為{Ri|i=1,…，M},其中M為訓(xùn)練集中圖像總數(shù)，這M幅圖像的平均向量為：

　　每個(gè)人臉Ri與平均人臉ψ的差值向量是：

　　訓(xùn)練圖像的協(xié)方差矩陣可表示為：

　　C=AAT.

　　其中，A=[φ1,…φM].

　　特征臉有協(xié)方差矩陣C的正交特征向量組成。對(duì)于N*N人臉圖像，協(xié)方差矩陣C的大小為N2*N2,對(duì)它求解特征值和特征向量是很困難的。一種取而代之的方法是令L=ATA.

　　即協(xié)方差矩陣的轉(zhuǎn)置陣，則可以知道此矩陣是M*M（M是訓(xùn)練人臉的數(shù)量）的一個(gè)較小的矩陣。首先計(jì)算M*M矩陣L的特征向量vi（l=l,…，M），則矩陣C的特征向量ui（l=1,…，M）由差值圖像φi（i=1,…，M）與vi（l=l,…，M）線性組合得到：U=[u1,…，uM]=[[ψ1,…，ψM]T][v1.…，vM].實(shí)際上，m（m<M）個(gè)特征值足夠用于人臉識(shí)別。因此，僅取L的前m個(gè)特征值的特征向量計(jì)算特征臉。

　　3 PCA算法在人臉識(shí)別中的應(yīng)用

　　基于特征臉的人臉識(shí)別過程由訓(xùn)練階段和識(shí)別階段兩個(gè)階段組成。在訓(xùn)練階段，每個(gè)已知人臉Ri映射到由特征臉構(gòu)成的子空間上，得到m維向量

　　在識(shí)別階段，首先把待識(shí)別的圖像R映射到特征臉空間。得到向量：

　　為了區(qū)分人臉和非人臉，還需計(jì)算原始圖像R與其由特征空間重建的圖像Rf之間的距離ε：

　　采用距離法對(duì)人臉進(jìn)行分類，分類規(guī)則如下：

　?。?）若ε≥θc,則輸入圖像不是人臉圖像；

　?。?）若則輸入圖像包含未知人臉；

　　（3）若則輸入圖像為庫中第k個(gè)人的人臉。

　　4 實(shí)驗(yàn)結(jié)果

　　實(shí)驗(yàn)在兩個(gè)圖庫上測試，首先是一個(gè)ORL人臉庫，該庫包含40個(gè)不同人物，每人有l(wèi)O張圖片，共400幅。用訓(xùn)練樣本進(jìn)行測試，識(shí)別率為95%.一個(gè)是自建人臉庫，該庫包含20個(gè)不同人物，每人有5張不同表情和姿態(tài)下的圖片，總共100幅。隨著訓(xùn)練樣本的增加，識(shí)別率會(huì)有所提升，但是并不是越多越好，當(dāng)超過一定的訓(xùn)練樣本數(shù)目時(shí)，識(shí)別率反而有所下降。

　　5 人臉識(shí)別未來的發(fā)展

　　人臉識(shí)別是一個(gè)跨學(xué)科富挑戰(zhàn)性的前沿課題，人臉圖像中姿態(tài)、光照、表情、飾物、背景、時(shí)間跨度等因素的變化對(duì)人臉識(shí)別算法的魯棒性都有著負(fù)面的影響，單一的PCA方法識(shí)別率不高，今后的發(fā)展方向可以與其他方法（如：支持向量機(jī)、小波變化等）相結(jié)合來彌補(bǔ)單一方法的不足，讓身份識(shí)別更準(zhǔn)確。

上一篇：一種網(wǎng)絡(luò)儲(chǔ)油罐群遠(yuǎn)程監(jiān)控系統(tǒng)研究

下一篇：淺談Chirp函數(shù)的Nios Ⅱ嵌入式實(shí)現(xiàn)

版權(quán)與免責(zé)聲明

凡本網(wǎng)注明“出處：維庫電子市場網(wǎng)”的所有作品，版權(quán)均屬于維庫電子市場網(wǎng)，轉(zhuǎn)載請(qǐng)必須注明維庫電子市場網(wǎng)，http://m.58mhw.cn，違反者本網(wǎng)將追究相關(guān)法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明自其它出處的作品，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性，不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí)，必須保留本網(wǎng)注明的作品出處，并自負(fù)版權(quán)等法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題，請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系，否則視為放棄相關(guān)權(quán)利。

相關(guān)技術(shù)資料

ARM技術(shù)架構(gòu)與應(yīng)用開發(fā)實(shí)踐指南2026/1/6 10:40:19
嵌入式實(shí)時(shí)操作系統(tǒng)（RTOS）選型與移植技術(shù)指南2025/12/31 10:42:31
工業(yè)嵌入式系統(tǒng)：通信接口技術(shù)選型與抗干擾設(shè)計(jì)實(shí)踐2025/12/15 14:36:53
深入解析嵌入式 OPENAMP 框架：開啟異核通信新時(shí)代2025/7/22 16:27:29
一文快速了解OPENWRT基礎(chǔ)知識(shí)2025/7/14 16:59:04

技術(shù)分類

熱門技術(shù)資料

最新技術(shù)資料

維庫電子市場網(wǎng)-十六年專注打造電子元器件采購網(wǎng)

解析PCA算法在人臉識(shí)別技術(shù)的研究

版權(quán)與免責(zé)聲明

建議反饋