人臉識(shí)別(FaceRecognition,FR)是一種基于人的臉部特征信息進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù)。用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并自動(dòng)在圖像中檢測(cè)和跟蹤人臉,進(jìn)而對(duì)檢測(cè)到的人臉進(jìn)行臉部識(shí)別的一系列相關(guān)技術(shù),通常也叫做人像識(shí)別、面部識(shí)別。
人臉識(shí)別系統(tǒng)的研究始于20世紀(jì)60年代,80年代后隨著計(jì)算機(jī)技術(shù)和光學(xué)成像技術(shù)的發(fā)展得到提高,而真正進(jìn)入初級(jí)的應(yīng)用階段則在90年后期;近幾年隨著以深度學(xué)習(xí)為主的人工智能技術(shù)進(jìn)步,人臉識(shí)別技術(shù)得到了迅猛的發(fā)展。“人臉識(shí)別系統(tǒng)”集成了人工智能、機(jī)器識(shí)別、機(jī)器學(xué)習(xí)、模型理論、專家系統(tǒng)、視頻圖像處理等多種專業(yè)技術(shù),是綜合性比較強(qiáng)的系統(tǒng)工程技術(shù)。
人臉識(shí)別流程
人臉識(shí)別系統(tǒng)通常包括幾個(gè)過(guò)程:人臉圖像采集及檢測(cè)、關(guān)鍵點(diǎn)提取、人臉規(guī)整(圖像處理)、人臉特征提取和人臉識(shí)別比對(duì)。
人臉圖像采集。不同的人臉圖像都能通過(guò)攝像鏡頭采集下來(lái),比如靜態(tài)圖像、動(dòng)態(tài)圖像、不同的位置、不同表情等方面都可以得到很好的采集。當(dāng)用戶在采集設(shè)備的拍攝范圍內(nèi)時(shí),采集設(shè)備會(huì)自動(dòng)搜索并拍攝用戶的人臉圖像。
人臉檢測(cè)。人臉檢測(cè)在實(shí)際中主要用于人臉識(shí)別的預(yù)處理,即在圖像中準(zhǔn)確標(biāo)定出人臉的位置和大小。
關(guān)鍵點(diǎn)提取(特征提取)。人臉識(shí)別系統(tǒng)可使用的特征通常分為視覺(jué)特征、像素統(tǒng)計(jì)特征、人臉圖像變換系數(shù)特征、人臉圖像代數(shù)特征等。人臉特征提取就是針對(duì)人臉的某些特征進(jìn)行的。人臉特征提取,也稱人臉表征,它是對(duì)人臉進(jìn)行特征建模的過(guò)程。人臉特征提取的方法歸納起來(lái)分為兩大類:一種是基于知識(shí)的表征方法;另外一種是基于代數(shù)特征或統(tǒng)計(jì)學(xué)習(xí)的表征方法。
人臉規(guī)整(預(yù)處理)。對(duì)于人臉的圖像預(yù)處理是基于人臉檢測(cè)結(jié)果,對(duì)圖像進(jìn)行處理并最終服務(wù)于特征提取的過(guò)程。系統(tǒng)獲取的原始圖像由于受到各種條件的限制和隨機(jī)干擾,往往不能直接使用,必須在圖像處理的早期階段對(duì)它進(jìn)行灰度校正、噪聲過(guò)濾等圖像預(yù)處理。對(duì)于人臉圖像而言,其預(yù)處理過(guò)程主要包括人臉圖像的光線補(bǔ)償、灰度變換、直方圖均衡化、歸一化、幾何校正、濾波以及銳化等。
人臉識(shí)別比對(duì)(匹配與識(shí)別)。提取的人臉圖像的特征數(shù)據(jù)與數(shù)據(jù)庫(kù)中存儲(chǔ)的特征模板進(jìn)行搜索匹配,通過(guò)設(shè)定一個(gè)閾值,當(dāng)相似度超過(guò)這一閾值,則把匹配得到的結(jié)果輸出。人臉識(shí)別就是將待識(shí)別的人臉特征與已得到的人臉特征模板進(jìn)行比較,根據(jù)相似程度對(duì)人臉的身份信息進(jìn)行判斷??煞譃?span>1:1、1:N、屬性識(shí)別。其中1:1是將2張人臉對(duì)應(yīng)的特征值向量進(jìn)行比對(duì),1:N是將1張人臉照片的特征值向量和另外N張人臉對(duì)應(yīng)的特征值向量進(jìn)行比對(duì),輸出相似度高或者相似度排名前X的人臉。
人臉特征分析算法
人臉識(shí)別技術(shù)中被廣泛采用的區(qū)域特征分析算法,它融合了計(jì)算機(jī)圖像處理技術(shù)與生物統(tǒng)計(jì)學(xué)原理于一體,利用計(jì)算機(jī)圖像處理技術(shù)從視頻中提取人像特征點(diǎn),利用生物統(tǒng)計(jì)學(xué)的原理進(jìn)行分析建立數(shù)學(xué)模型,即人臉特征模板。利用已建成的人臉特征模板與被測(cè)者的人的面像進(jìn)行特征分析,根據(jù)分析的結(jié)果來(lái)給出一個(gè)相似值。通過(guò)這個(gè)值即可確定是否為同一人。
人臉識(shí)別的方法很多,主要的人臉識(shí)別方法有:
(1)幾何特征的人臉識(shí)別方法:幾何特征可以是眼、鼻、嘴等的形狀和它們之間的幾何關(guān)系(如相互之間的距離)。這些算法識(shí)別速度快,需要的內(nèi)存小,但識(shí)別率較低。
(2)基于特征臉(PCA)的人臉識(shí)別方法:特征臉?lè)椒ㄊ腔?span>KL變換的人臉識(shí)別方法,KL變換是圖像壓縮的一種正交變換。高維的圖像空間經(jīng)過(guò)KL變換后得到一組新的正交基,保留其中重要的正交基,由這些基可以張成低維線性空間。如果假設(shè)人臉在這些低維線性空間的投影具有可分性,就可以將這些投影用作識(shí)別的特征矢量,這就是特征臉?lè)椒ǖ幕舅枷?。這些方法需要較多的訓(xùn)練樣本,而且完全是基于圖像灰度的統(tǒng)計(jì)特性的。目前有一些改進(jìn)型的特征臉?lè)椒ā?span>
(3)神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法:神經(jīng)網(wǎng)絡(luò)的輸入可以是降低分辨率的人臉圖像、局部區(qū)域的自相關(guān)函數(shù)、局部紋理的二階矩等。這類方法同樣需要較多的樣本進(jìn)行訓(xùn)練,而在許多應(yīng)用中,樣本數(shù)量是很有限的。
(4)彈性圖匹配的人臉識(shí)別方法:彈性圖匹配法在二維的空間中定義了一種對(duì)于通常的人臉變形具有一定的不變性的距離,并采用屬性拓?fù)鋱D來(lái)代表人臉,拓?fù)鋱D的任一頂點(diǎn)均包含一特征向量,用來(lái)記錄人臉在該頂點(diǎn)位置附近的信息。該方法結(jié)合了灰度特性和幾何因素,在比對(duì)時(shí)可以允許圖像存在彈性形變,在克服表情變化對(duì)識(shí)別的影響方面收到了較好的效果,同時(shí)對(duì)于單個(gè)人也不再需要多個(gè)樣本進(jìn)行訓(xùn)練。
(5)線段Hausdorff距離(LHD)的人臉識(shí)別方法:心理學(xué)的研究表明,人類在識(shí)別輪廓圖(比如漫畫(huà))的速度和準(zhǔn)確度上絲毫不比識(shí)別灰度圖差。LHD是基于從人臉灰度圖像中提取出來(lái)的線段圖的,它定義的是兩個(gè)線段集之間的距離,與眾不同的是,LHD并不建立不同線段集之間線段的一一對(duì)應(yīng)關(guān)系,因此它更能適應(yīng)線段圖之間的微小變化。實(shí)驗(yàn)結(jié)果表明,LHD在不同光照條件下和不同姿態(tài)情況下都有非常出色的表現(xiàn),但是它在大表情的情況下識(shí)別效果不好。
(6)支持向量機(jī)(SVM)的人臉識(shí)別方法:支持向量機(jī)是統(tǒng)計(jì)模式識(shí)別領(lǐng)域的一個(gè)新的熱點(diǎn),它試圖使得學(xué)習(xí)機(jī)在經(jīng)驗(yàn)風(fēng)險(xiǎn)和泛化能力上達(dá)到一種妥協(xié),從而提高學(xué)習(xí)機(jī)的性能。支持向量機(jī)主要解決的是一個(gè)2分類問(wèn)題,它的基本思想是試圖把一個(gè)低維的線性不可分的問(wèn)題轉(zhuǎn)化成一個(gè)高維的線性可分的問(wèn)題。通常的實(shí)驗(yàn)結(jié)果表明SVM有較好的識(shí)別率,但是它需要大量的訓(xùn)練樣本(每類300個(gè)),這在實(shí)際應(yīng)用中往往是不現(xiàn)實(shí)的。而且支持向量機(jī)訓(xùn)練時(shí)間長(zhǎng),方法實(shí)現(xiàn)復(fù)雜,該函數(shù)的取法沒(méi)有統(tǒng)一的理論。
人臉識(shí)別考勤系統(tǒng)
重要關(guān)鍵技術(shù)
基于大數(shù)據(jù)的深度學(xué)習(xí)
在人臉識(shí)別原理一節(jié)中提到了一些特征提取和分類算法,可以理解為是一種淺層的學(xué)習(xí)模型。淺層學(xué)習(xí)可以在一定規(guī)模的數(shù)據(jù)集下可以發(fā)揮較強(qiáng)的表達(dá)能力,但當(dāng)數(shù)據(jù)量不斷增大時(shí),這些模型就會(huì)處于欠擬合的狀態(tài)。通俗點(diǎn)說(shuō)就是數(shù)據(jù)量太大,模型不夠復(fù)雜,覆蓋不了所有數(shù)據(jù)。所以說(shuō),深度學(xué)習(xí)是近年來(lái)特別熱門(mén)的研究課題。
基于大數(shù)據(jù)的深度學(xué)習(xí),將是人臉識(shí)別技術(shù)的主要趨勢(shì)之一。深度學(xué)習(xí),往往含有更深的層次結(jié)構(gòu)。越是低層,特征越簡(jiǎn)單,越是高層,特征越抽象,但越接近所要表達(dá)的意圖。舉個(gè)例子,從字到詞,再到句,到語(yǔ)義,是層層深化的過(guò)程,這就是一個(gè)典型的深層結(jié)構(gòu)?;氐綀D像分析的范疇,對(duì)于一個(gè)圖片來(lái)說(shuō),低級(jí)的特征是像素,也就是0到255的矩陣。通過(guò)像素,無(wú)法理解圖片里的目標(biāo)是什么,但我們可以從像素中找到了邊緣特征,然后用邊緣特征組合成不同的部件,最后形成了不同種類的目標(biāo)物,這個(gè)才是我們所想要實(shí)現(xiàn)的。
利用深度學(xué)習(xí)提取出的人臉特征,相比傳統(tǒng)技術(shù),更能表示人臉之間的相關(guān)性,輔之有效的分類方法,能夠顯著提高算法識(shí)別率。深度學(xué)習(xí)非常依賴大數(shù)據(jù),這也是為什么這項(xiàng)技術(shù)在近幾年取得突破的原因。更多更豐富的樣本數(shù)據(jù)加入到訓(xùn)練模型中,意味著算法模型將更通用,更貼近現(xiàn)實(shí)世界模型。另一方面,深度學(xué)習(xí)的理論性還需要加強(qiáng),模型還需要優(yōu)化。這一點(diǎn),相信在眾多學(xué)術(shù)界和工業(yè)界同仁的努力下,深度學(xué)習(xí)將取得更大的成功。屆時(shí)人臉識(shí)別應(yīng)用,或許能如現(xiàn)在的車(chē)牌識(shí)別技術(shù)一樣,深入到我們的生活中。
3D人臉識(shí)別技術(shù)
3D人臉識(shí)別技術(shù)是人臉識(shí)別重要發(fā)展發(fā)現(xiàn)。目前大部分的人臉識(shí)別應(yīng)用的范疇限定在2D圖像上。人臉實(shí)質(zhì)上是一個(gè)立體模型,而2D人臉識(shí)別容易受到姿態(tài)、光照、表情等因素影響,是因?yàn)?span>2D圖像本身有一個(gè)缺陷,無(wú)法很好地表示深度信息。如果說(shuō)深度學(xué)習(xí)是從人的認(rèn)知角度來(lái)理解人臉識(shí)別,那么3D技術(shù)就是從現(xiàn)實(shí)模型來(lái)反映人臉識(shí)別。
目前關(guān)于3D人臉識(shí)別方向的算法研究并沒(méi)有2D人臉識(shí)別技術(shù)那么豐富和深入,許多因素限制了這項(xiàng)技術(shù)的發(fā)展。首先,3D人臉識(shí)別往往需要特定的采集設(shè)備,如3D攝像機(jī)或雙目攝像機(jī)。目前這類采集設(shè)備價(jià)格還比較昂貴,主要用于特定場(chǎng)景。其次,3D建模過(guò)程需要的計(jì)算量較大,對(duì)硬件要求較高,也限制了目前的應(yīng)用。第三,3D人臉識(shí)別數(shù)據(jù)庫(kù)比較稀少,研究者缺少訓(xùn)練樣本和測(cè)試樣本,無(wú)法開(kāi)展更深入的理論研究。相信隨著未來(lái)芯片技術(shù)和傳感器的發(fā)展,當(dāng)計(jì)算能力不再收到制約,3D采集設(shè)備成本大幅下降的時(shí)候,3D人臉識(shí)別將取得重要突破