摘 要:單樣本人臉識別的關(guān)鍵在于充分挖掘單樣本判別性信息,采用深度稀疏自編碼網(wǎng)絡(luò)與空頻域多LBP特征融合進行特征提取。首先利用部分樣本訓(xùn)練深度稀疏自編碼網(wǎng)絡(luò),利用訓(xùn)練好的網(wǎng)絡(luò)分別提取訓(xùn)練及測試集的特征;其次,利用二維離散小波變換將時域樣本變換到頻域,實現(xiàn)樣本擴展,增加單樣本信息并分別提取各域上的多LBP特征;最后利用協(xié)同表示對深度自編碼網(wǎng)絡(luò)及多LBP特征進行分類識別,融合識別結(jié)果獲取最終分類結(jié)果。在AR及PIE數(shù)據(jù)庫上的實驗結(jié)果表明,該融合算法能提高樣本判別性信息的提取,提高單樣本人臉識別性能。
關(guān)鍵詞:稀疏自編碼;單樣本人臉識別;空-頻特征;多特征融合;二維離散小波變換;數(shù)據(jù)庫
《物聯(lián)網(wǎng)技術(shù)》雜志是目前國內(nèi)第一本經(jīng)國家新聞出版總署批準,手續(xù)齊全的物聯(lián)網(wǎng)專業(yè)科技期刊。物聯(lián)網(wǎng)是繼計算機、互聯(lián)網(wǎng)之后世界信息技術(shù)的第三次革命,據(jù)美國獨立市場研究機構(gòu)Forreter預(yù)測,物聯(lián)網(wǎng)所帶來的產(chǎn)業(yè)價值要比互聯(lián)網(wǎng)大30倍,將形成下一個上萬億元規(guī)模的高科技市場。
0 引 言
人臉識別是計算機視覺和模式識別領(lǐng)域重要的研究課題,在生活中應(yīng)用廣泛,如視頻監(jiān)控[1]、門禁[2]、行人再識別[3]、視覺追蹤[4]等。盡管目前已有的人臉識別算法在特定環(huán)境下性能較好,但在實際測試中人臉可能含有多重面部變化,例如光照、陰影、姿勢、表情、遮擋、不對齊等[5],因此人臉識別仍是一項具有挑戰(zhàn)性的任務(wù)。
在許多實際應(yīng)用場合中,每人僅有一個訓(xùn)練樣本,例如ID卡認證、航空港監(jiān)測等,導(dǎo)致在單樣本識別中很難根據(jù)訓(xùn)練樣本預(yù)測測試樣本中可能出現(xiàn)的類內(nèi)變化信息,因此單樣本人臉識別仍是人臉識別中的難點。而傳統(tǒng)的判別性子空間學(xué)習(xí)算法,例如線性判別分析(Linear Discriminant Analysis,LDA)[6]、基于Fisher的算法[7-8]在此種情況下會失效。基于表示的分類算法如稀疏表示(Sparse Representation-based Classifier,SRC)[9]和協(xié)同表示(Collaborative Representation-based Classifier,CRC)[10]要求每類用多個訓(xùn)練樣本來有效表示測試樣本,因此其在單樣本識別中性能也會大幅下降。
為處理單樣本人臉識別,研究人員提出多種算法,這些算法大致可以分為兩類[11],即全局算法和局部算法。全局算法[12-13]用整張人臉圖像作為輸入,其主要思想是擴大訓(xùn)練樣本數(shù)以捕捉類內(nèi)信息。文獻[14]中有兩個方向,分別為虛擬樣本生成和通用學(xué)習(xí)。虛擬樣本生成利用真實訓(xùn)練樣本合成虛擬樣本,例如SPCA[15]和SVD-LDA[16]基于奇異值分解(Singular Value Decomposition,SVD)生成虛擬樣本。這些算法的主要缺點是虛擬樣本往往與訓(xùn)練樣本高度相關(guān),因此很難作為獨立的樣本進行特征提取[14]。
與基于虛擬樣本算法不同,泛型學(xué)習(xí)方法通常會引入一個輔助泛型集,由不感興趣的人員來補充原始的SSPP(Single Sample per Person,SSPP)圖庫集。Wang等人[17]假設(shè)不同的人之間共享相似的類內(nèi)變化,據(jù)此利用泛型集估計類內(nèi)散度。基于表示的算法包括擴展的SRC(ESRC)[12]、疊加SRC(SSRC)[18]、稀疏變化字典學(xué)習(xí)(SVDL)[13]、協(xié)同概率標(biāo)簽(CPL)[19]等。盡管這些算法可以在一定程度上提高單樣本人臉識別算法的性能,但其性能仍嚴重依賴于巧妙的選取泛型集,理想的泛型集通常包括兩個特點:需與訓(xùn)練樣本有相似的拍攝場景;需包含足夠的面部變化來預(yù)測測試樣本中未知的變化。然而實際中很難收集到足夠多的滿足上述條件的泛型集。
局部算法利用局部面部特征識別測試樣本。通常生成局部特征的方法是將一張人臉樣本分割成一些重疊或不重疊的圖像塊,因此該類型的局部算法通常被稱作基于塊的方法[20]。該類方法中每個被劃分的塊都被看作是這個人的獨立樣本,基于該假設(shè),研究人員將傳統(tǒng)的子空間學(xué)習(xí)和基于表示的分類算法(例如PCA,LDA,SRC,CRC)進行擴展得到對應(yīng)基于塊的算法,例如塊PCA[21],塊LDA[22],塊SRC(PSRC)[9]和塊CRC(PCRC)[20],整合每個塊的識別結(jié)果,得到最終的單樣本人臉識別結(jié)果。Lu等人[14]提出一種判別性多流行學(xué)習(xí)算法(DMMA),將人臉識別轉(zhuǎn)換成域到域的匹配問題。基于這一工作,Yan等人[23]通過整合多個局部特征提出多特征多流形學(xué)習(xí)方法來提升人臉識別性能。Zhang等人[21]通過加入另一個基于稀疏圖的Fisher準則修正了DMMA算法,并為被劃分出來的塊學(xué)習(xí)一個判別性子空間。
最近,有研究人員嘗試將泛型學(xué)習(xí)整合到基于塊的方法中用于單樣本人臉識別。例如,Zhu等人[24]從泛型集中提取塊變化字典,然后將其與訓(xùn)練塊字典串聯(lián)來度量每個測試塊的表示殘差。這類算法與現(xiàn)有的基于塊的表示方法相比可在單樣本人臉識別中獲得更好的性能,但理想的泛型集的獲取仍是實際應(yīng)用中的難題。
本文將樣本投影到頻域空間以實現(xiàn)樣本的擴充,同時采用通用訓(xùn)練集采集部分類內(nèi)變化信息,減小類內(nèi)變化導(dǎo)致的單樣本識別率下降現(xiàn)象,最后將空頻域的識別結(jié)果進行融合獲得最終的識別結(jié)果并在數(shù)據(jù)集上驗證。
1 相關(guān)工作
1.1 深度稀疏自編碼網(wǎng)絡(luò)
SSAE是一種無監(jiān)督特征學(xué)習(xí)算法,該算法采用層級訓(xùn)練方案構(gòu)造深度網(wǎng)絡(luò),每一層包含兩個部分,即編碼器和解碼器。編碼器為一個函數(shù),可將輸入向量x映射到隱藏層表示a,即。解碼器將隱藏層表示映射成一個重構(gòu)向量y,即。其中W(1)和W(2)分別表示輸入到隱藏層及隱藏層到輸入的權(quán)重;b(1)和b(2)分別表示隱藏層單元和輸出層單元的基;f(·)表示隱藏層單元的激活值,一般選用sigmoid函數(shù);g(·)表示輸出單元的激活值,一般設(shè)置為g(x)=x。對SSAE每層訓(xùn)練即最小化該層損失函數(shù)J:
式中:x(i)表示第i個訓(xùn)練樣本,同時也是期望輸出;y(i)表示對應(yīng)預(yù)測輸出;m表示訓(xùn)練樣本的個數(shù);h表示隱藏層單元的個數(shù)。相對熵懲罰項是為了增強隱藏層的稀疏度,參數(shù)表示第j個隱藏單元在訓(xùn)練集上的平均激活度,而ρ表示稀疏度參數(shù),其值接近0,采用反向傳播算法進行訓(xùn)練。
論文指導(dǎo) >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >