版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、<p> A Thesis Submitted in Partial Fulfillment of the Requirement for the</p><p> Degree of Master of Engineering</p><p> Face Recognition Research Based on Decision</p><p>
2、 Fusion and Distance Metric Learning</p><p> Candidate : Jiao Yizheng</p><p><b> Major</b></p><p> : Communication & Information System</p><p> Sup
3、ervisor : Associate Prof. Feng Bin</p><p> Huazhong University of Science and Technology</p><p> Wuhan 430074, P. R. China</p><p> January, 2012</p><p><b> 獨(dú)創(chuàng)
4、性聲明</b></p><p> 本人聲明所呈交的學(xué)位論文是我個(gè)人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研</p><p> 究成果。盡我所知,除文中已經(jīng)標(biāo)明引用的內(nèi)容外,本論文不包含任何其他個(gè)人或</p><p> 集體已經(jīng)發(fā)表或撰寫(xiě)過(guò)的研究成果。對(duì)本文的研究做出貢獻(xiàn)的個(gè)人和集體,均已在</p><p> 文中以明確方式標(biāo)明
5、。本人完全意識(shí)到,本聲明的法律結(jié)果由本人承擔(dān)。</p><p><b> 學(xué)位論文作者簽名:</b></p><p><b> 日期:</b></p><p><b> 年</b></p><p><b> 月</b></p><
6、;p><b> 日</b></p><p> 學(xué)位論文版權(quán)使用授權(quán)書(shū)</p><p> 本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,即:學(xué)校有權(quán)</p><p> 保留并向國(guó)家有關(guān)部門(mén)或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。</p><p> 本人授權(quán)華中科技大學(xué)可以將本學(xué)位論文
7、的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢</p><p> 索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。</p><p><b> 本論文屬于</b></p><p> 保密□ ,在_____年解密后適用本授權(quán)書(shū)。</p><p><b> 不保密□。</b></p>
8、<p> ?。ㄕ?qǐng)?jiān)谝陨戏娇騼?nèi)打“√”)</p><p><b> 學(xué)位論文作者簽名:</b></p><p><b> 指導(dǎo)教師簽名:</b></p><p><b> 日期:</b></p><p><b> 年</b></p
9、><p><b> 月</b></p><p><b> 日</b></p><p><b> 日期:</b></p><p><b> 年</b></p><p><b> 月</b></p>
10、;<p><b> 日</b></p><p><b> 摘</b></p><p><b> 要</b></p><p> 自動(dòng)人臉識(shí)別具有重要的理論研究意義和實(shí)用價(jià)值,自上世紀(jì) 60 年代以來(lái),人</p><p> 臉識(shí)別相關(guān)的各種技術(shù)得到長(zhǎng)足的發(fā)展
11、。在受控條件下的人臉識(shí)別算法已經(jīng)能取得</p><p> 很好的性能,并且出現(xiàn)很多實(shí)用系統(tǒng)。然而在非受控條件下,這些人臉識(shí)別算法還</p><p> 不能達(dá)到實(shí)用的需求。本文致力于在無(wú)約束條件下設(shè)計(jì)魯棒性好的人臉識(shí)別算法,</p><p> 并通過(guò)在 LFW 人臉庫(kù)下的測(cè)試驗(yàn)證了算法性能。本文的工作成果主要分為以下幾個(gè)</p><p>
12、<b> 部分:</b></p><p> ?。?)本文提出了基于決策融合的人臉識(shí)別算法框架。由于在無(wú)約束場(chǎng)景下,人</p><p> 臉受姿態(tài)、光照、遮擋和表情等各方面因素的影響,變化非常復(fù)雜。在這種情況下,</p><p> 如果僅僅使用某一種人臉特征難以取得很好的識(shí)別效果。在本文提出的框架中,可</p><p&g
13、t; 以使用多種人臉特征。這些特征可以相互補(bǔ)充,構(gòu)成對(duì)人臉的完整表達(dá),從而改善</p><p> 人臉識(shí)別算法的性能。如何有效的利用這些特征是本文考慮的關(guān)鍵。本文提出基于</p><p> 分類(lèi)器相關(guān)性的分類(lèi)器集成方法,按照分類(lèi)器相關(guān)性的定義,將相關(guān)性小、信息互</p><p> 補(bǔ)的分類(lèi)器組合在一起構(gòu)成一個(gè)強(qiáng)分類(lèi)器提升分類(lèi)的性能。</p>&
14、lt;p> ?。?)本文使用距離學(xué)習(xí)算法來(lái)取代普通的歐式距離。通過(guò)距離學(xué)習(xí)后,相同身</p><p> 份的人臉圖像之間的距離被減小,而不同身份的人臉圖像的距離被增大。因此,學(xué)</p><p> 習(xí)后的距離比歐式距離更具有針對(duì)性,能更好的區(qū)分復(fù)雜變化的人臉圖像。</p><p> ?。?)為了進(jìn)一步提升識(shí)別算法的性能,本文考慮了姿態(tài)的變化對(duì)算法性能的影&l
15、t;/p><p> 響。為了處理姿態(tài)的變化,本文采用“分為治之,各個(gè)擊破”的算法策略來(lái)減小姿</p><p> 態(tài)的干擾。文中利用姿態(tài)估計(jì)算法將人臉圖像的按照不同的姿態(tài)分開(kāi),對(duì)每種姿態(tài)</p><p> 組合單獨(dú)訓(xùn)練和測(cè)試,使得每個(gè)分類(lèi)器只針對(duì)某一種姿態(tài)組合,從而提高分類(lèi)器的</p><p><b> 性能。</b>
16、</p><p> 本文在 LFW 人臉庫(kù)上根據(jù)規(guī)定的測(cè)試協(xié)議進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)證明,基于決策融</p><p> 合的人臉識(shí)別方法優(yōu)于特征融合的方法。同時(shí),距離學(xué)習(xí)算法和姿態(tài)分類(lèi)都改進(jìn)了</p><p> 人臉識(shí)別算法的性能。通過(guò)分析,本文得出在人臉識(shí)別問(wèn)題上應(yīng)該針對(duì)性地使用與</p><p> 樣本有關(guān)的統(tǒng)計(jì)距離;此外,對(duì)于不同的姿
17、態(tài)人臉也應(yīng)該使用不同特征進(jìn)行描述。</p><p> 關(guān)鍵詞:人臉識(shí)別;人臉特征;距離學(xué)習(xí);決策融合;姿態(tài)估計(jì)</p><p><b> I</b></p><p><b> Abstract</b></p><p> The study on Automatic Face Recognit
18、ion (AFR) has both significant research value</p><p> and bright prospect of application. Since 1960s, in the filed of constrained AFR, great</p><p> progresses have been made continuously and
19、 many practical applications have also</p><p> emerged. However, in the filed of unconstrained AFR, popular algorithms which are</p><p> effective under constrained condition cannot achieve th
20、e same performance. Therefore,</p><p> how to design robust face recognition algorithm under unconstrained condition is a new</p><p> challenge in computer vision world .This work is dedicated
21、 to make some contributions to</p><p> solve this problem. The main contributions of this work are listed as follows:</p><p> (1) A decision fusion based face recognition algorithm framework i
22、s proposed. Due</p><p> to the great variations of face pose, illumination, occlusion and face expression in</p><p> unconstrained scenario, it is impractical to utilize only one kind of face
23、feature in face</p><p> recognition algorithm. According to this notion, this work uses several complementary</p><p> face features in order to make a complete representation of human face. At
24、 the decision</p><p> level, this work proposes a method to select several sub-classifies which have small</p><p> combinational correlation to form a strong classifier. The final strong class
25、ifier displays</p><p> better performance than any sub-classifier.</p><p> (2) Distance metric learning method is used in this work to learn Mahalanobis</p><p> distance to repla
26、ce the ordinary Euclidean distance. After utilizing distance metric learning</p><p> method, the distance between the face images of the same identity is decreased, while</p><p> distance betw
27、een face images of different identities enlarged. Therefore, metric learning</p><p> method is helpful to improve the performance of classification.</p><p> (3) To further enhance the performa
28、nce, a "divide-and-conquer "method to explicitly</p><p> cope with the large variations of pose is also proposed. In this work, a pose estimator is</p><p> applied to put all the tra
29、ining and testing samples into different pose categories. In each</p><p> category, classifier training and testing are processed independently. As a result, every</p><p> classifier is only t
30、rying to handle one kind of pose combination. In this way, the accuracy</p><p> of classifiers is improved.</p><p> The performance of the algorithms proposed in this work is tested under LFW&
31、lt;/p><p><b> II</b></p><p> regulation. The results show that the decision fusion is better than feature fusion.</p><p> Furthermore, distance metric learning and pose
32、estimation both promote the performance</p><p> of face recognition algorithm. Therefore, in the specific scenario of face recognition,</p><p> distance which is learned from face samples shou
33、ld be used and face images with large</p><p> pose variation need different features to represent them.</p><p> Key words: Face Recognition; Face Feature; Metric Leaning; Decision Fusion;</
34、p><p> Pose Estimation</p><p><b> III</b></p><p><b> 目</b></p><p><b> 錄</b></p><p><b> 摘</b></p>&
35、lt;p> 要........................................................................................................... I</p><p> Abstract.....................................................................
36、.................................. II</p><p><b> 1 概述</b></p><p> 1.1 課題背景和意義................................................................................. (1)</p><p&
37、gt; 1.2 人臉識(shí)別研究發(fā)展歷程和現(xiàn)狀..........................................................(2)</p><p> 1.3 人臉識(shí)別研究?jī)?nèi)容和難點(diǎn)................................................................. (5)</p><p> 1.4 本文研
38、究?jī)?nèi)容與組織......................................................................... (8)</p><p><b> 2</b></p><p><b> 人臉和人臉器官檢測(cè)</b></p><p> 2.1 人臉檢測(cè)算法..........
39、......................................................................... (10)</p><p> 2.2 人臉器官檢測(cè)算法........................................................................... (15)</p><p> 2.3
40、實(shí)驗(yàn)結(jié)果...........................................................................................(17)</p><p> 2.4 本章小結(jié)..........................................................................................
41、.(17)</p><p><b> 3</b></p><p> 基于多特征決策融合的人臉識(shí)別算法</p><p> 3.1 無(wú)約束人臉識(shí)別測(cè)試庫(kù) LFW 介紹................................................. (18)</p><p> 3.2 人臉特征概覽..
42、................................................................................. (20)</p><p> 3.3 經(jīng)典人臉識(shí)別算法介紹................................................................... (23)</p><p> 3.
43、4 決策融合人臉識(shí)別算法................................................................... (28)</p><p> 3.5 本章小結(jié)...........................................................................................(33)</p>
44、<p><b> IV</b></p><p><b> 4</b></p><p> 距離學(xué)習(xí)算法和姿態(tài)估計(jì)</p><p> 4.1 距離學(xué)習(xí)算法............................................................................
45、....... (35)</p><p> 4.2 基于距離學(xué)習(xí)的人臉識(shí)別算法........................................................(41)</p><p> 4.3 基于姿態(tài)分類(lèi)的人臉識(shí)別算法........................................................(43)</p&g
46、t;<p> 4.4 本章小結(jié)...........................................................................................(44)</p><p><b> 5</b></p><p><b> 總結(jié)與展望</b></p>
47、<p> 5.1 本文總結(jié)...........................................................................................(46)</p><p> 5.2 人臉識(shí)別技術(shù)展望.......................................................................
48、.... (47)</p><p><b> 致</b></p><p> 謝...................................................................................................... (49)</p><p> 參考文獻(xiàn)..........
49、.........................................................................................(50)</p><p><b> V</b></p><p><b> 1 概述</b></p><p> 1.1 課題背景和意義<
50、/p><p> 人臉識(shí)別是人工智能研究的熱門(mén)話(huà)題。經(jīng)過(guò)將近半個(gè)世紀(jì)的發(fā)展,人臉識(shí)別算法</p><p> 逐漸走向成熟,并得到越來(lái)越多的關(guān)注。總體來(lái)說(shuō),人臉識(shí)別具有兩方面的研究意</p><p> 義。首先,人臉識(shí)別算法的發(fā)展能夠促進(jìn)其他相關(guān)聯(lián)學(xué)科的進(jìn)步;其次,人臉識(shí)別</p><p> 在工業(yè)界具有迫切的需求。</p>&
51、lt;p> 1)人臉識(shí)別算法研究能推動(dòng)其他相關(guān)學(xué)科的發(fā)展</p><p> 人臉識(shí)別技術(shù)涉及多門(mén)學(xué)科,是一個(gè)綜合性很強(qiáng)的研究領(lǐng)域。設(shè)計(jì)良好的人臉識(shí)</p><p> 別算法需要具備圖像處理、圖像分析、計(jì)算機(jī)視覺(jué)、計(jì)算機(jī)圖像學(xué)、模式識(shí)別、機(jī)</p><p> 器學(xué)習(xí)、生理學(xué)等眾多領(lǐng)域的知識(shí)[1~5]。人臉識(shí)別為這些學(xué)科的發(fā)展提供了良好的實(shí)</p&g
52、t;<p> 際問(wèn)題,有助于為這些學(xué)科的理論建立實(shí)驗(yàn)平臺(tái),有利于這些學(xué)科的新方法和新理</p><p> 論的嘗試和應(yīng)用。比如,人臉識(shí)別作為一個(gè)模式識(shí)別問(wèn)題,由于人臉的模式種類(lèi)多、</p><p> 模式之間差異不可捉摸而被認(rèn)為是模式識(shí)別領(lǐng)域中典型的難以解決的問(wèn)題。加之,</p><p> 信號(hào)采集中的噪聲、以及外部環(huán)境的變化,使得人臉識(shí)別問(wèn)題
53、更加棘手。再如,在</p><p> 計(jì)算機(jī)視覺(jué)領(lǐng)域,如何利用人臉的一般性的先驗(yàn)知識(shí)來(lái)恢復(fù)人臉的 3D 結(jié)構(gòu)也具有重</p><p> 要的意義。人臉識(shí)別也是人機(jī)接口技術(shù)的研究?jī)?nèi)容之一。人臉識(shí)別的本質(zhì)是讓計(jì)算</p><p> 機(jī)能辨別不同的人臉身份,也就是賦予計(jì)算機(jī)視覺(jué)功能。人臉識(shí)別的研究有助改善</p><p> 當(dāng)前不友好的人機(jī)
54、交互環(huán)境。人臉識(shí)別算法的研究也能夠促進(jìn)對(duì)人眼視覺(jué)機(jī)制的理</p><p> 解。由于人眼具有很強(qiáng)的識(shí)別功能,很多人臉識(shí)別研究者在設(shè)計(jì)人臉識(shí)別算法同時(shí)</p><p> 也在探索人眼識(shí)別的機(jī)理。同樣地,人眼視覺(jué)功能的成果也能為人臉識(shí)別算法提供</p><p><b> 更多的參考。</b></p><p> 2)人
55、臉識(shí)別具有廣闊的市場(chǎng)需求</p><p> 身份識(shí)別與鑒定 [6~9]是人類(lèi)日常生活的重要活動(dòng)之一。我們每天要對(duì)交往中人的</p><p> 身份進(jìn)行判別,同時(shí)人們也需要通過(guò)各種手段來(lái)證明自己的身份。例如在打開(kāi)電腦</p><p> 時(shí),也往往需要口令才能進(jìn)入操作系統(tǒng);在網(wǎng)上通過(guò)電子銀行購(gòu)物時(shí),需要使用口</p><p><b&g
56、t; 1</b></p><p> 令卡或者 U 盾等設(shè)備才能進(jìn)行買(mǎi)賣(mài)。然后,這些古老的身份鑒定技術(shù)存在著很多不</p><p> 便。密碼或者口令容易被遺忘,甚至?xí)黄平?;口令卡容易丟失、老化,因此需要</p><p> 經(jīng)常跟換。特別是隨著電子商務(wù)和網(wǎng)絡(luò)的發(fā)展,這些傳統(tǒng)的身份鑒定技術(shù)已經(jīng)越來(lái)</p><p> 越不能
57、滿(mǎn)足實(shí)際應(yīng)用的需求。同時(shí),由于社會(huì)安全問(wèn)題日益突出,特別是“911 事件”</p><p> 以來(lái),全球恐怖事件頻繁發(fā)生,公共安全問(wèn)題得到廣泛的關(guān)注。因而,國(guó)家安全部</p><p> 門(mén)、信息部門(mén)迫切需要可靠性強(qiáng)、方便、安全的身份識(shí)別技術(shù)。基于生物特征的身</p><p> 份鑒定技術(shù)被認(rèn)為是徹底解決上述問(wèn)題的方法。</p><p>
58、 生物鑒定技術(shù)是利用人類(lèi)的一種或者多種內(nèi)部物理或者行為特性進(jìn)行識(shí)別的技</p><p> 術(shù)。人體的物理特性包括人臉、虹膜、耳廓、掌紋、指紋、 DNA、體型等。行為特</p><p> 征包括步態(tài)、筆記、敲鍵等于人類(lèi)活動(dòng)相關(guān)聯(lián)的特征。以上這些特征滿(mǎn)足“人人都</p><p> 有、獨(dú)一無(wú)二、長(zhǎng)期不變”的特點(diǎn),從而可以用來(lái)鑒定身份[6]。</p>
59、<p> 與其他生物識(shí)別技術(shù)相比,人臉識(shí)別有多方面的優(yōu)勢(shì)。首先,自動(dòng)人臉識(shí)別系統(tǒng)</p><p> 不會(huì)為用戶(hù)帶來(lái)任何冒犯,不會(huì)使用戶(hù)感覺(jué)不自然,在為用戶(hù)拍照的瞬間就能完成</p><p> 識(shí)別。其次,人臉識(shí)別技術(shù)能夠有效的防范“身份假冒”的情況。此外,人臉識(shí)別</p><p> 系統(tǒng)的快速、可靠、準(zhǔn)確也是其優(yōu)點(diǎn)。因而,在實(shí)際應(yīng)用中人臉識(shí)別技術(shù)
60、有關(guān)闊的</p><p><b> 市場(chǎng)。</b></p><p> 1.2 人臉識(shí)別研究發(fā)展歷程和現(xiàn)狀</p><p> 人臉識(shí)別研究的發(fā)展大體經(jīng)歷了 3 個(gè)階段[2]。</p><p> ?。?)第一階段(1964~1990 年)</p><p> 這一階段人臉識(shí)別算法大都是基于人臉幾
61、何特征的方法[5]。有些方法通過(guò)人臉中</p><p> 眼睛、鼻子、頰骨的相對(duì)位置、大小和形狀進(jìn)行識(shí)別。此外,人們對(duì)側(cè)面輪廓曲線(xiàn)</p><p> 的結(jié)構(gòu)特征提取和分析方面進(jìn)行了大量的研究[4],這個(gè)時(shí)期的人臉識(shí)別過(guò)程是一個(gè)半</p><p> 自動(dòng)過(guò)程。進(jìn)行識(shí)別時(shí),需要人工的定位人臉上的器官(眼睛、鼻子、嘴巴等)位</p><p>
62、 置,再計(jì)算這些器官與某一個(gè)公共參考點(diǎn)的距離,以此作為識(shí)別的特征,在這個(gè)階</p><p> 段尚未出現(xiàn)人臉識(shí)別的實(shí)際應(yīng)用。</p><p> (2)第二階段(1991~1997 年)</p><p><b> 2</b></p><p> 在這一時(shí)期人臉識(shí)別技術(shù)得到更加廣泛的研究,并產(chǎn)生了許多具有代表性的人臉
63、</p><p> 識(shí)別算法。同時(shí)在這一時(shí)期,人臉識(shí)別技術(shù)也開(kāi)始出現(xiàn)在實(shí)際應(yīng)用場(chǎng)景當(dāng)中。</p><p> 在眾多人臉識(shí)別算法中,首先要提到的是基于 PCA 變換的“特征臉”方法[2]。</p><p> 在這種方法被提出之前,人臉識(shí)別算法往往測(cè)量人臉的幾何特征進(jìn)行識(shí)別。與這些</p><p> 方法不同,PCA 人臉識(shí)別方法使用人臉
64、圖像的灰度矩陣作為原始輸入。并利用一組</p><p> 樣本,通過(guò) K-L 變換獲取表達(dá)人臉的一組正交基,并使用最重要的正交基來(lái)恢復(fù)人</p><p> 臉,從而達(dá)到降維的目的。因而,這種方法簡(jiǎn)單的使用一個(gè)低維的向量就能準(zhǔn)確的</p><p> 表示一張經(jīng)過(guò)校正和歸一化的人臉圖像。這一方法極大的促進(jìn)了人臉識(shí)別算法的研</p><p>
65、 究,其后很多人臉識(shí)別技術(shù)都有這種方法有點(diǎn)聯(lián)系。</p><p> 另一個(gè)重要的人臉識(shí)別算法基于彈性圖匹配[10]的方法。這種算法是基于人臉具有</p><p> 相似的拓?fù)浣Y(jié)構(gòu)。人臉可以用一張圖來(lái)表示。圖的每個(gè)頂點(diǎn)代表人臉的關(guān)鍵部位,</p><p> 比如鼻子、眼睛、嘴巴等,圖的邊代表關(guān)鍵點(diǎn)之間的距離。在這種方法中,每個(gè)頂</p><
66、p> 點(diǎn)代表用 40 維的 Gabor 變換系數(shù)來(lái)表示。由于 Gabor 變換良好的空間局部性,因此</p><p> 每頂點(diǎn)能表達(dá)人臉重要的局部信息。圖的邊表達(dá)了人臉的形狀和主要輪廓。因此這</p><p> 種方法,同時(shí)考慮了人臉全局面貌和重要的局部信息。</p><p> 在這一時(shí)期人臉識(shí)別算法主要以基于代數(shù)子空間的方法居多。這些算法在受控條&l
67、t;/p><p> 件下、數(shù)據(jù)庫(kù)容量不大的場(chǎng)景有不錯(cuò)的識(shí)別準(zhǔn)確率。</p><p> ?。?)第三階段(1998~現(xiàn)在)</p><p> 進(jìn)入二十一世紀(jì)以來(lái),人臉識(shí)別算法得到極大的發(fā)展,基本解決了可控條件下的</p><p> 人臉識(shí)別問(wèn)題,一些算法也逐漸走向?qū)嵱?。無(wú)約束、大容量人臉庫(kù)下的人臉識(shí)別算</p><p>
68、; 法成為研究人員關(guān)注的重點(diǎn)。這一期間以支持向量機(jī)為代表的統(tǒng)計(jì)學(xué)習(xí)理論也應(yīng)用</p><p> 到人臉識(shí)別問(wèn)題上來(lái)[11]。在人臉識(shí)別問(wèn)題上,廣泛使用各類(lèi)基于統(tǒng)計(jì)學(xué)的分類(lèi)器,</p><p> 如 SVM 分類(lèi)器、貝葉斯分類(lèi)器等。2002 年 Viola 和 Jose 提出一個(gè)基于 Haar-like 特</p><p> 征和 AdaBoost 學(xué)習(xí)算法的
69、實(shí)時(shí)人臉檢測(cè)算法[12],極大的促進(jìn)了人臉識(shí)別的研究。</p><p> 圖像匹配研究中的描述子也被應(yīng)用到人臉識(shí)別中。Ahonen 在文獻(xiàn)[13]將局部二值</p><p> 模式(Local Binary Pattern)直方圖用于人臉識(shí)別中。這種方法將人臉圖像劃分成多</p><p> 個(gè)網(wǎng)格,對(duì)每個(gè)網(wǎng)格的子圖像統(tǒng)計(jì) LBP 直方圖,最后將這些直方圖連結(jié)起
70、來(lái)構(gòu)成一</p><p><b> 3</b></p><p> 個(gè)長(zhǎng)的直方圖作為人臉的特征描述。2004 年 Lowe 提出 SIFT 特征[14]后,出現(xiàn)了大量</p><p> 基于 SIFT 特征的人臉識(shí)別方法。這種方法先提取人臉的 SIFT 特征,然后按照 SIFT</p><p> 關(guān)鍵點(diǎn)匹配的個(gè)數(shù)來(lái)
71、進(jìn)行識(shí)別。</p><p> 圖像分類(lèi)中一些模型也被應(yīng)用于人臉識(shí)別中。圖像分類(lèi)中往往將圖像看做“視覺(jué)</p><p> 單詞”的組合,按照一副圖像中“視覺(jué)單詞”的直方圖來(lái)進(jìn)行分類(lèi)。這種思想也被</p><p> 用在人臉識(shí)別中。文獻(xiàn)[15]使用完全隨機(jī)樹(shù)構(gòu)建“視覺(jué)字典”,使用 SVM 作為分類(lèi)器,</p><p> 可以獲得兩幅人臉圖
72、像的相似度量。文獻(xiàn)[16]的作者提出了一個(gè)使用 DCT 特征,用</p><p> EM 算法構(gòu)建“視覺(jué)字典”,最后用基于概率的直方圖來(lái)作為人臉圖像的特征進(jìn)行識(shí)</p><p> 別。Cao 在[17]中設(shè)計(jì)出一種基于學(xué)習(xí)的人臉描述子表示方法。這種描述子區(qū)別于通</p><p> 常的人工設(shè)計(jì)的描述子。人工設(shè)計(jì)的描述子是普遍適用的描述子,但在人臉識(shí)別問(wèn)<
73、/p><p> 題上這些描述子的某些模式不會(huì)出現(xiàn),也就是說(shuō)這些描述子在不同的問(wèn)題上它的分</p><p> 布是不同的。Cao 利用聚類(lèi)算法,設(shè)計(jì)出與樣本相關(guān)的描述子,這種針對(duì)人臉識(shí)別的</p><p> 描述子在人臉識(shí)別中取得了很好的效果。</p><p> 除了上面對(duì)如何表達(dá)人臉的研究外,還有大量的研究把重點(diǎn)放在如何度量人臉的<
74、/p><p> 相似性上。文獻(xiàn)[18]提出了利用一個(gè)“負(fù)樣本集”計(jì)算相似性的方法。對(duì)于待匹配的</p><p> 人臉圖像 I 和 J,這種方法的步驟如下:將 I 作為正例,負(fù)樣本集中圖像作為反例訓(xùn)</p><p> 練一個(gè)分類(lèi)器,用這個(gè)分類(lèi)器對(duì) J 分類(lèi)獲得一個(gè)分?jǐn)?shù);然后交換 I 和 J,可以獲得另</p><p> 一個(gè)分?jǐn)?shù);將兩個(gè)值
75、的平均值作為 I、J 的相似度量。</p><p> 總之,這一階段人臉識(shí)別已經(jīng)獲得了極大的發(fā)展,人臉識(shí)別算法的研究吸收了計(jì)</p><p> 算法視覺(jué)、模式識(shí)別、生理學(xué)、機(jī)器學(xué)習(xí)等學(xué)科的優(yōu)秀成果,研究者從人臉識(shí)別相</p><p> 關(guān)的各個(gè)角度來(lái)提升人臉識(shí)別算法的性能。</p><p> 1.3 人臉識(shí)別研究?jī)?nèi)容和難點(diǎn)</p
76、><p> 1.3.1 人臉識(shí)別研究?jī)?nèi)容</p><p> 實(shí)際應(yīng)用中的人臉識(shí)別系統(tǒng)包括如下幾個(gè)流程:首先通過(guò)圖像采集設(shè)備獲取人臉</p><p> 圖像;然后在獲取的圖像中定位人臉區(qū)域;經(jīng)過(guò)人臉校正和歸一化后,提取人臉特</p><p><b> 4</b></p><p> 征;最后進(jìn)行
77、身份識(shí)別或者確認(rèn)。人臉身份確認(rèn)的過(guò)程是給定一張人臉圖像和一個(gè)</p><p> 人臉身份標(biāo)簽,利用人臉數(shù)據(jù)庫(kù)中的信息,判斷這張人臉圖像的身份是否與給定人</p><p> 臉身份標(biāo)簽一致。在機(jī)密性高的受控進(jìn)入的場(chǎng)所,經(jīng)常需要進(jìn)行身份確認(rèn),人臉確</p><p> 認(rèn)適用于這樣的場(chǎng)合。人臉識(shí)別是對(duì)任何輸入的人臉圖像,根據(jù)給定的人臉數(shù)據(jù)庫(kù)</p>&
78、lt;p> 和身份信息,識(shí)別出該圖像中人臉的身份。人臉身份確認(rèn)是一個(gè)二分類(lèi)問(wèn)題,它的</p><p> 輸出只有“接受”和“拒絕”兩種。人臉身份識(shí)別是一個(gè)多分類(lèi)問(wèn)題,它輸出不同</p><p> 人臉圖像的身份。人臉識(shí)別的問(wèn)題主要研究?jī)?nèi)容包括人臉檢測(cè)、人臉校正和歸一化、</p><p> 人臉特征提取與匹配分類(lèi)[19]。</p><
79、p><b> ?。?)人臉檢測(cè)</b></p><p> 由于從圖像采集設(shè)備獲取的圖像往往包含復(fù)雜的背景,如果使用原始的圖像進(jìn)行</p><p> 人臉識(shí)別,效果很差。為了消除圖像中非人臉部位的干擾,需要進(jìn)行人臉檢測(cè),將</p><p> 人臉區(qū)域從原始圖像中剪切出來(lái)。人臉檢測(cè)屬于物體檢測(cè)的范疇。人臉檢測(cè)針對(duì)的</p>
80、<p> 目標(biāo)是人臉。人臉檢測(cè)算法需要找出給定的人臉圖像的中所有人臉的位置和尺寸。</p><p> 隨著采集到的原始圖像的背景復(fù)雜程度、圖像中人臉的姿態(tài)、膚色、表情和飾物的</p><p> 差異,人臉檢測(cè)在不同場(chǎng)景下的難易程度也不同。魯棒的人臉檢測(cè)算法應(yīng)該能夠克</p><p> 服干擾,最大程度的檢測(cè)出人臉區(qū)域而排除非人臉區(qū)域。作為人臉識(shí)別
81、系統(tǒng)的前期</p><p> 步驟,對(duì)人臉檢測(cè)算法的另一個(gè)要求時(shí),檢測(cè)過(guò)程必須快速完成。如果人臉檢測(cè)要</p><p> 耗費(fèi)很長(zhǎng)時(shí)間,勢(shì)必對(duì)使用者造成一定的心理影響,從而使人臉識(shí)別技術(shù)失去了其</p><p> 相對(duì)于其他生物識(shí)別算法優(yōu)勢(shì)。因而,實(shí)時(shí)的人臉檢測(cè)器在實(shí)際應(yīng)用中有廣闊的需</p><p><b> 求。<
82、/b></p><p> 從技術(shù)上講,人臉檢測(cè)是一個(gè)二分類(lèi)問(wèn)題。人臉檢測(cè)算法遍歷所有原始圖像的子</p><p> 圖像,并提出特征,通過(guò)分類(lèi)器判斷該區(qū)域是否為人臉區(qū)域。2002 年 Voila 和 Jones</p><p> 提出的實(shí)時(shí)人臉檢測(cè)器對(duì)人臉識(shí)別的發(fā)展起了重要的推動(dòng)作用。該算法能夠?qū)崟r(shí)的</p><p> 檢測(cè)出正
83、面人臉圖像,并具有很高的準(zhǔn)確率。目前人臉檢測(cè)研究的重點(diǎn)在多視角條</p><p><b> 件下檢測(cè)人臉區(qū)域。</b></p><p> 人臉檢測(cè)的另一個(gè)重要內(nèi)容是定位人臉的特征點(diǎn)。一般人臉檢測(cè)所得的子圖像不</p><p> 是正面頭像。為了獲得好的人臉識(shí)別效果,都需要對(duì)人臉的姿態(tài)進(jìn)行校正。人臉校</p><p>
84、;<b> 5</b></p><p> 正需要利用人臉的特征點(diǎn)(如眼睛)的位置信息。另外,人臉特征點(diǎn)的位置對(duì)提取</p><p> 人臉的局部特征至關(guān)重要。所以,在人臉檢測(cè)的過(guò)程中,定位人臉器官的位置是必</p><p> 要的。由于 Voila 和 Jones 提出的人臉檢測(cè)器的性能很好,因而可以用相同的方法來(lái)</p>
85、<p> 訓(xùn)練檢測(cè)人臉器官的分類(lèi)器。然而,實(shí)踐證明通過(guò)這種方法在檢測(cè)人臉器官時(shí)誤檢</p><p> 和漏檢的比例較大,因而不實(shí)用。文獻(xiàn) [4]中介紹基于邊緣檢測(cè)的人臉器官的定位方</p><p> 法。該方法依次檢測(cè)每個(gè)器官。首先檢測(cè)人眼,然后根據(jù)人臉器官的位置關(guān)系,利</p><p> 用人眼的位置找到鼻子和嘴巴。在尋找這些器官時(shí),主要依賴(lài)于
86、圖像的邊緣檢測(cè)、</p><p> 形態(tài)學(xué)處理等方法。該方法在臉部表情變化不劇烈的圖像中取得了較好的效果。</p><p><b> ?。?)人臉歸一化</b></p><p> 人臉歸一化也是人臉識(shí)別中的一個(gè)重要環(huán)節(jié)。在人臉檢測(cè)之后,為了保證人臉識(shí)</p><p> 別的性能,往往需要進(jìn)行各種預(yù)處理操作。這些操作
87、統(tǒng)一稱(chēng)為為人臉歸一化。人臉</p><p> 歸一化涉及多方面的內(nèi)容。首先,如果人臉圖像的角度的傾斜,并且對(duì)于不同的人</p><p> 臉圖像人臉器官在不同的位置,可以通過(guò)姿勢(shì)歸一化來(lái)將人臉圖像旋轉(zhuǎn)為直立的人</p><p> 臉圖像。這有助于人臉器官保持對(duì)齊,能夠提高人臉識(shí)別的性能。其次,光照也是</p><p> 影響后期識(shí)別的
88、關(guān)鍵因素,因此在人臉歸一化階段,有時(shí)會(huì)進(jìn)行亮度歸一化。常用</p><p> 的亮度歸一化的方法有直方圖均衡、亮度補(bǔ)償?shù)萚3]。</p><p> ?。?)人臉特征提取與匹配分類(lèi)</p><p> 人臉特征提取又稱(chēng)人臉描述,是在人臉檢測(cè)、人臉歸一化的基礎(chǔ)上進(jìn)行的人臉特</p><p> 征提取過(guò)程,也可以說(shuō)是對(duì)人臉進(jìn)行建模的過(guò)程[18]
89、。特征提取的優(yōu)劣會(huì)影響到后面</p><p> 人臉識(shí)別的精度。在人臉特征提取這一步中,要求所提取的人臉特征具有很好表征</p><p> 能力和區(qū)分度,另外,還要求所提取的特征維數(shù)要低,盡量在低維空間中,這樣不</p><p> 但可以減小運(yùn)算量、減少識(shí)別的時(shí)間,同時(shí)也有助于分類(lèi)器的選擇。人臉圖像是一</p><p> 種高維空間的
90、集合體,雖然它具有固定的結(jié)構(gòu)和特征分布,并且也經(jīng)過(guò)了預(yù)處理,</p><p> 但要想在低維空間中表征人臉,還是具有一定的難度的?,F(xiàn)在,比較常用的人臉特</p><p> 征提取方法主要有以下幾種:基于圖像灰度矩陣的統(tǒng)計(jì)信息的方法,基于人臉幾何</p><p> 結(jié)構(gòu)特征的算法。經(jīng)過(guò)人臉特征提取,每一張人臉圖像代表這特征空間的一個(gè)點(diǎn)。</p>&
91、lt;p> 經(jīng)過(guò)特征提取后,人臉圖像最終代表特征空間上的點(diǎn)。因而需要用一定的度量準(zhǔn)</p><p><b> 6</b></p><p> 則來(lái)描述樣本之間的相似性。一般用向量之間的距離來(lái)表示這種相似性,如歐式距</p><p> 離、曼哈頓距離、馬氏距離和余弦距離等。</p><p> 人臉識(shí)別最終通過(guò)
92、一個(gè)分類(lèi)器來(lái)獲得識(shí)別結(jié)果?;诮y(tǒng)計(jì)推斷的 SVM 和</p><p> Bayesian 分類(lèi)器以及基于決策模型的神經(jīng)網(wǎng)絡(luò)、LDA 等都是常見(jiàn)的人臉識(shí)別分類(lèi)器。</p><p> 1.3.2 人臉識(shí)別技術(shù)難點(diǎn)</p><p> 現(xiàn)有的人臉識(shí)別系統(tǒng)在非受控條件下 (在自然場(chǎng)景下采集人臉圖像)和對(duì)象不配</p><p> 合(包括姿態(tài)、表
93、情、飾物等差異)時(shí)識(shí)別準(zhǔn)確率明顯下滑。這些變化因素在各種應(yīng)用</p><p> 系統(tǒng)中均有不同程度的出現(xiàn),因而是人臉識(shí)別應(yīng)該著力解決的問(wèn)題。人臉識(shí)別研究</p><p> 面臨的主要挑戰(zhàn)包括以下幾點(diǎn):</p><p> ?。?)非約束條件下人臉檢測(cè)和人臉器官精確定位:人臉檢測(cè)是人臉識(shí)別的基礎(chǔ),</p><p> 在人臉檢測(cè)階段獲得的信息
94、越可靠,人臉識(shí)別算法性能越好。此外,人臉的特征點(diǎn)</p><p> 的定位對(duì)各種人臉?lè)治觯ū砬榉治?、年齡估計(jì)等)的幫助極大。然后,由于人臉圖</p><p> 像的外在條件變化和人臉本身內(nèi)部變化,使得自動(dòng)準(zhǔn)確地定位人臉器官仍是一個(gè)沒(méi)</p><p><b> 有很好解決的問(wèn)題。</b></p><p> ?。?)穩(wěn)
95、定的人臉特征:在自然場(chǎng)景中,人臉的類(lèi)內(nèi)差異往往超過(guò)了人臉身份所</p><p> 帶來(lái)的差異。這為匹配分類(lèi)帶來(lái)很大困難。人眼能在眾多復(fù)雜的條件下區(qū)分不同的</p><p> 人臉,然而識(shí)別時(shí)使用的人臉特征卻還沒(méi)有研究透徹。因此尋找穩(wěn)定的、區(qū)分度好</p><p> 的人臉特征仍然是人臉識(shí)別研究最重要的工作。</p><p> ?。?)大
96、規(guī)模人臉識(shí)別問(wèn)題:目前的研究表明,隨著人臉庫(kù)中測(cè)試樣本個(gè)體數(shù)目</p><p> 的增長(zhǎng),識(shí)別算法的性能呈明顯的下降趨勢(shì),因此,如何維持或提高大規(guī)模應(yīng)用環(huán)</p><p> 境下的人臉識(shí)別算法的識(shí)別率是也一個(gè)常重要的問(wèn)題。同時(shí),大規(guī)模的人臉庫(kù)還存</p><p> 在如何對(duì)數(shù)據(jù)庫(kù)進(jìn)行有效管理,特征存儲(chǔ)空間的分配及如何最小化檢索時(shí)間等實(shí)際</p>
97、<p><b> 問(wèn)題。</b></p><p> ?。?)海量樣本集的學(xué)習(xí)問(wèn)題:傳統(tǒng)的學(xué)習(xí)方法在樣本較小的情況下有理想的性</p><p> 能。然而當(dāng)樣本容量變得龐大時(shí),這些算法的執(zhí)行時(shí)間變得過(guò)長(zhǎng),不能滿(mǎn)足實(shí)用要</p><p> 求。同時(shí),所得的分類(lèi)器也不能夠從大量的訓(xùn)練數(shù)據(jù)中找到可靠的分類(lèi)規(guī)則,從而</p>
98、<p><b> 7</b></p><p> 使分類(lèi)性能急劇下降。因此大規(guī)矩?cái)?shù)據(jù)的學(xué)習(xí)問(wèn)題也是人臉識(shí)別面臨的挑戰(zhàn)之一。</p><p> 1.4 本文研究?jī)?nèi)容與組織</p><p> 本論文研究了人臉識(shí)別算法中涉及的重要環(huán)節(jié)。完整的人臉識(shí)別算法包括:人臉</p><p> 檢測(cè)、特征提取和分類(lèi)識(shí)別
99、。人臉識(shí)別算法對(duì)輸入的人臉圖像的質(zhì)量往往有一定的</p><p> 要求。當(dāng)圖像采集設(shè)備獲取人臉圖像后,系統(tǒng)會(huì)評(píng)估采集到的圖像的質(zhì)量。如果圖</p><p> 像質(zhì)量符號(hào)算法的要求,則進(jìn)入人臉特征提取階段;否則,重新采集人臉圖像。這</p><p> 個(gè)重新采集的過(guò)程會(huì)影響人臉識(shí)別的速度特征提取是人臉識(shí)別的核心,設(shè)計(jì)出對(duì)光</p><p&g
100、t; 照、姿態(tài)、表情等變化因素具有魯棒性的人臉描述子是保證人臉識(shí)別性能的基礎(chǔ)。</p><p> 在提取出人臉特征后,另一個(gè)關(guān)鍵的問(wèn)題是如何衡量?jī)蓚€(gè)特征的接近程度。這里面</p><p> 需要使用機(jī)器學(xué)習(xí)方面的算法,如距離學(xué)習(xí)和分類(lèi)器等。本文的研究?jī)?nèi)容包含了以</p><p> 上部分,具體分為以下幾個(gè)方面:</p><p> ?。?/p>
101、1)對(duì)人臉檢測(cè)和人臉器官的檢測(cè)進(jìn)行綜述,并介紹了常用的人臉檢測(cè)器和人</p><p><b> 臉器官檢測(cè)算法。</b></p><p> (2)對(duì)無(wú)約束人臉識(shí)別測(cè)試庫(kù) LFW 進(jìn)行了綜述性介紹。本文中介紹了 LFW 庫(kù)</p><p> 的使用測(cè)試協(xié)議、研究目的等內(nèi)容。</p><p> (3)對(duì)目前流行的各種
102、人臉特征進(jìn)行了詳細(xì)的闡述,并提出利用多種特征的決</p><p> 策融合的人臉識(shí)別算法。引入分類(lèi)器的相關(guān)性的概念來(lái)指導(dǎo)子分類(lèi)的聚合。</p><p> ?。?)使用了機(jī)器學(xué)習(xí)中的距離度量學(xué)習(xí)算法來(lái)計(jì)算人臉特征之間的距離。這種</p><p> 距離是針對(duì)人臉識(shí)別問(wèn)題的這個(gè)特定問(wèn)題的距離,與人臉的統(tǒng)計(jì)特性有關(guān)。這種距</p><p>
103、離比普通的歐式距離能更好的表達(dá)人臉的接近程度。</p><p> ?。?)利用人臉姿態(tài)估計(jì)算法,按照姿態(tài)的不同對(duì)人臉進(jìn)行分類(lèi)。在不同的姿態(tài)</p><p> 類(lèi)別下,單獨(dú)進(jìn)行訓(xùn)練和分類(lèi)以減少姿態(tài)對(duì)人臉識(shí)別算法性能的損害。</p><p><b> 本文結(jié)構(gòu)安排如下:</b></p><p> 第 1 章 緒論。主要
104、介紹本文研究的意義和背景、人臉識(shí)別技術(shù)發(fā)展歷程、人臉</p><p> 識(shí)別算法概述和本文的研究?jī)?nèi)容。</p><p> 第 2 章 人臉和人臉器官檢測(cè)。闡述人臉檢測(cè)算法流程和核心思想。在人臉檢測(cè)</p><p><b> 8</b></p><p> 的基礎(chǔ)上介紹如何在人臉面部檢測(cè)人臉器官。并展示常用的人臉和人
105、臉器官檢測(cè)算</p><p> 法在 LFW 人臉庫(kù)上的實(shí)驗(yàn)結(jié)果。</p><p> 第 3 章 基于決策融合的多特征人臉識(shí)別方法。本章對(duì)各種常用人臉識(shí)別特征進(jìn)</p><p> 行了全面的闡述。并提出綜合使用多特征決策融合的人臉識(shí)別算法框架,并利用分</p><p> 類(lèi)相關(guān)性來(lái)聚合子分類(lèi)器以獲得更好的分類(lèi)性能。</p>
106、<p> 第 4 章 距離學(xué)習(xí)算法和姿態(tài)估計(jì)。本章在上一章提出的人臉識(shí)別框架基礎(chǔ)上,</p><p> 提出兩點(diǎn)改進(jìn)。第一,使用距離度量學(xué)習(xí)算法來(lái)取代普通的歐式距離;第二,按照</p><p> 人臉姿態(tài)的不同,單獨(dú)進(jìn)行訓(xùn)練和測(cè)試。利用這兩點(diǎn)進(jìn)一步提升人臉識(shí)別算法的性</p><p><b> 能。</b></p&g
107、t;<p> 第 5 章 總結(jié)與展望。這一章對(duì)全文內(nèi)容進(jìn)行總結(jié),并概述了本文存在的缺陷。</p><p> 最后,對(duì)人臉識(shí)別算法的發(fā)展做出預(yù)期。</p><p><b> 9</b></p><p> 2 人臉和人臉器官檢測(cè)</p><p> 人臉檢測(cè)和人臉器官檢測(cè)是人臉識(shí)別系統(tǒng)的前期工作,對(duì)整個(gè)
108、系統(tǒng)的性能有極大</p><p> 的影響。在這一章中將對(duì)這方面的算法做詳細(xì)介紹,并展示常用的算法在 LFW 人臉</p><p><b> 庫(kù)的實(shí)驗(yàn)結(jié)果。</b></p><p> 2.1 人臉檢測(cè)算法</p><p> 人臉檢測(cè)算法需要判斷給定的圖像中是否存在人臉,如果存在人臉就需要返回人</p>
109、<p> 臉的數(shù)目和每個(gè)人臉的準(zhǔn)確位置和大小。隨著計(jì)算機(jī)系統(tǒng)不斷智能化,越來(lái)越多的</p><p> 項(xiàng)目或產(chǎn)品要求計(jì)算機(jī)能以自然的方式與人進(jìn)行交互。人臉檢測(cè)使這種友好的人機(jī)</p><p> 交互技術(shù)的得以實(shí)現(xiàn)的基礎(chǔ)。人臉檢測(cè)也是各種人臉?lè)治鏊惴?,如人臉校正、表?lt;/p><p> 分析、年齡分析、人臉驗(yàn)證和人臉跟蹤算法的基礎(chǔ)。有些學(xué)者甚至認(rèn)
110、為如果計(jì)算機(jī)</p><p> 不能很好的理解人臉,那么計(jì)算機(jī)不可能真正理解人類(lèi)的思想和意圖 [20]。人臉檢測(cè)</p><p> 的功能對(duì)人眼來(lái)說(shuō)極其簡(jiǎn)單,然而由于人臉圖像的中人臉的大小、位置、方向姿態(tài)</p><p> 以及圖像的光照、遮擋的多樣性,使得高準(zhǔn)確率的人臉檢測(cè)成為計(jì)算機(jī)視覺(jué)中具有</p><p><b> 挑
111、戰(zhàn)性的任務(wù)。</b></p><p> 人臉檢測(cè)發(fā)展過(guò)程中最重要的成果是 Voila 和 Jones 提出的基于 Adaboost 分類(lèi)器</p><p> 的人臉檢測(cè)算法[12]。該算法能應(yīng)用于實(shí)時(shí)的人臉檢測(cè)場(chǎng)景中。因而,在數(shù)字相機(jī)和</p><p> 圖像管理軟件中被廣泛使用。Voila 和 Jones 的這種方法,已經(jīng)成為人臉檢測(cè)算法性<
112、;/p><p> 能比較的標(biāo)準(zhǔn),它所體現(xiàn)的算法思想被廣泛的利用。在下面的篇幅中,本文將詳細(xì)</p><p> 的介紹這種人臉檢測(cè)方法并總結(jié)人臉檢測(cè)算法的關(guān)鍵技術(shù)。</p><p> 2.1.1 Voila-Jones 人臉檢測(cè)器</p><p> Voila-Jones 人臉檢測(cè)算法在 2002 年被提出。該算法有三個(gè)方面的因素使它成為&
113、lt;/p><p> 實(shí)時(shí)的人臉檢測(cè)器。這三個(gè)因素為:積分圖像,Adaboost 學(xué)習(xí)和分類(lèi)器級(jí)聯(lián)。</p><p><b> 10</b></p><p><b> ?。?)圖像積分圖像</b></p><p> 積分圖像是計(jì)算一個(gè)網(wǎng)格內(nèi)部的矩形子集的和的快速算法。積分圖像在 1985 年<
114、;/p><p> 在計(jì)算機(jī)圖像學(xué)中第一次被提出。此后,Voila 和 Jones 首先將它應(yīng)用于計(jì)算機(jī)視覺(jué)</p><p> 領(lǐng)域。積分圖像中某一點(diǎn)(x,y)的值為原始圖像中點(diǎn)(x,y)左上角所有像素值</p><p> 的累加和。其定義如下:</p><p> ii( x, y )??</p><p><b
115、> ∑</b></p><p> x '≤ x, y '≤ y</p><p> i (x ', y ')</p><p><b> (2-1)</b></p><p> 其中 i 為原始圖像,ii 為積分圖像。引入積分圖像的概念后,計(jì)算圖像中任意矩形框<
116、/p><p> 內(nèi)的像素和就變得非常高效。在下圖中計(jì)算矩形 ABCD 里的像素之和可以表示為:</p><p><b> ∑</b></p><p> ( x , y )∈ ABCD</p><p> i ( x, y )?? ii( D )?? ii ( A)?? ii ( B )?? ii (C )</p&
117、gt;<p><b> X</b></p><p><b> Y</b></p><p><b> A</b></p><p><b> B</b></p><p><b> D</b></p>
118、<p><b> C</b></p><p><b> (2-2)</b></p><p><b> a</b></p><p><b> b</b></p><p><b> c</b></p>&
119、lt;p><b> d</b></p><p><b> f</b></p><p><b> g</b></p><p> 圖 2.1 積分圖像與矩形特征</p><p> Voila 和 Jones 利用積分圖像來(lái)計(jì)算 Haar-like 矩形特征。根據(jù)積分
120、圖像的性質(zhì),</p><p> 利用公式 2-2 可以計(jì)算圖像中任意矩形塊子圖像的像素和,并且計(jì)算過(guò)程快速高效、</p><p> 所需的時(shí)間固定不變。圖 2.1 下方顯示了 6 種 Haar-like 特征。這些特征的值為白色</p><p> 區(qū)域像素值的和與黑色區(qū)域像素值的和的差值。計(jì)算出原始圖像的積分圖像后,這</p><p>
121、 些特能通過(guò)很少次數(shù)的數(shù)據(jù)訪(fǎng)問(wèn)就能完成 Haar-like 特征的計(jì)算。從上圖可以得出,</p><p> 計(jì)算 a 和 b 特征需要訪(fǎng)問(wèn)積分圖像 6 次,計(jì)算 c 和 d 特征需要訪(fǎng)問(wèn) 8,計(jì)算 e 和 f 需</p><p> 要訪(fǎng)問(wèn) 9 次。相對(duì)于從原始圖像計(jì)算這些特征的值,數(shù)據(jù)的訪(fǎng)問(wèn)數(shù)次明顯減少。因</p><p> 而,積分圖像是 Viola-Jo
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于決策融合與距離學(xué)習(xí)的人臉識(shí)別算法研究.pdf
- 基于遷移學(xué)習(xí)和特征融合的人臉識(shí)別算法的研究.pdf
- 人臉識(shí)別中基于貝葉斯決策融合的算法.pdf
- 基于半監(jiān)督學(xué)習(xí)和決策融合的人臉表情識(shí)別方法研究.pdf
- 人臉識(shí)別分類(lèi)器的設(shè)計(jì)及決策融合算法.pdf
- 人臉識(shí)別中的姿態(tài)估計(jì)、識(shí)別算法和融合算法的研究.pdf
- 基于KPCA和LDA融合改進(jìn)的人臉識(shí)別算法研究.pdf
- 基于紋理特征融合和SVM的人臉識(shí)別算法研究.pdf
- 基于彈性圖和Hausdorff距離匹配的人臉表情識(shí)別算法研究.pdf
- 基于特征融合的人臉識(shí)別算法.pdf
- 基于特征融合的人臉檢測(cè)定位和識(shí)別算法的研究.pdf
- 基于多特征融合的人臉識(shí)別算法研究.pdf
- 基于多模式融合的人臉識(shí)別算法研究.pdf
- 基于特征學(xué)習(xí)的人臉識(shí)別算法研究.pdf
- 基于特征融合的人臉識(shí)別算法研究與實(shí)現(xiàn).pdf
- 基于深度學(xué)習(xí)的人臉識(shí)別算法.pdf
- 基于集成學(xué)習(xí)的人臉識(shí)別算法研究.pdf
- 基于核學(xué)習(xí)的人臉識(shí)別算法研究.pdf
- 基于流形學(xué)習(xí)的人臉識(shí)別算法的研究.pdf
- 基于分類(lèi)學(xué)習(xí)的人臉識(shí)別算法研究.pdf
評(píng)論
0/150
提交評(píng)論