版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、<p><b> 畢業(yè)設(shè)計(jì)說明書</b></p><p> 復(fù)雜背景下的人臉檢測(cè)算法研究</p><p> 學(xué)生姓名: 學(xué)號(hào) </p><p> 學(xué) 院: 信息與通信工程學(xué)院 </p><p> 專 業(yè): 電子信息科學(xué)
2、與技術(shù)專業(yè) </p><p> 指導(dǎo)教師: 李化欣 </p><p><b> 2012年 6月</b></p><p> 復(fù)雜背景下的人臉檢測(cè)算法設(shè)計(jì)</p><p><b> 摘要</b></p><p> 人臉
3、檢測(cè)是人臉識(shí)別之前的重要和必不可少的步驟,用于確定人臉在視頻圖像中的位置和大小。隨著科學(xué)技術(shù)的迅猛發(fā)展,以及人們對(duì)模式識(shí)別和計(jì)算機(jī)交互需求的發(fā)展,人臉檢測(cè)技術(shù)也越來越受到人們的重視。本文是對(duì)復(fù)雜背景下人臉檢測(cè)進(jìn)行研究,膚色模型方面主要是高斯模型方法,結(jié)合了不同方法改進(jìn)了膚色分割和唇色檢測(cè)的效果用于人臉檢測(cè)。在實(shí)驗(yàn)中從不同大小、背景、光照、表情和光源方向等方面對(duì)多姿態(tài)的人臉圖像進(jìn)行了檢測(cè),取得了較好的效果,表明了該算法的有效性和實(shí)用性。&
4、lt;/p><p> 關(guān)鍵詞:人臉檢測(cè),色彩空間,膚色模型</p><p> Complex context of face detection algorithm design</p><p><b> Abstract</b></p><p> The face detection is face recogni
5、tion prior to the important and essential step is used to determine the location and size of the face in the video image. With the rapid development of science and technology, as well as the demand for pattern recognitio
6、n and computer interaction, face detection technology is also more and more attention has been paid. This is the face detection in complex background servant, color models of the Gaussian model approach, a combination of
7、 different methods to impr</p><p> Keywords: face detection ,color space ,color model</p><p><b> 目錄</b></p><p><b> 1 引言1</b></p><p><b>
8、; 1.1前言1</b></p><p> 1.2人臉檢測(cè)技術(shù)的應(yīng)用及難點(diǎn)1</p><p> 1.3人臉檢測(cè)技術(shù)的發(fā)展與現(xiàn)狀2</p><p> 1.4人臉檢測(cè)技術(shù)分類3</p><p> 1.4.1基于知識(shí)的方法4</p><p> 1.4.2不變特征量法6</p>
9、<p> 1.4.3模版匹配方法8</p><p> 1.4.4基于統(tǒng)計(jì)理論的方法9</p><p> 1.5本文的主要工作及內(nèi)容安排11</p><p> 2 圖像的預(yù)處理13</p><p> 2.1預(yù)處理過程13</p><p> 2.2預(yù)處理方法的研究13</p>
10、<p> 2.2.1直方圖均衡化14</p><p> 2.2.2灰度拉伸15</p><p> 2.2.3中值濾波16</p><p> 2.2.4同態(tài)濾波17</p><p> 2.3人臉檢測(cè)可用的樣本庫19</p><p> 3 基于膚色的人臉檢測(cè)方法20</p>
11、<p> 3.1色彩空間20</p><p> 3.1.1 RGB色彩空間21</p><p> 3.1.2亮度歸一化rgb色彩空間21</p><p> 3.1.3 YIQ色彩模型22</p><p> 3.1.4 HIS色彩空間22</p><p> 3.1.5 YCbCr色彩空
12、間23</p><p> 3.1.6 HSV色彩空間23</p><p> 3.2 膚色檢測(cè)模型的介紹24</p><p> 3.2.1簡(jiǎn)單色度空間模型24</p><p> 3.2.2統(tǒng)計(jì)直方圖模型25</p><p> 3.2.3高斯模型25</p><p> 4 算
13、法仿真平臺(tái)與實(shí)驗(yàn)結(jié)果27</p><p> 4.1膚色人臉檢測(cè)27</p><p> 5 總結(jié)與展望29</p><p> 5.1全文總結(jié)29</p><p> 5.2人臉檢測(cè)技術(shù)展望29</p><p><b> 參考文獻(xiàn)31</b></p><p>
14、;<b> 致謝33</b></p><p><b> 1 引言</b></p><p><b> 1.1前言</b></p><p> 人臉識(shí)別是一個(gè)具有廣闊應(yīng)用前景和挑戰(zhàn)性的課題,近年來在模式識(shí)別與計(jì)算機(jī)視覺領(lǐng)域受到廣泛關(guān)注。由于人體的指紋、人臉、虹膜、掌紋等生物特征具有唯一確定性,所有
15、這些生物特征成為了身份確定的重要識(shí)別特征。利用這些生物特征迅速判斷并確定一個(gè)人的身份成了現(xiàn)在各個(gè)國(guó)家重點(diǎn)研究的技術(shù),這使得生物識(shí)別技術(shù)有了很大程度的發(fā)展和完善。[1]其中應(yīng)用最廣泛的是指紋識(shí)別技術(shù),這一方面的研究和發(fā)展已經(jīng)驅(qū)近于成熟。在全球生物識(shí)別市場(chǎng)上,指紋技術(shù)已經(jīng)占了過半數(shù)的份額。人臉識(shí)別作為生物識(shí)別的一種形式,雖然其識(shí)別率與精確程度比不上指紋和虹膜識(shí)別,在需要保證高度安全的場(chǎng)合中也只能作為一種輔助手段,但是在一般性的場(chǎng)合下是可以勝
16、任的。并且相比利用指紋、視網(wǎng)膜等其他人體生物特征的人身鑒別方法,人臉識(shí)別具有蘊(yùn)涵信息量大、直接、友好、方便等特點(diǎn),易于為用戶接受,逐漸成為國(guó)內(nèi)外研究的熱點(diǎn)。</p><p> 人臉是一個(gè)信息極豐富的模式集合,是人類互相判別、認(rèn)識(shí)、記憶的主要標(biāo)志。通過對(duì)人臉的觀察,我們可以判斷一個(gè)人的性別、種族、身份甚至性格。而且隨著高速計(jì)算機(jī)和人工智能等技術(shù)的發(fā)展以及商業(yè)和執(zhí)法等方面需要的增長(zhǎng),利用人臉圖像進(jìn)行自動(dòng)人臉識(shí)別和身
17、份驗(yàn)證的研究和應(yīng)用得到了空前的重視,并在研究方法、設(shè)備等方面取得了長(zhǎng)足的進(jìn)步,尤其在包括可視電話、電視會(huì)議、智能計(jì)算機(jī)、多媒體智能娛樂、身份認(rèn)證和安保監(jiān)控系統(tǒng)等很多方面都有著極其廣泛的應(yīng)用。[2]一個(gè)完整的人臉識(shí)別系統(tǒng)應(yīng)該包括人臉檢測(cè)、特征提取以及匹配識(shí)別。人臉檢測(cè)是第一環(huán)節(jié),也是人臉識(shí)別的前提及關(guān)鍵步驟。因而,研究人臉檢測(cè)技術(shù)具有十分重要的意義。</p><p> 1.2人臉檢測(cè)技術(shù)的應(yīng)用及難點(diǎn)</p&
18、gt;<p> 相對(duì)于證件,口令,密碼等身份識(shí)別依據(jù),生物特征(如指紋.聲音,虹膜,人臉)具有更強(qiáng)的自身穩(wěn)定性和個(gè)體差異性,是身份識(shí)別的理想依據(jù)。其中人臉以其直觀,獲取方便等優(yōu)點(diǎn)受到了廣泛的關(guān)注,并被逐步應(yīng)用到多個(gè)領(lǐng)域。這種技術(shù)目前最熱門的應(yīng)用領(lǐng)域有四個(gè)方面: </p><p> 第一,身份認(rèn)證與安全防護(hù)。在這個(gè)世界上,只要有門的地方幾乎都帶有一把鎖。當(dāng)然,在許多安全級(jí)別要求較高的區(qū)域,例如金融
19、機(jī)構(gòu)、機(jī)關(guān)辦公大樓、運(yùn)動(dòng)場(chǎng)館、甚至重要設(shè)施的工地,都需要對(duì)大量的人員進(jìn)行基于身份認(rèn)證的門禁管理。手機(jī)、筆記本電腦等個(gè)人電子用品,在開機(jī)和使用中經(jīng)常要用到身份驗(yàn)證功能。 </p><p> 第二,媒體與娛樂。人們的許多娛樂活動(dòng)都是跟臉部有關(guān)的。最著名的娛樂節(jié)目之一就是川劇的變臉。在網(wǎng)絡(luò)虛擬世界里,通過人臉的變化,可以產(chǎn)生大量的娛樂節(jié)目和效果。手機(jī)、數(shù)碼相機(jī)等消費(fèi)電子產(chǎn)品中,基于人臉的娛樂項(xiàng)目越來越豐富。QQ、MS
20、N等即時(shí)通信工具以及虛擬化身網(wǎng)絡(luò)游戲也是人臉合成技術(shù)的廣闊市場(chǎng)。 </p><p> 第三,圖像搜索。目前,Google的圖像搜索其實(shí)還是文字搜索?;谌四槇D像識(shí)別技術(shù)的搜索引擎將會(huì)具有廣泛的應(yīng)用前景。</p><p> 第四,視頻壓縮。將人臉檢測(cè)技術(shù)的相關(guān)成果應(yīng)用在視頻分割技術(shù)中,可以對(duì)視頻目標(biāo)進(jìn)行更有效的提取。 </p><p> 在實(shí)際生活中人類能夠快速
21、,準(zhǔn)確的確認(rèn)空間中的人臉,但對(duì)計(jì)算機(jī)而言則</p><p> 是一個(gè)非常困難的任務(wù),完成計(jì)算機(jī)白動(dòng)人臉檢測(cè)需要面對(duì)的主要難點(diǎn)有以下幾</p><p><b> 個(gè)方面:</b></p><p> 1)如何判斷圖像中是否存在人臉,如何區(qū)別人臉和類似人臉的非人臉圖像,這是人臉檢測(cè)不同于人臉識(shí)別的地方。</p><p>
22、 2)人臉具有復(fù)雜的細(xì)節(jié)交化,臉形、膚色等特征的個(gè)體差異比較明顯;即使同一個(gè)人也存在不同的表情和姿態(tài)等,甚至可能有器官的缺失,這都增加了人臉的變化空間;</p><p> 3)由眼鏡、頭發(fā)和及其它外部物體造成的遮擋;</p><p> 4)由于成像角度的不同造成人臉的多姿態(tài),如平面內(nèi)旋轉(zhuǎn)、深度旋轉(zhuǎn)以及上下旋轉(zhuǎn),其中深度旋轉(zhuǎn)影響較大;</p><p> 5)弱
23、光照的影響,如圖像中的亮度、對(duì)比度的變化和陰影等;</p><p> 6)圖像的成像條件,如攝像設(shè)備的焦距、成像距離,圖像獲得的途徑。</p><p> 由此可見,人臉檢測(cè)涉及的問題十分廣泛,它是一個(gè)復(fù)雜的具有挑戰(zhàn)性的模鄭州大學(xué)碩士學(xué)位論文式分類問題。解決人臉檢測(cè)問題具有重要的學(xué)術(shù)價(jià)值,可以為其它類似的復(fù)雜模式檢測(cè)問題提供重要啟示,因此人們對(duì)人臉檢測(cè)進(jìn)行了大量的研究工作。</p&
24、gt;<p> 1.3人臉檢測(cè)技術(shù)的發(fā)展與現(xiàn)狀</p><p> 人臉檢測(cè)問題最初來源于人臉識(shí)別的研究,可以說人臉檢測(cè)和識(shí)別技術(shù)幾乎是同時(shí)發(fā)展的,自從上個(gè)世紀(jì)六.七十年代開始,經(jīng)過幾十年的曲折發(fā)展已經(jīng)逐漸成熟。尤其是最近十年,隨著計(jì)算機(jī)信息技術(shù)的發(fā)展和硬件性能的大幅度提高,人們提出了大量的人臉檢測(cè)方法并建立多個(gè)人臉檢測(cè)系統(tǒng),在檢測(cè)率和檢測(cè)速度上都取得了令人滿意的成果,已經(jīng)向?qū)嵱没~出了堅(jiān)實(shí)的一步
25、。</p><p> 早期的人臉檢測(cè)集中于靜止圖像,通常以檢測(cè)精度的提高和各種視角的人臉檢測(cè)為主要內(nèi)容。具有代表性的是基于特征的模型或者簡(jiǎn)單的模板匹配技術(shù),在空域上提取特征,能夠完成簡(jiǎn)單的人臉檢測(cè)任務(wù)。中期的發(fā)展開始采用基于模板的方法,用統(tǒng)計(jì)學(xué)習(xí)的方法建立人臉模型,可以實(shí)現(xiàn)復(fù)雜背景下的人臉檢測(cè),并且運(yùn)用運(yùn)動(dòng)信息來考察圖像序列中的人臉檢測(cè)。近期,研究者的方向各不相同,有人從頻域中提取特征,有人繼續(xù)研究更復(fù)雜的統(tǒng)計(jì)
26、模型,有人將最新的分類決策理論應(yīng)用于人臉檢測(cè)領(lǐng)域。在研究過程中,人們認(rèn)識(shí)到:人臉檢測(cè)研究的趨勢(shì)是利用多種線索(頭發(fā)、膚色、器官、輪廓、模板等)綜合多種分類方法,啟發(fā)式信息與統(tǒng)計(jì)學(xué)習(xí)方法相結(jié)合。隨著人臉識(shí)別技術(shù)的發(fā)展和市場(chǎng)對(duì)生物特征鑒定技術(shù)的認(rèn)可,實(shí)時(shí)人臉檢測(cè)技術(shù)已成為了一個(gè)迫切的要求。國(guó)外對(duì)人臉檢測(cè)問題的研究很多,比較著名的有CMU,Mfr,Cornell和Rock feller等,而且MPEG7標(biāo)準(zhǔn)組織已經(jīng)建立了人臉識(shí)別草案小組,人臉
27、檢測(cè)算法也是一項(xiàng)征集的內(nèi)容。國(guó)際上有關(guān)人臉檢測(cè)的論文數(shù)量也大幅度增長(zhǎng),IEEE的國(guó)際會(huì)議,如IEEE的FG(IEEE International Conference </p><p> 與國(guó)外相比,國(guó)內(nèi)對(duì)人臉檢測(cè)領(lǐng)域的研究起步較晚,但最近十年發(fā)展得非???,并在人臉檢測(cè)技術(shù)實(shí)用化方面取得了一定的成績(jī),已有基于人臉檢測(cè)技術(shù)的監(jiān)控產(chǎn)品投入市場(chǎng)。國(guó)內(nèi)開展人臉檢測(cè)研究的主要單位有清華大學(xué)、哈爾濱工業(yè)大學(xué)、北京工業(yè)大學(xué)、
28、中科院院計(jì)算所、中科院自動(dòng)化所。</p><p> 1.4人臉檢測(cè)技術(shù)分類</p><p> 對(duì)于人臉檢測(cè)的算法,國(guó)內(nèi)外研究者們提出了許多有效的人臉檢測(cè)算法,大體上可以分為4 類:基于知識(shí)(Knowledge-based)的方法,不變特征量法(Feature invariant),模版匹配方法(Template matching),基于統(tǒng)計(jì)理論的方法(Appearance-based)
29、。[3]基于知識(shí)的方法檢測(cè)速度較快,如Yang 和Huang 提出了基于鑲嵌圖的人臉檢測(cè)方法,對(duì)于正面人臉的檢測(cè)精度較高,但不適用于多姿態(tài)的人臉檢測(cè);基于模板的方法穩(wěn)定性高且魯棒性好,如梁路宏等提出的基于仿射模板匹配的方法來檢測(cè)多姿態(tài)人臉,但使用各種傾斜角的模板與輸入圖像中的每一個(gè)可能窗口進(jìn)行匹配,冗余匹配次數(shù)太多、檢測(cè)速度難以提高。為了解決人臉尺寸的不確定性,許多檢測(cè)算法往往需在圖像的多個(gè)分辨率上重復(fù)搜索,計(jì)算開銷大。Pau1 Vio
30、la 和Michael Jones 在2001 年提出了一種基于Haar-Like 型特征的Adaboost 人臉檢測(cè)算法,并使用Cascade 結(jié)構(gòu)將第一個(gè)真正實(shí)時(shí)的人臉檢測(cè)系統(tǒng)成功建立,因該算法具有檢測(cè)率高,實(shí)時(shí)性好的優(yōu)點(diǎn),成為學(xué)術(shù)界普遍采用的方法,但該方法需要</p><p> 當(dāng)然上述的分類并不是絕對(duì)的,實(shí)際上有許多人臉檢測(cè)的方法并不能簡(jiǎn)單地歸于上述中的某一類,而是幾類的組合,下面分別介紹幾種主要的人臉
31、檢測(cè)方法。</p><p> 1.4.1基于知識(shí)的方法</p><p> 這一類的方法一般都是先提取人臉的各種基本特征,然后根據(jù)一些知識(shí)規(guī)則來檢驗(yàn)它們是否符合人臉的先驗(yàn)知識(shí),以此來確認(rèn)圖像中是否包含人臉。此類方法所使用的人臉特征大致可分為基本特征和膚色特征。</p><p><b> 1、基本特征</b></p><p
32、> 人臉的基本特征主要包括灰度特征、輪廓線和形狀特征、結(jié)構(gòu)特征、紋理特征。(1)灰度特征</p><p> 多個(gè)人臉圖像的平均就是一個(gè)簡(jiǎn)單的人臉模板,可用于檢測(cè)人臉。相應(yīng)的眼模板和嘴模板也常被使用。人臉的眉、眼和嘴等區(qū)域的灰度值較低,前額、臉頰、鼻梁和下顎等其他區(qū)域的灰度值較高,因而人臉具有明顯的灰度分布特征對(duì)人臉區(qū)域進(jìn)行水平和垂直方向的灰度投影,根據(jù)極小點(diǎn)位置即可得到眉、眼、鼻和嘴的中心和各自所處的區(qū)
33、域。</p><p> (2)輪廓線和形狀特征</p><p> 人臉及人臉器官具有典型的輪廓線和形狀特征,如人臉輪廓、眉毛輪廓線、眼瞼輪廓、虹膜輪廓、鼻側(cè)線和嘴唇輪廓等可以近似視為橢圓、圓、弧線或線段等簡(jiǎn)單的幾何單元。相對(duì)于灰度特征輪廓線特征對(duì)光照變化具有一定的魯棒性,但在強(qiáng)光照變化下會(huì)產(chǎn)生一些偽輪廓線。</p><p><b> (3)結(jié)構(gòu)特征&
34、lt;/b></p><p> 人臉的對(duì)稱性也是十分有用的特征。正面人臉是左右對(duì)稱的,對(duì)應(yīng)輪廓線和灰度特征基本相同。人臉上的各個(gè)器官也具有自身的對(duì)稱性。眉、眼、鼻和嘴等區(qū)域是按一定比例關(guān)系組織在一起,各器官按照從上而下的順序排列,兩眼和嘴中心構(gòu)成一個(gè)三角形。每個(gè)人的眉、眼、鼻和嘴的相對(duì)位置,眉毛的厚度和弧度,嘴的寬高、臉形等特征各具特點(diǎn).頭發(fā)的灰度和肩寬等也可作為輔助特征。(4)紋理特征人臉具有特定的紋理
35、特征基于灰度共生矩陣可計(jì)算人臉的一系列紋理特征。</p><p><b> 2、膚色特征</b></p><p> 對(duì)于彩色圖像膚色是一個(gè)有效的特征很多顏色模型如RGB、歸一化rgb、HSV、YCbCr、YIQ、YES、CIEXYZ、CIELUV、CIELab、CIEDSH、TSL等常被采用。一些研究表明,TSL彩色空間具有更好的描述能力。在歸一化的彩色空間中,單
36、一高斯模型可以有效地描述膚色的空間分布,而混合高斯模型能更好地描述膚色在非歸一化彩色空間的分布。膚色直方圖也常用于描述膚色的分布。就目前而言,基于以上人臉特征的人臉檢測(cè)已經(jīng)有很多方法,比較著名的主要有下面這些方法:[4]</p><p> Sirohey等使用邊緣提取后的圖像進(jìn)行啟發(fā)式搜索進(jìn)行對(duì)面部橢圓邊緣進(jìn)行擬和的方法。</p><p> Govindaraju等使用變形模板(def
37、ormable template)匹配頭項(xiàng)輪廓線和左右兩條面頰輪廓線實(shí)現(xiàn)人臉定位。</p><p> Yang等首先提出采用由粗到細(xì)的三級(jí)結(jié)構(gòu)的方法檢測(cè)人臉。通過平均和下采樣方法得到多個(gè)不同分辨率的圖像,這些低分辨率圖像被稱為鑲嵌圖(MosaicImage)。在最低兩級(jí)分辨率的鑲嵌圖中,采用一系列規(guī)則快速地獲得人臉候選區(qū)域。然后在高分辨率圖像中,提取人臉特征的輪廓線,符合眼、嘴特征的候選區(qū)域被最終確認(rèn)為人臉圖像
38、。</p><p> Miao等基于人臉特征輪廓線的重心定義了重心模板。先用重心模板粗匹配再將候選人臉區(qū)域劃分為9個(gè)子區(qū)域,根據(jù)各子區(qū)域內(nèi)灰度特征和輪廓線象素?cái)?shù)的比例關(guān)系進(jìn)一步驗(yàn)證。</p><p> Shen和wang等提出采用人臉橫紋特征檢測(cè)可能的眼睛對(duì),獲得候選區(qū)域后,再采用灰度投影、紋理檢測(cè)、二維嫡分割等規(guī)則進(jìn)行驗(yàn)證的人臉檢測(cè)方法。后來Shen和Wu等人聯(lián)合提出特征和模板結(jié)合的
39、人臉檢測(cè)算法。為了能夠較好地區(qū)分兩眼的橫紋,該方法同時(shí)采用方形和矩形單元鑲嵌圖,并用預(yù)定義的具有人臉?biāo)酱怪狈较蚍骞忍卣鞯乃膫€(gè)模板進(jìn)一步確認(rèn)人臉區(qū)域。該算法被接受進(jìn)入MPEG-7標(biāo)準(zhǔn)。</p><p> H.Martin設(shè)計(jì)了膚色模型表征人臉膚色,利用一個(gè)感光模型對(duì)輸入圖像修正和補(bǔ)償,并建立人臉顏色分類器,其輸出作為神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行檢測(cè)。此外,Tony等采用高斯混合模型表示人臉膚色RGB中各個(gè)分量的統(tǒng)計(jì)分布,
40、通過閾值比較判斷像素是否為人臉像素。YING DAI[5]等利用彩色信息,并結(jié)合人臉的紋理特征,設(shè)計(jì)了SGLD共發(fā)矩陣方法進(jìn)行檢測(cè)。Haiyuan Wu[6]通過在XYZ彩色空間中,對(duì)人臉膚色和頭發(fā)顏色的分布建立模糊邏輯理論的描述模型,通過計(jì)算隸屬度來確定人臉膚色區(qū)域。</p><p> 總的來說,這種利用人臉的輪廓、對(duì)稱性等少量特征的方法適用于較強(qiáng)約束條件下(如簡(jiǎn)單背景頭肩圖像等)的人臉檢測(cè)。由于使用的特征較
41、少,此類算法可以達(dá)到較高的檢測(cè)速度,實(shí)現(xiàn)實(shí)時(shí)檢測(cè)與跟蹤。但是,也正是因?yàn)檫@一類的人臉檢測(cè)方法主要是利用知識(shí)規(guī)則來描述人臉,所以和人臉先驗(yàn)知識(shí)的完備性有很大關(guān)系。由于人臉樣本是開放集合,獲取先驗(yàn)知識(shí)就變得比較困難,從而使這一類方法的檢測(cè)能力受到限制。尤其在復(fù)雜背景下,由于人臉特征變化大,入臉的界定涉及多種因素綜合作用的結(jié)果,因此要想抽象出既能表達(dá)人臉的共性,又能不同別的概念相交叉的人臉規(guī)則難度是相當(dāng)大的,已有的規(guī)則都存在著不同方面的局限性
42、。</p><p> 1.4.2不變特征量法</p><p> 此類方法直接應(yīng)用人臉的特征進(jìn)行檢測(cè)。所謂特征是指對(duì)人類來說肉眼可見的特性,如膚色、臉部輪廓、五官結(jié)構(gòu)等。人臉的這些特性總是存在著一定的規(guī)律,我們可以利用這些規(guī)律來進(jìn)行人臉檢測(cè)。[7]</p><p> (1)輪廓規(guī)則法:人臉的輪廓可近似地看成一個(gè)橢圓,則人臉檢測(cè)可以通過檢測(cè)橢圓來完成。Govin2
43、daraju等把人臉抽象為3段輪廓線:頭頂輪廓線(head contour),左側(cè)臉輪廓線(1eft contour)和右側(cè)臉輪廓線(right contour)。對(duì)任意一幅圖像,首先進(jìn)行邊緣檢測(cè),并對(duì)細(xì)化后的邊緣提取曲線特征,然后計(jì)算各曲線組合成人臉的評(píng)估函數(shù)檢測(cè)人臉。Tankus利用凸檢測(cè)的方法進(jìn)行人臉檢測(cè)。</p><p> (2)器官分布法:雖然人臉因人而異,但都遵循一些普遍適用的規(guī)則,即血官分布的幾何
44、規(guī)則。例如五官中兩個(gè)眼睛總是對(duì)稱分布在人臉的上半部分,鼻子和嘴唇中心點(diǎn)的連線基本與兩眼之間的連線垂直等。這種方法一般有兩種思路:一種是“從上至下”,其中最為簡(jiǎn)單有效的是Yang等人提出的Mosaic方法,它給出了基于人臉區(qū)域灰度分布的規(guī)則,依據(jù)這些規(guī)則對(duì)圖像從粗分辨率到高分辨率進(jìn)行篩選,以樣本滿足這些規(guī)則的程度作為檢測(cè)的判據(jù)。另一種思路則是“從下至上”,先直接檢測(cè)幾個(gè)器官可能分布的位置,然后將這些位置點(diǎn)分別組合,用器官分布的幾何關(guān)系準(zhǔn)則
45、進(jìn)行篩選,找到可能存在的人臉。</p><p> (3)顏色紋理法:人臉膚色在去除亮度的色度空問具有聚類性,顏色信息在一定程度上可以將人臉同大部分背景區(qū)分開來,因此可以利用膚色模型有效地檢測(cè)人臉。利用膚色信息檢測(cè)人臉的算法具有計(jì)算量小、算法相對(duì)簡(jiǎn)單、易于實(shí)現(xiàn)、快速等特點(diǎn)。并且用色度表示入臉特征有一個(gè)最大的特點(diǎn),就是具有姿態(tài)不變性。Lee等設(shè)計(jì)了膚色模型表征人臉顏色,利用感光模型進(jìn)行復(fù)雜背景下人臉及器官的檢測(cè)與分
46、割。Dai利用了SGLD(空間灰度共生矩陣)紋理圖信息作為特征進(jìn)行低分辨率的人臉檢測(cè)。Saber等則將顏色、形狀等結(jié)合在一起來進(jìn)行人臉檢測(cè)。</p><p> (4)對(duì)稱性規(guī)則:人臉具有一定的軸對(duì)稱性,各器官也具有一定的對(duì)稱性。Zabrodsky提出連續(xù)對(duì)稱性檢測(cè)方法,檢測(cè)一個(gè)圓形區(qū)域的對(duì)稱性,從而確定是否為人臉。Reisfield提出廣義對(duì)稱變換方法檢測(cè)局部對(duì)稱性強(qiáng)的點(diǎn)來進(jìn)行人臉器官定位。盧春雨DI則定義方向
47、對(duì)稱變換,分別在不同方向上考察對(duì)稱性,不僅能夠用來尋找強(qiáng)對(duì)稱點(diǎn),而且可描述有強(qiáng)對(duì)稱性物體的形狀信息,在進(jìn)行人臉器官定位時(shí)更為有效。</p><p> (5)運(yùn)動(dòng)規(guī)則法:若輸入圖像為動(dòng)態(tài)圖像序列,則可以利用人臉或人臉的器官相對(duì)于背景的運(yùn)動(dòng)來檢測(cè)人臉,比如利用眨眼或說話的方法實(shí)現(xiàn)人臉與背景的分離。MarqudsI使用連接算子和分割投影分別實(shí)現(xiàn)基于動(dòng)態(tài)圖像序列的人臉分割和跟蹤,并在實(shí)驗(yàn)中對(duì)MPEG24和MPEG27格
48、式的圖像序列測(cè)試,取得比較滿意的結(jié)果。由于圖像序列的計(jì)算遠(yuǎn)比靜止圖像的計(jì)算復(fù)雜和耗時(shí),基于動(dòng)態(tài)圖像序列的人臉識(shí)別方法是隨著計(jì)算機(jī)的高速發(fā)展和視頻監(jiān)控等應(yīng)用的需要在近幾年才逐漸成為一個(gè)研究的熱點(diǎn)。這些方法都是充分利用已知的人臉知識(shí)信息,找到各分布特征之間的關(guān)系,從而進(jìn)行人臉的提取。要想進(jìn)一步提高知識(shí)模型的適應(yīng)能力,需要綜合更多的特征,這實(shí)際上涉及到圖像理解這一困難的問題。這也是此類方法進(jìn)一步發(fā)展遇到的主要障礙。</p>&l
49、t;p> 1.4.3模版匹配方法</p><p> 此類方法[8]首先建立并存儲(chǔ)一些人臉模板作為標(biāo)準(zhǔn),可以包括正面人臉或是單獨(dú)的眼睛、鼻子、嘴唇等。接著利用一些算法來計(jì)算各待測(cè)區(qū)域與標(biāo)準(zhǔn)模板的相似程度(或稱相關(guān)性),利用這一相似程度來判斷某一區(qū)域是否為人臉。</p><p> (1)鑲嵌圖法(又稱為馬賽克圖):所謂鑲嵌圖法就是將圖像劃分為一組大小相同的方格,每個(gè)方格的灰度為格中
50、各個(gè)像素的平均值。鑲嵌圖特征是指這些塊的值應(yīng)滿足的約束規(guī)則。Yang等人將入臉的五官區(qū)域分別劃分為4×4和8×8個(gè)馬賽克塊,使用一組規(guī)則進(jìn)行檢驗(yàn),并且利用邊緣特征進(jìn)一步驗(yàn)證。盧春雨等對(duì)鑲嵌圖方法進(jìn)行了改進(jìn),按照人臉器官的分布將人臉劃分為3×3個(gè)馬賽克塊,在檢測(cè)中自適應(yīng)的調(diào)整各塊的大小,使用一組基于各塊灰度和梯度統(tǒng)計(jì)特征的知識(shí)規(guī)則檢驗(yàn)該區(qū)域是否為人臉,取得了較好的實(shí)驗(yàn)結(jié)果。</p><p&
51、gt; (2)預(yù)定模板匹配法:根據(jù)人臉的先驗(yàn)知識(shí)確定出人臉輪廓模板以及各個(gè)器官特征的子模板,先通過計(jì)算圖像中區(qū)域和人臉輪廓模板的相關(guān)值來檢測(cè)出人臉候選區(qū)域,然后利用器官特征子模板驗(yàn)證上一步檢測(cè)出的人臉候選區(qū)域是否包含人臉。Sakai等人使用眼睛、鼻子、嘴和人臉輪廓等子模板建模,檢測(cè)照片中的正面人臉。采用“雙眼一人臉”模板,將平均臉的雙眼模板剪裁出來,濾波時(shí)先使用雙眼模板再使用人臉模板,以提高匹配速度并取得更好的性能。將人臉圖像二值化后
52、得到人臉輪廓,然后與模板庫中的人臉模板匹配,根據(jù)圖像與模板之間的Hausdroff距離及相關(guān)閾值判定取舍。這種方法的缺點(diǎn)在于不能有效處理尺度、姿態(tài)和形狀的變化。</p><p> (3)變形模板法:其主要思想是定義一個(gè)可變形的參數(shù)模板和一個(gè)能量函數(shù)來描述特征,通過一個(gè)非線性最優(yōu)化方法求得能使能量函數(shù)最小的參數(shù)模板,此模板即被認(rèn)為是所求特征的描述。Yullie等人提出來基于彈性模板的方法用于人臉的檢測(cè)。當(dāng)用彈性模
53、板進(jìn)行人臉檢測(cè)時(shí),將可調(diào)模板在待檢測(cè)圖像中移動(dòng)并動(dòng)態(tài)的調(diào)整其參數(shù),計(jì)算能量函數(shù)。當(dāng)能量函數(shù)達(dá)到最小值時(shí),根據(jù)其位置和參數(shù)所決定的可調(diào)模板形狀應(yīng)該達(dá)到與人臉形狀的最佳擬合,由此檢測(cè)到一幅人臉。這種方法的優(yōu)點(diǎn)是由于使用的彈性模板可調(diào),能夠檢測(cè)不同大小、具有不同偏轉(zhuǎn)角度的人臉。但缺點(diǎn)是檢測(cè)前必須根據(jù)待測(cè)人臉的形狀來設(shè)計(jì)彈性模板的輪廓,否則影響收斂的效果;當(dāng)對(duì)圖像進(jìn)行全局搜索時(shí),由于要?jiǎng)討B(tài)的調(diào)整參數(shù)和計(jì)算能量函數(shù),計(jì)算時(shí)間過長(zhǎng)。</p&g
54、t;<p> 1.4.4基于統(tǒng)計(jì)理論的方法</p><p> 基于統(tǒng)計(jì)的方法[9]是很重要的人臉檢測(cè)方法。這類方法不是針對(duì)人臉的某一特征,而是從整個(gè)人臉的角度出發(fā),利用統(tǒng)計(jì)的原理,從成千上萬張人臉圖像中提取出人臉共有的一些規(guī)律,利用這些規(guī)律來進(jìn)行人臉檢測(cè)。這種方法的思想與模板匹配方法的不同之處在于,它并不首先人工的對(duì)人臉進(jìn)行分析或者抽取模板,也不對(duì)輸入圖像進(jìn)行復(fù)雜的處理,而是搜集大量的人臉和非人
55、臉樣本作為訓(xùn)練集,通過學(xué)習(xí)的方法在訓(xùn)練樣本集上建立一個(gè)能對(duì)人臉和非人臉樣本進(jìn)行正確識(shí)別的分類器,然后對(duì)被檢測(cè)圖像進(jìn)行全局掃描,用分類器檢測(cè)掃描到的圖像窗口中是否包含人臉。在此類方法中,特征向量、統(tǒng)計(jì)學(xué)、信息學(xué)等思想都得到了運(yùn)用。</p><p> (1)人工神經(jīng)網(wǎng)絡(luò)法(Artificial Neural Network,ANN):通過訓(xùn)練一個(gè)網(wǎng)絡(luò)結(jié)構(gòu),把模式的統(tǒng)計(jì)特性隱含在神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)之中?;谌斯ど窠?jīng)
56、網(wǎng)絡(luò)的方法對(duì)于復(fù)雜的、難以顯示描述的模式具有獨(dú)特的優(yōu)勢(shì)。在這方面,CMU的Rowley的工作最為引人注目。G.Burel和D.Carel在多分辨率分析的基礎(chǔ)上采用多層感知器(MLP,Multi—Layer Percepfion)進(jìn)行人臉檢測(cè)。J.Vincent等利用多個(gè)MLP構(gòu)成了分層人臉特征檢測(cè)系統(tǒng)(HPFLS,Hierarchical PerceptionFeatureLocation System):類似地,E Juell和R.M
57、arsh也提出了一種分層的神經(jīng)網(wǎng)絡(luò),包括子層的檢測(cè)跟睛、嘴巴和鼻子的三個(gè)BP網(wǎng)絡(luò)以及父層檢測(cè)全臉的一個(gè)BP網(wǎng)絡(luò);S.Lin等提出了一種基于概率決策的神經(jīng)網(wǎng)絡(luò)(PDBNN,ProbabilisticDecision.Based Neural Network)分別進(jìn)行人臉和眼睛的檢測(cè)。</p><p> (2)特征空間法:此類方法將人臉區(qū)域圖像變換到某一特征空間,根據(jù)其在特征空間中的特征規(guī)律劃分“人臉”與“非人臉”
58、兩類模式。主分量分析(PCA,Principal—ComponentAnalysis)是一種常用的方法。Turk等將此方法用于人臉識(shí)別,提出DFFS(Distance FromFace Space)的距離度量概念,通過輸入圖像與人臉空間的距離來判定是否是“人臉”模式。Sung等采用k~均值聚類方法在特征空間里建立了6組對(duì)應(yīng)的“人臉”和“非人臉”簇(Clusters),通過檢測(cè)圖像到各簇中心的距離來判斷是否“人臉”模式。屬于特征空間方法的
59、還有基于事例學(xué)習(xí)的方法、因子分解方法(FactorAnalysis,F(xiàn)A)和Fisher準(zhǔn)則方法(Fisher Linear Discriminate,F(xiàn)LD)等。</p><p> (3)支持向量機(jī)法(Support Vector Machine,SVM):SVM是在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上發(fā)展出的一種新的模式識(shí)別方法,它是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理的方法。較之于基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的ANN,一些難以逾越的問題如:模型
60、選擇和過學(xué)習(xí)問題、非線性和維數(shù)災(zāi)難問題、局部極小點(diǎn)問題等都得到了很大程度上的解決。Osuna等首先將SVM方法用于人臉檢測(cè),該方法使用大量的人臉樣本和“自舉”方法收集的“非人臉”樣本訓(xùn)練SVM,對(duì)每一個(gè)19×19的檢測(cè)窗口使用SVM進(jìn)行分類,以區(qū)分“人臉”和“非人臉”窗口。Osuna等指出,SVM分類器的作用是刻劃了“人臉”樣本和“非人臉”樣本之間在結(jié)構(gòu)風(fēng)險(xiǎn)最小化意義上的最優(yōu)分界面。</p><p>
61、 (4)概率模型法:基于概率模型方法的一種思路是計(jì)算輸入圖像區(qū)域region屬于人臉模式object的后驗(yàn)概率p(object/region),據(jù)此對(duì)所有可能的圖像窗口進(jìn)行判別。CMU的Schneiderman等提出一種基于后驗(yàn)概率估計(jì)的人臉檢測(cè)方法。另一種概率模型是應(yīng)用隱馬爾可夫模型(Hidden Markov Models,HMM)?;贖MM的方法一般只使用“入臉”樣本進(jìn)行訓(xùn)練,主要針對(duì)用于人臉識(shí)別的頭肩部圖像。</p>
62、;<p> (5)基于積分圖像特征法(Integral Image):此方法是Viola等新近提出的一種算法,它綜合使用積分圖像描述方法,Adaboost學(xué)習(xí)算法及訓(xùn)練方法、級(jí)聯(lián)弱分類器。積分圖像是指該像素以前、以上所有像素灰度和;級(jí)聯(lián)弱分類器是多個(gè)弱分類器的組合,而且分類器結(jié)構(gòu)簡(jiǎn)單、檢測(cè)速度快,幾乎不會(huì)漏檢一張人臉,不過錯(cuò)誤預(yù)警率較高,但錯(cuò)誤報(bào)警并不影響后續(xù)處理的效果,所以通常將這樣的弱分類器作為預(yù)處理器?;诮y(tǒng)計(jì)模型
63、的方法具有很強(qiáng)的適應(yīng)性和魯棒性,但由于需要對(duì)所有可能的檢測(cè)窗口進(jìn)行窮舉搜索,計(jì)算復(fù)雜度很高,因此檢測(cè)速度有待提高。此類方法主要針對(duì)正面端正人臉的檢測(cè),旋轉(zhuǎn)人臉、多姿態(tài)人臉的檢測(cè)由于比較復(fù)雜和困難,有效的方法還不多。</p><p> 近年來人們提出來基于混合方法的人臉檢測(cè)方法。梁路宏等在人臉檢測(cè)研究綜述中指出:人臉檢測(cè)研究的趨勢(shì)是利用多種線索(頭發(fā)、膚色、器官、輪廓、模板等)綜合多種分類方法,啟發(fā)式信息與統(tǒng)計(jì)學(xué)
64、習(xí)方法相結(jié)合。[11]基于混合的方法結(jié)合理兩種或更多種前面提到的方法,進(jìn)而形成更準(zhǔn)確和魯棒的人臉檢測(cè)系統(tǒng)。如人們已經(jīng)提出來基于顏色和運(yùn)動(dòng)的融合方法,運(yùn)動(dòng)、顏色、形狀信息融合方法,顏色分割、運(yùn)動(dòng)檢測(cè)、形狀分析的融合方法等進(jìn)行人臉檢測(cè)?;诨旌戏椒ǖ膬?yōu)點(diǎn)是實(shí)現(xiàn)了信息的融合,混合方法的優(yōu)勢(shì)是使一種方法的缺點(diǎn)被另一種方法的優(yōu)點(diǎn)補(bǔ)償。因此,混合方法將是未來人臉檢測(cè)研究領(lǐng)域的主要課題。</p><p> 1.5本文的主要工
65、作及內(nèi)容安排</p><p> 人臉檢測(cè)問題由于其自身的復(fù)雜性,使得雖然有眾多研究人員潛心研究多年,仍舊未能得到徹底解決。作為一個(gè)典型模式識(shí)別問題,人臉檢測(cè)的研究取得的成果無疑對(duì)其它的模式識(shí)別問題的解決有著良好的借鑒作用。因此,它已成為模式識(shí)別領(lǐng)域的一個(gè)研究熱點(diǎn)。</p><p><b> 第一章,引言。</b></p><p> 介紹了
66、人臉檢測(cè)技術(shù)的應(yīng)用、發(fā)展過程及其重要意義,分類討論了人臉檢測(cè)技術(shù),主要介紹了靜態(tài)人臉檢測(cè)的四個(gè)主要技術(shù):基于知識(shí)(Knowledge-based)的方法,不變特征量法(Feature invariant),模版匹配方法(Template matching),基于統(tǒng)計(jì)理論的方法(Appearance-based),最后說明了本文的研究方向。</p><p> 第二章,圖像的預(yù)處理。</p><
67、p> 討論了人臉檢測(cè)技術(shù)中有關(guān)圖像預(yù)處理的主要技術(shù),針對(duì)圖像中出現(xiàn)黑色上下邊框的圖像進(jìn)行處理,從這類圖像中去除上下的黑色邊框同時(shí)改變圖像的寬度、高度等信息。還介紹了對(duì)亮度進(jìn)行規(guī)定化的方法,最后介紹了目前通用的幾個(gè)人臉數(shù)據(jù)庫,以及制作的人臉樣本集。</p><p> 第三章基于膚色的人臉檢測(cè)方法</p><p> 本文選擇目前廣泛使用的YCbCf色彩模型來進(jìn)行膚色分割和人臉驗(yàn)證,
68、最終構(gòu)建了一個(gè)純粹利用膚色來分割人臉的系統(tǒng)。對(duì)膚色區(qū)域分割算法進(jìn)行了一定研究。</p><p> 第四章,算法仿真平臺(tái)與實(shí)驗(yàn)結(jié)果</p><p> 給出了本課題的算法仿真試驗(yàn)平臺(tái)并分別對(duì)各個(gè)模塊進(jìn)行了介紹。</p><p><b> 第五章,總結(jié)與展望</b></p><p> 對(duì)本文工作進(jìn)行了總結(jié)并展望人臉檢測(cè)
69、技術(shù)進(jìn)一步的發(fā)展方向。</p><p><b> 2 圖像的預(yù)處理</b></p><p><b> 2.1預(yù)處理過程</b></p><p> 預(yù)處理(前處理)是人臉識(shí)別過程中的一個(gè)重要環(huán)節(jié)。那么什么是預(yù)處理呢?預(yù)處理[12]就是在圖像分析中,對(duì)輸入圖像進(jìn)行特征抽取、分割和匹配前所進(jìn)行的處理。輸入圖像由于圖像采集環(huán)
70、境的不同,如光照明暗程度以及設(shè)備性能的優(yōu)劣等,往往存在有噪聲,對(duì)比度不夠等缺點(diǎn)。另外,距離遠(yuǎn)近,焦距大小等又使得人臉在整幅圖像中間的大小和位置不確定。為了保證人臉圖像中人臉大小,位置以及人臉圖像質(zhì)量的一致性,必須對(duì)圖像進(jìn)行預(yù)處理。圖像預(yù)處理的主要目的是消除圖像中無關(guān)的信息,濾除干擾、噪聲,恢復(fù)有用的真實(shí)信息,增強(qiáng)有關(guān)信息的可檢測(cè)性和最大限度地簡(jiǎn)化數(shù)據(jù),從而改進(jìn)特征抽取、圖像分割、匹配和識(shí)別的可靠性。</p><p&g
71、t; 預(yù)處理流程圖如圖所示:</p><p> 圖2.1 預(yù)處理流程圖</p><p> 在預(yù)處理階段,對(duì)圖像進(jìn)行優(yōu)化, 盡可能去除或者減小光照、成像系統(tǒng)、外部環(huán)境等對(duì)待處理圖像的干擾,為后續(xù)處理提高質(zhì)量。以便使不同的人臉圖像盡可能在同一條件下完成特征提取、訓(xùn)練和識(shí)別。人臉圖像的預(yù)處理主要包括人臉扶正,人臉圖像的增強(qiáng),以及歸一化等工作。人臉扶正是為了得到人臉位置端正的人臉圖像;圖像增
72、強(qiáng)是為了改善人臉圖像的質(zhì)量,不僅在視覺上更加清晰圖像,而且使圖像更利于計(jì)算機(jī)的處理與識(shí)別。歸一化工作的目標(biāo)是取得尺寸一致,灰度取值范圍相同的標(biāo)準(zhǔn)化人臉圖像。</p><p> 2.2預(yù)處理方法的研究</p><p> 輸入圖像的預(yù)處理是人臉檢測(cè)技術(shù)的一個(gè)關(guān)鍵環(huán)節(jié),目的是使原始圖像更適合進(jìn)一步加工以從中提取信息,并使圖像分析獲得更好的結(jié)果,預(yù)處理對(duì)系統(tǒng)最終的檢測(cè)效果具有重大影響。在自然條
73、件下,圖像的成像條件十分復(fù)雜,由于光照條件,背景環(huán)境及成像設(shè)備等因素的影響,圖像中經(jīng)常會(huì)出現(xiàn)陰影并且包含大量的噪聲,在人臉特征提取過程中,這些噪聲很容易被誤認(rèn)為眉毛.眼睛,嘴等局部特征,大大降低了人臉檢測(cè)系統(tǒng)的檢測(cè)性能。此外,在人臉檢測(cè)系統(tǒng)建立的過程中通常需要對(duì)人臉樣本進(jìn)行亮度.對(duì)比度等進(jìn)行調(diào)整,否則同一個(gè)特征在不同的樣本中可能呈現(xiàn)出不同的形式,這會(huì)導(dǎo)致最終訓(xùn)練結(jié)果不可用。因此,有效的圖像預(yù)處理技術(shù)一直是人臉檢測(cè)技術(shù)研究的重點(diǎn)之一。&l
74、t;/p><p> 2.2.1直方圖均衡化</p><p> 直方圖均衡化[13]又稱直方圖平坦化,是將一已知灰度概率密度分布的圖像,經(jīng)過某種變換,變成一幅具有均勻灰度概率分布的新圖像,其結(jié)果是擴(kuò)展了像元取值的動(dòng)態(tài)范圍,從而達(dá)到了增強(qiáng)圖像整體對(duì)比度的效果。</p><p> 直方圖是一種點(diǎn)操作,它逐點(diǎn)改變圖像的灰度值,盡量使各個(gè)灰度級(jí)別都具有相同的數(shù)量的像素點(diǎn),使
75、直方圖趨于平衡。直方圖均衡可以使輸入圖像轉(zhuǎn)換為在每一個(gè)灰度級(jí)上都有相同像素點(diǎn)數(shù)的輸出圖像(即輸出的直方圖是平的)。這對(duì)于圖像比較或分割是十分有用的</p><p> 均衡化處理的步驟如下:</p><p> ?。?)對(duì)給定的待處理圖像統(tǒng)計(jì)其直方圖,求出 </p><p> ?。?)根據(jù)統(tǒng)計(jì)出的直方圖采用累積分布函數(shù)做變換 求變換后的新灰度;</p>
76、<p> ?。?)用新灰度代替就灰度,求出 ,這一步是近似過程,應(yīng)根據(jù)處理的目的盡量做到合理,同時(shí)把灰度值相等或近似的合并到一起。</p><p> 圖 2.2 處理前后的直方圖對(duì)比</p><p> 直方圖均衡化的優(yōu)點(diǎn)是能自動(dòng)地增強(qiáng)整個(gè)圖像的對(duì)比度,但它的具體增強(qiáng)效果卻不易控制,處理的結(jié)果總是得到全局均衡化的直方圖。實(shí)際中有時(shí)需要變換直方圖使之成為某個(gè)需要的形狀,從而有選擇
77、的增強(qiáng)某個(gè)灰度值范圍內(nèi)的對(duì)比度或使圖像灰度值的分布滿足特定的要求。這時(shí)可以采用比較靈活的直方圖規(guī)定化方法。直方圖規(guī)定化是另外一種比較常用的直方圖修正技術(shù)。按照一給定的直方圖來修正原始圖像的直方圖,使它具有與給定直方圖相識(shí)的形狀,這種方法可以突出我們感興趣的灰度范圍。</p><p><b> 2.2.2灰度拉伸</b></p><p> 灰度拉伸[14]又叫對(duì)比度
78、拉伸,它是最基本的一種灰度變換,使用的是最簡(jiǎn)單的分段線性變換函數(shù),它是將原圖像亮度值動(dòng)態(tài)范圍按線性關(guān)系擴(kuò)展到指定的范圍或整個(gè)動(dòng)態(tài)范圍。它的主要思想是提高圖像處理時(shí)灰度級(jí)的動(dòng)態(tài)范圍,適用于低對(duì)比度圖像的處理,一般由兩個(gè)基本操作組成:</p><p> (1)直方圖統(tǒng)計(jì),來確定對(duì)圖像進(jìn)行灰度拉伸的兩個(gè)拐點(diǎn);</p><p> ?。?)灰度變換,根據(jù)步驟⑴確定的分段線性變換函數(shù)進(jìn)行像素灰度值的
79、映射。</p><p> 圖 2.3 原始圖像以及灰度拉伸處理后的效果</p><p> 由兩幅圖像處理前后的效果變化可以看出,灰度拉伸后增強(qiáng)了圖像的對(duì)比度,使得圖像細(xì)節(jié)更加的突出。</p><p><b> 2.2.3中值濾波</b></p><p> 中值濾波[15]是一種非線性處理技術(shù),能抑制圖像中的噪聲。
80、它是基于圖像的這樣一種特性:噪聲往往以孤立的點(diǎn)的形式出現(xiàn),這些點(diǎn)對(duì)應(yīng)的像素?cái)?shù)很少,而圖像則是由像素較多、面積較大的小塊構(gòu)成。</p><p> 在一維的情況下,中值濾波器是一個(gè)含有奇數(shù)個(gè)像素的窗口。在處理之后,位于窗口正中的像素的灰度值,用窗口內(nèi)各像素灰度值的中值代替。例如若窗口長(zhǎng)度為5,窗口中像素的灰度值為80、90、200、110、120,則中值為110,因?yàn)榘葱〉酱螅ɑ虼蟮叫。┡判蚝?,第三位的值?10。
81、于是原來窗口正中的灰度值200就由110取代。如果200是一個(gè)噪聲的尖峰,則將被濾除。然而,如果它是一個(gè)信號(hào),則濾波后就被消除,降低了分辨率。因此中值濾波在某些情況下抑制噪聲,而在另一些情況下卻會(huì)抑制信號(hào)。</p><p> 無論是直接獲取的灰度圖像,還是由彩色圖像轉(zhuǎn)換得到的灰度圖像,里面都有噪聲的存在,噪聲對(duì)圖像質(zhì)量有很大的影響。進(jìn)行中值濾波不僅可以去除孤點(diǎn)噪聲,而且可以保持圖像的邊緣特性,不會(huì)使圖像產(chǎn)生顯著
82、的模糊,比較適合于實(shí)驗(yàn)中的人臉圖像。</p><p> 中值濾波是一種非線性的信號(hào)處理方法,因此中值濾波器也就是一種非線性的濾波器。中值濾波器最先被應(yīng)用于一維信號(hào)的處理中,后來被人們引用到二維圖像的處理中來。中值濾波可以在一定程度上克服線性濾波所帶來的圖像細(xì)節(jié)模糊,而且它對(duì)濾除脈沖干擾和圖像掃描噪聲非常有效。</p><p><b> 中值濾波的步驟:</b>&l
83、t;/p><p> ?。?)將模板在圖中漫游,并將模板中心與圖中某個(gè)像素位置重合;</p><p> (2)讀取模板下各對(duì)應(yīng)像素的灰度值;</p><p> (3)將這些灰度值從小到大排成一列;</p><p> ?。?)找出這些值里排在中間的一個(gè);</p><p> ?。?)將這個(gè)中間值賦給對(duì)應(yīng)模板中心位置的像素。&
84、lt;/p><p> 由以上步驟可以看出,中值濾波的主要功能就是讓與周圍像素灰度值的差比較大的像素改取與周圍像素值接近的值,所以它對(duì)孤立的噪聲像素的消除能力是很強(qiáng)的。由于它不是簡(jiǎn)單的取均值,所以產(chǎn)生的模糊比較少。換句話說,中值濾波即能消除噪聲又能保持圖像的細(xì)節(jié)。</p><p> 圖 2.4 原始圖像與中值濾波后的效果圖</p><p> 由原始圖像和中值濾波后的
85、圖像對(duì)比可以看出,處理之后,人臉圖像中的斑點(diǎn)得到了去除。</p><p><b> 2.2.4同態(tài)濾波</b></p><p> 同態(tài)濾波增強(qiáng)[16]是把頻率過濾和灰度變換結(jié)合起來的一種處理方法。它是把圖像的照明反射為頻域處理的基礎(chǔ),利用壓縮灰度范圍和增強(qiáng)對(duì)比度來改善圖像的一種處理技術(shù)。它在密度域中運(yùn)用相當(dāng)成功。 </p><p> 人臉
86、識(shí)別已經(jīng)成為模式識(shí)別領(lǐng)域中一個(gè)非常活躍的研究方向,在信息安全、商業(yè)、法律、電子商務(wù)等領(lǐng)域有著非常廣泛的應(yīng)用前景。但是,人臉識(shí)別技術(shù)依然存在著許多難點(diǎn)問題,不同光照條件下的人臉圖像識(shí)別,即為其中最具挑戰(zhàn)性的問題之一。</p><p> 針對(duì)該問題我們提出使用同態(tài)濾波的方法進(jìn)行研究,以便進(jìn)行人臉識(shí)別。一幅圖像可以用它的照射分量及反射分量的乘積來表示,即經(jīng)過同態(tài)濾波后其結(jié)果會(huì)改變圖像光強(qiáng)度和反射光強(qiáng)度的特性,因此我們
87、可以做到同時(shí)降低圖像動(dòng)態(tài)范圍,又增加對(duì)比度的結(jié)果。</p><p><b> 所用的流程如下:</b></p><p> 圖2.5 同態(tài)濾波處理步驟流程圖</p><p> 所用方法的具體步驟如下:</p><p> (1)先對(duì)上式的兩邊同時(shí)取對(duì)數(shù),即</p><p> (2)將上式兩邊
88、取傅立葉變換,得</p><p> (3)用一個(gè)頻域函數(shù)H(u,v)處理F(u,v),可得到</p><p> (4)逆傅立葉變換到空間域得可見增強(qiáng)后得</p><p> 圖像是由對(duì)應(yīng)照度分量與反射分量?jī)刹糠织B加而成。</p><p> (5)再將上式兩邊取指數(shù),得</p><p> 這里,稱作同態(tài)濾波函數(shù),
89、它可以分別作用于照度分量和反射分量上。</p><p> 圖 2.6 原始圖像與同態(tài)濾波后的效果圖</p><p> 對(duì)圖像進(jìn)行同態(tài)濾波處理之后,由兩幅圖像對(duì)比可以看出,圖像對(duì)比度得到增強(qiáng),像素灰度的動(dòng)態(tài)范圍也得到增強(qiáng)。處理之后圖像較暗的地方變得更清楚,圖像中的一些細(xì)節(jié)也更加突出。</p><p> 2.3人臉檢測(cè)可用的樣本庫</p><p
90、> 目前用來訓(xùn)練和測(cè)試人臉檢測(cè)和識(shí)別算法的圖像庫應(yīng)用較多的大致如表1-1中所列。這些圖像庫大部分是針對(duì)人臉識(shí)別問題建立的,用于人臉檢測(cè)時(shí)要做適當(dāng)處理。目前己有的人臉檢測(cè)庫一般是針對(duì)特定的人臉檢測(cè)算法由于各種人臉檢測(cè)算法之間差距較大,沒有針對(duì)一般人臉檢測(cè)問題的標(biāo)準(zhǔn)的人臉庫也是可以理解的。雖然這些圖像庫的大部分不能直接拿來訓(xùn)練或測(cè)試人臉檢測(cè)算法,但其提供的大量的人臉圖像,經(jīng)過一些有針對(duì)性的加工后可以用于人臉檢測(cè)算法的評(píng)價(jià)。</
91、p><p> 部分人臉測(cè)試圖像示例:</p><p> 個(gè)人生活中的圖像由于像素較高暫不在這里展示,但會(huì)在結(jié)果中列出。</p><p> 3 基于膚色的人臉檢測(cè)方法</p><p> 膚色是人體表面最為顯著的特征之一,是人臉的重要信息,不依賴于面部的細(xì)節(jié)特征,對(duì)于旋轉(zhuǎn)、表情的變化等情況都能適用,具有較高的穩(wěn)定性并且和大多數(shù)背景物體的顏色相
92、區(qū)別。因此膚色特征在人臉檢測(cè)中是最常用的一種特征。膚色特征主要由膚色模型描述?;谀w色的人臉檢測(cè)方法[17]通常分為膚色區(qū)域分割和人臉檢測(cè)兩大步。在確定膚色模型之后,首先可以進(jìn)行膚色檢測(cè),在檢測(cè)出膚色像素后,需要根據(jù)它們?cè)谏瓤臻g內(nèi)的相似性和位置上的相關(guān)性分割出可能的人臉區(qū)域,同時(shí)利用區(qū)域的幾何特征或是灰度特征進(jìn)行是否是人臉的驗(yàn)證,以排除其它色彩類似膚色的物體,區(qū)域分割與驗(yàn)證在很多方法中是密切結(jié)合統(tǒng)一考慮的。通常為了消除光照對(duì)人臉膚色的
93、影響,在膚色區(qū)域分割前會(huì)對(duì)圖像進(jìn)行光照校正,以消除色彩偏移。</p><p><b> 3.1色彩空間</b></p><p> 光在頻譜分布中的不同位置體現(xiàn)了各種顏色,顏色是人對(duì)光譜中可見光的感</p><p> 知結(jié)果。根據(jù)光度學(xué)和色度學(xué)原理,所有顏色都可以用相互獨(dú)立的三種基本顏色</p><p> 混合得到
94、,這三種顏色被稱為三基色,由此就構(gòu)成了色彩空間。著名的格拉曼定</p><p> 律反映了視覺對(duì)顏色的反應(yīng)取決于紅、綠、藍(lán)三種顏色在輸入量中的代數(shù)和之一</p><p> 事實(shí)。格拉曼定律包括如下四個(gè)方面的內(nèi)容:</p><p> 1、所有顏色都可以用互相獨(dú)立的三基色混合而得到。</p><p> 2、假如三基色的混合比相等,則色調(diào)和
95、色飽和度也相等。</p><p> 3、任意兩種顏色相混合產(chǎn)生的新顏色與采用三基色分別合成這兩種顏色的各</p><p> 自成份再混合起來得到的結(jié)果相同。</p><p> 4、混合色的光亮度是原來各分量光亮度的總和。</p><p> 這里色調(diào)、色飽和度、亮度是表示色覺程度的。色調(diào)表示各種顏色,色飽和度表</p>&
96、lt;p> 示顏色深淺。以三基色為基礎(chǔ)的格拉曼定律可以用下面的公式來表示:</p><p> F=R(R)+G (G)+B(B)</p><p> 根據(jù)計(jì)算機(jī)色彩理論,對(duì)于同一種顏色而言,在計(jì)算機(jī)中有不同的表達(dá)方式,</p><p> 這樣就形成了各種不同的色彩空間。每一種色彩空間都有其各自的產(chǎn)生背景及應(yīng)</p><p> 用
97、領(lǐng)域。數(shù)字圖像中的一個(gè)象素點(diǎn)的顏色可以有很多種方法來表示,其中最直接</p><p> 的表示方法是我們所熟知的由紅、綠、藍(lán)三基色構(gòu)成的RGB色彩空間。下面具體介紹一些常用于膚色提取的色彩空間。</p><p> 3.1.1 RGB色彩空間</p><p> RGB顏色空間是用于顯示和保存彩色圖像的最常用的彩色空間,對(duì)應(yīng)于人類視覺的三基色即紅、綠、藍(lán)三種顏色,
98、該空間由R(紅),G(綠)和藍(lán)(B)三個(gè)分量組成,在三維空間中的三個(gè)軸分別與之對(duì)應(yīng)。原點(diǎn)對(duì)應(yīng)于黑色,離原點(diǎn)最遠(yuǎn)的頂點(diǎn)對(duì)應(yīng)于白色,其他顏色落于由紅、綠和藍(lán)三基色組成的彩色立方體中。但是RGB顏色空間不適合進(jìn)行色度處理,因?yàn)樵赗GB空間中,三個(gè)顏色分量都包含亮度信息,存在相關(guān)性,因此用于膚色檢測(cè)時(shí)算法的亮度適應(yīng)性不好。</p><p> 圖3.1 RGB彩色立方體</p><p> 3.1
99、.2亮度歸一化rgb色彩空間</p><p> 在一定的光照條件下,人臉膚色在亮度歸一化的rgb色彩空間里符合高斯分布。歸一化的三種顏色分量定義為:r=R/I;g=G/I: b=B/I,I=R+G+B,且r+g+b=l。其中r,g,b三者中的兩者是獨(dú)立的。公式如2-1所示。</p><p> = · 式3
100、.1</p><p> 很多利用膚色信息的人臉?biāo)惴ㄖ卸际褂昧肆炼葰w一化rgb顏色空間中的高斯模型作為膚色檢測(cè)器。但歸一化rgb顏色空間中的r,g,b只去除了R,G,B中的相對(duì)亮度成分,r,g,b中仍存在著亮度信息,因此用于膚色檢測(cè)時(shí)算法的亮度適應(yīng)性不好。</p><p> 3.1.3 YIQ色彩模型</p><p> YIQ顏色空間[18]來源于國(guó)家電視標(biāo)準(zhǔn)委
101、員會(huì)(NTSC)制彩色電視信號(hào)的傳輸,其中的Y分量代表圖像的亮度信息,I,Q兩個(gè)分量則攜帶顏色信息,1分量代表從橙色到青色的顏色變化,而Q分量則代表從紫色到黃綠色的顏色變化。RGB模型與YIQ模型之間的變換公式如下:</p><p> = 式3.2</p><p> 使用了YIQ顏色空間來分割圖像中的膚色區(qū)域。在Y
102、IQ色彩空間內(nèi),膚色的色度值和光源的光譜成分密切相關(guān),因此,膚色聚類的結(jié)果只能應(yīng)用于特定的光照條件下,受高光和陰影的干擾嚴(yán)重。</p><p> 3.1.4 HIS色彩空間</p><p> 這是Munseu提出的顏色模型,它反映了人類觀察色彩的方式,同時(shí)也有利于圖像處理。HIS[19]空間中,H分量表示色調(diào),決定彩色光的光譜成分,I分量表示亮度,S分量表示飽和度。從RGB空間到HIS
103、空間的轉(zhuǎn)換關(guān)系為:</p><p> 其中: 式3.3</p><p> HIS的優(yōu)點(diǎn)在于它將亮度(Intensity)與反映色彩本質(zhì)特性的兩個(gè)參數(shù)色度(Hue)和飽和度(Saturation)分開。我們提取一類物體(如人臉等)在色彩方面的特性時(shí),經(jīng)常需要了解其在某一色彩空間的聚類特性,而這一聚類特性往往體現(xiàn)在色彩的本質(zhì)特性上,而又經(jīng)常受到光照明暗等條件
104、的影響。光照明暗給顏色帶來的直接影響就是亮度分量(I),所以若能把亮度分量從色彩中提取出去,而只反映色彩本質(zhì)特性的色度、飽和度來進(jìn)行聚類分析,會(huì)取得好的效果。</p><p> 3.1.5 YCbCr色彩空間</p><p> YcbCr[20]顏色空間是以演播室質(zhì)量標(biāo)準(zhǔn)為目標(biāo)的CCIR601編碼方案中采用的色彩表示模型,被廣泛應(yīng)用于電視的色彩顯示等領(lǐng)域中。YCbCr顏色空間中,Y分量
105、表示亮度,Cb和Cr分量分別表示藍(lán)色和紅色的色度。RGB空間與YCbCr空間的轉(zhuǎn)換關(guān)系為:</p><p> YCbCr空間有如下特點(diǎn):(1)YCbCr廣泛應(yīng)用于圖像和視頻壓縮標(biāo)準(zhǔn),例如MPEG和JPEG;(2)YCbCr空間是離散空間,易于實(shí)現(xiàn)聚類算法:(3)YCbCr空間是感知均勻的色度空間。</p><p> 3.1.6 HSV色彩空間</p><p>
106、 在HSV[21]色度空間中,H(Hue)分量定義顏色的波長(zhǎng),稱為色調(diào);S(Saturation)分量定義顏色的深淺程度,稱為色飽和度,V(Value)分量定義顏色的明暗程度,稱為亮度。從RGB空間到HSV空間的變換式非線性的,轉(zhuǎn)換公式如下:</p><p><b> 其中: ;</b></p><p><b> ;</b></p>
107、;<p> 變換后的HSV空間是一個(gè)圓錐體,圓錐底面半徑與00線之間的夾角代表色調(diào)(Hue),圓錐底面半徑大小代表飽和度(Saturation),圓錐的高代表亮度(Value)。當(dāng)色調(diào)(Hue)從0變化到1.0時(shí),相應(yīng)的顏色從紅色變化到黃色、綠色、藍(lán)綠色、藍(lán)色、紫紅色,然后回到紅色,實(shí)際上0和1.0都代表紅色值。當(dāng)飽和度(Saturation)從0變化到1.0時(shí),相應(yīng)的顏色或者說色調(diào)(Hue)從不飽和(灰色陰影)變到全飽
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 復(fù)雜背景下的人臉檢測(cè)算法研究.pdf
- 復(fù)雜背景彩色圖像的人臉檢測(cè)算法研究.pdf
- 復(fù)雜背景下多視角人臉檢測(cè)算法研究.pdf
- 復(fù)雜背景下基于全景圖像拼接的人臉檢測(cè)算法研究.pdf
- 復(fù)雜背景下的人臉檢測(cè)方法研究.pdf
- 復(fù)雜背景下人臉檢測(cè)算法的研究.pdf
- 復(fù)雜背景下的彩色人臉檢測(cè)算法與實(shí)現(xiàn).pdf
- 基于膚色的復(fù)雜背景人臉檢測(cè)算法研究.pdf
- 復(fù)雜背景下基于膚色的人臉檢測(cè).pdf
- 畢業(yè)設(shè)計(jì)基于樹結(jié)構(gòu)的人臉檢測(cè)算法的研究及實(shí)現(xiàn)
- 復(fù)雜背景下的人臉檢測(cè)和識(shí)別.pdf
- 復(fù)雜背景下基于全景圖像拼接人臉檢測(cè)算法的研究
- 復(fù)雜背景下基于深度學(xué)習(xí)的多任務(wù)人臉檢測(cè)算法研究.pdf
- 基于復(fù)雜背景下的人臉檢測(cè)與識(shí)別.pdf
- 復(fù)雜背景下的人臉檢測(cè)與跟蹤方法研究.pdf
- 復(fù)雜背景下基于彩色圖像的人臉檢測(cè).pdf
- 復(fù)雜背景下基于膚色分割的人臉檢測(cè).pdf
- 復(fù)雜背景下紅外小目標(biāo)檢測(cè)算法研究.pdf
- 復(fù)雜背景下的人臉檢測(cè)與特征提取研究.pdf
- 基于膚色的人臉檢測(cè)算法研究.pdf
評(píng)論
0/150
提交評(píng)論