人體檢測方法研究與實現(xiàn)【畢業(yè)設(shè)計】_第1頁
已閱讀1頁,還剩24頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、<p>  本科畢業(yè)設(shè)計(論文)</p><p><b>  (二零 屆)</b></p><p>  人體檢測方法研究與實現(xiàn)</p><p>  所在學(xué)院 </p><p>  專業(yè)班級 計算機科學(xué)與技術(shù) </p>

2、<p>  學(xué)生姓名 學(xué)號 </p><p>  指導(dǎo)教師 職稱 </p><p>  完成日期 年 月 </p><p>  摘要:基于視頻序列的運動人體檢測是當(dāng)前計算機視覺和模式識別領(lǐng)域的一個重要研究方向,在圖像處理、智能監(jiān)

3、控、視頻編碼等領(lǐng)域有著重要的地位。本文構(gòu)建了一個基于視頻序列的運動人體檢測系統(tǒng),主要內(nèi)容為利用運動目標(biāo)檢測的方法將運動區(qū)域提取出來。</p><p>  本文運用了Matlab從視頻中讀取幀圖像,通過前后幀差對比,去掉背景圖像,通過顏色對比顯示運動人體目標(biāo),簡單框出目標(biāo),從而達到目的。實驗結(jié)果表明,本文提出的運動目標(biāo)檢測的方法能夠快速完整的檢測出運動區(qū)域,同時在很大程度上了抑制噪聲在影響。</p>

4、<p>  關(guān)鍵詞:運動目標(biāo)檢測;人體檢測;背景消除;matlab</p><p>  Human Detect Method Research and Implementation</p><p>  Abstract: Human detecting based on motion video sequences in the field of computer vision

5、 and pattern recognition which has an important position in the image processing now intelligent control, video encoding and other fields.An human body motion is built based on video sequence detection system for use of

6、moving target detection method to extract moving regions.</p><p>  In this paper, Use Matlab to read frames from the video by frame difference before and after comparison, remove the background image, color

7、contrast through the display of Human movement target, simple box, the target to achieve the goal. Experimental results show that the proposed motion detection method can detect moving quickly complete the regional, whil

8、e in large part to suppress background noise and changes in the region.</p><p>  Key words: Moving object detection; people break detection;background subtraction;matlab</p><p><b>  目錄<

9、/b></p><p><b>  1 緒論1</b></p><p>  1.1研究背景和意義1</p><p>  1.2國內(nèi)外研究現(xiàn)狀1</p><p>  1.2.1運動目標(biāo)檢測2</p><p>  1.2.2人體檢測3</p><p>  1.

10、3 運動圖像的含義4</p><p><b>  1.4研究內(nèi)容4</b></p><p>  1.5 論文結(jié)構(gòu)5</p><p><b>  2 幀差法6</b></p><p>  2.1幀差法的具體算法6</p><p><b>  2.2光流法7

11、</b></p><p><b>  3 背景差分10</b></p><p>  3.1背景差分方法10</p><p>  3.1.1時間差分方法10</p><p>  3.1.2均值-閾值法10</p><p>  3.2背景差法在本系統(tǒng)中的運用11</p>

12、;<p><b>  4系統(tǒng)原理12</b></p><p>  4.1 Matlab中讀取并運用視頻幀12</p><p>  4.2用形態(tài)學(xué)提取目標(biāo)13</p><p>  4.3 對目標(biāo)進行邊框確定13</p><p>  5 實驗截圖及代碼14</p><p>  

13、5.1 實驗截圖14</p><p>  5.2主要程序代碼16</p><p>  6 總結(jié)與展望20</p><p>  致謝2錯誤!未定義書簽。</p><p><b>  參考文獻22</b></p><p><b>  1 緒論</b></p>

14、;<p>  1.1研究背景和意義</p><p>  近幾十年來,隨著計算機技術(shù)和圖像處理技術(shù)的發(fā)展,目標(biāo)檢測及跟蹤系統(tǒng)廣泛運用于各領(lǐng)域。人們對視頻序列中運動目標(biāo)的檢測與跟蹤做了大量而深入的研究,提出了各種行之有效的方法,其中運動人體的檢測與跟蹤在智能監(jiān)控領(lǐng)域的應(yīng)用前景和潛在經(jīng)濟價值成為研究的熱點課題之一。</p><p>  運動人體檢測、識別技術(shù)是人體運動分析的重要內(nèi)容

15、,也是計算機視覺研究的重要領(lǐng)域之一。它在智能監(jiān)控、虛擬實現(xiàn)、人機交互、輔助臨床醫(yī)學(xué)診斷等等各領(lǐng)域均具有廣闊的運用前景和高度的經(jīng)濟價值。近年來,隨著中國城市化建設(shè)不斷深入,大型城市的人口呈爆炸式增長,隨之而來的交通壓力也日益增大,矛盾日益突出。本文主要是針對城市交通環(huán)境下如何保障行人交通順暢和出行安全等問題,研究了攝像機靜止情況下基于單目視覺的運動人體檢測詳細(xì)介紹了從復(fù)雜場景中分析行人運動的算法研究和編程實現(xiàn)的過程。</p>

16、<p>  現(xiàn)在,在很多場合我們都可以看到一些用于監(jiān)控的攝像頭。如銀行,商場,超市,居民社區(qū),教室,停車場,高速公路等,可以說監(jiān)控的應(yīng)用無處不在。但目前大部分的監(jiān)控是由相關(guān)人員通過監(jiān)視器進行人工監(jiān)控,這樣由于監(jiān)控的區(qū)域過大或監(jiān)控時間過長使人產(chǎn)生疲勞,造成一些區(qū)域的漏檢,沒有對一些異常情況做出及時的反應(yīng),失去了監(jiān)控的作用。因此,人體檢測技術(shù)的應(yīng)用,可以使通常被動的監(jiān)控成為智能的主動的監(jiān)控。當(dāng)一些人員出現(xiàn)在場景中,我們的監(jiān)控設(shè)備

17、就會自動檢測出人體,通知監(jiān)控人員。這樣一方面可以減輕監(jiān)控人員的工作,減少一些人力,物力和財力的投入。另一方面可以提高家弄的準(zhǔn)確度,可以及時對異常情況進行報警,減少不必要的損失。同時,人體監(jiān)測還可以對交通管理,地鐵,及其他公共場所的人流信息進行分析和計算。</p><p>  人體目標(biāo)的檢測的目的是從序列圖像中將變化區(qū)域從背景圖像中提取出來,運動區(qū)域的有效分割對于目標(biāo)分類、跟蹤和行為理解等后期處理是非常重要的。然而

18、,由于背景圖像的動態(tài)變化,如天氣、光照、影子及混亂干擾等影響。使得運動檢測成為一項相當(dāng)困難的工作。</p><p>  人體檢測技術(shù)講在現(xiàn)實生活中取得越來越重要的作用,其廣闊的前景和價值成為推動該技術(shù)發(fā)展的強大動力。</p><p>  1.2國內(nèi)外研究現(xiàn)狀</p><p>  從視頻序列中檢測出運動中的人體需要解決兩個問題:運動目標(biāo)檢測和人體檢測。以下從這兩個方面

19、分析國內(nèi)外的研究現(xiàn)狀及常用的處理方法。</p><p>  1.2.1運動目標(biāo)檢測</p><p>  運動目標(biāo)檢測的目的是從序列圖像中將變化區(qū)域從背景圖像中提取出來。運動區(qū)域的有效分割對于目標(biāo)分類、跟蹤和行為理解等后期處理非常重要,因為以后的處理過程僅僅考慮圖像中對應(yīng)于運動區(qū)域的像素。然而,由于背景圖像的動態(tài)變化,如天氣、光照、影子及局部擾動等的影響,使得運動檢測成為一項相當(dāng)困難的工作。

20、</p><p>  (a)基于特征的方法</p><p>  基于特征的方法包括兩個主要的步驟,一是從相繼兩幅或多幅不同時刻的圖像中抽取特征,并建立起對應(yīng);二是依據(jù)這些特征之間的對應(yīng)來計算物體的結(jié)構(gòu)(形狀、位置等)和運動?;谔卣鞯姆椒軌蚝芎玫膶ξ矬w的運動特征進行表述,但是該方法的困難在于物體特征點的尋找和匹配。一方面,該方法很難區(qū)分不同目標(biāo)之間的特征點。特別是當(dāng)運動目標(biāo)很多的時候往往

21、需要先依據(jù)別的方法來區(qū)分不同的目標(biāo)。另一方面目前并沒有一種比較通用的快速匹配算法,這就限制了它在實時視頻領(lǐng)域的應(yīng)用。</p><p>  (b)基于光流場的方法[1]</p><p>  基于光流場的方法,也稱為連續(xù)處理方法,通常假定相鄰時刻之間的間隔是很小的(幾十毫秒之內(nèi)),從而相鄰時刻的圖像之間的差異也較小,可以求得稠密(即圖像中每一像素)處所對應(yīng)物體的運動信息。光流法也采用兩步:第一

22、步,是計算光流場,第二步則是由光流場來計算場景中物體的三維運動和結(jié)構(gòu)。光流場的方法能夠很好的用于二維運動估計,它也可以同時給出全局點的運動估計,但其本身還存在著一些問題:遮擋問題、孔徑問題、缺乏足夠的空間圖像梯度以及計算量大的問題。</p><p>  (c)基于幀間差分的方法</p><p>  幀間差分,也稱為時域差分,是運動視覺的方法中最為簡單快速的方法。常用的幀間差分就是連續(xù)兩幀相

23、減,二值化處理獲得運動區(qū)域,但運動目標(biāo)在前后幀中變化可能不大,導(dǎo)致部分區(qū)域重疊,所以檢測到的運動目標(biāo)并不完整,還需耍后續(xù)算法的處理。這是本文采用的方法。</p><p>  (d)基于背景減除的方法[2]</p><p>  該方法的關(guān)鍵是背景圖像的描述模型即背最模型,它是背景消減法分割前景目標(biāo)的基礎(chǔ)。背景模型有單模態(tài)和多模態(tài)兩種。前者在每個背景點上的顏色分布比較集中,可以用單個概率分布模

24、型來描述,后者的分布則比較分散,需要多個分布模型來共同描述。自然界中的許多景物和很多人造物體,如水面的波紋、搖擺的樹枝、飄揚的旗幟、監(jiān)視器熒屏等,都呈現(xiàn)出多模態(tài)的特性。</p><p><b>  1.2.2人體檢測</b></p><p>  運動目標(biāo)檢測出來的運動區(qū)域可能對應(yīng)不同的運動目標(biāo),比如交通道路上監(jiān)控攝像機所捕捉的序列圖像中可能包含行人、車輛及其它諸如飛鳥

25、、流云、搖動的樹枝等運動物體。由于智能視覺監(jiān)控系統(tǒng)要對運動的人體進行跟蹤識別,所以就必須判斷前景運動物體是否為人體,而人休的檢測算法的好壞同時嚴(yán)重影響著后續(xù)的處理。不同的應(yīng)用背景下和圖像分辨率下,人體檢測算法不同:對于認(rèn)知領(lǐng)域,需要識別人體各部分的運動情況;而在智能監(jiān)控中,圖像分辨率并不高,因此可以不用過多的關(guān)注人體的具體細(xì)節(jié),只需要判斷是否為人體目標(biāo)。檢測人體目標(biāo)比檢測其他目標(biāo)更具挑戰(zhàn)性:第一,人體目標(biāo)是典型的非剛性目標(biāo),可能呈現(xiàn)出各

26、種不同形狀,單一的模型幾乎不可能捕獲各種形狀的人體;第二,人的不同衣著,使基于區(qū)域特征的算法也不能有效地工作。下面簡略介紹目前國內(nèi)外主要的研究方法:</p><p>  (a)基于人體模型的方法</p><p>  為了檢測圖像中的人體對象,首先要設(shè)計合理的人體模型。因為人體是關(guān)節(jié)物體,所以大多數(shù)人體模型使用基于身體部分的表示,但不同模型使用的細(xì)節(jié)層次不同。另外,也有一些研究者沒有使用直觀

27、的幾何模型,而是構(gòu)造人體的模板。計算機圖形學(xué)和計算機視覺領(lǐng)域的許多研究者根據(jù)不同任務(wù)的需要提出了一些人體模型。</p><p>  (b)基于皮膚顏色的方法[3]</p><p>  人的皮膚顏色是一個明顯的特征,可以利用顏色信息來檢測人體。人臉部通常是裸露的而且有著特殊的顏色,所以可以通過識別人臉的存在來確定是否有人的存在。由于皮膚的色度和飽和度受光照的影響比較小,為了減小背景的顏色干擾

28、,這個二維的高斯模型的均值、協(xié)方差的獲得依靠前景提取后,手工確定臉部位置對模型進行訓(xùn)練,在分類過程中計算像素和均值間的距離,如果距離小于一個特定的閾值,那么該像素被分為皮膚,否則被分為非皮膚。分類后可以確定是否有人臉存在,如果運動物體中有人臉存在,則物體被分為人體,否則被分為非人體,但這種方法對遠(yuǎn)距離監(jiān)控可能會失效。</p><p>  (c)基于運動特性的分類方法[4][5]</p><p&

29、gt;  基于運動的分類是利用人體在穩(wěn)定地行走或奔跑時表現(xiàn)出的人體姿態(tài)的周期性變化,可以利用人體運動的這一特性識別人體的存在。若物體在t時刻的狀態(tài)為x(t)。若存在一個常數(shù)P使:</p><p>  x(t+P)=x(t)+T(t) (1) 其中T(t)為平移量,那么這個最小的時間間隔P就是這個物體的運動周期,人體在穩(wěn)

30、定運動時的姿態(tài),以人的中軸為坐標(biāo)軸,人體的對稱性呈周期性變化,可以利用這一特性在時域構(gòu)造時間自相似矩陣,人的周期性運動反映出不同于其它物體運動的性質(zhì),可以利用這種時域頻化的方法把人體運動識別出來。</p><p>  (d)基于人體外形特征的方法[6]</p><p>  由于人體外形的特殊性,成為人體檢測可以利用的重要信息,根據(jù)人體外形進行檢測和跟蹤的算法被相繼提出,但分析人體外形的困難

31、在于人體局部的非剛體性表現(xiàn)出來的不確定性很難刻畫,但人體的不確定性很大很復(fù)雜,以至于這些模型都不適合。非參數(shù)化的方法國具有更大的靈活性,但是需要大量的樣本來涵蓋人體的所有的不確定性,其中點分布模型是典型的非參數(shù)化方法,它用一個有序的、標(biāo)記的點集來描述人體形狀,點的改變影響了人體形狀的改變,該方法具有很大的靈活性,但點集的注冊標(biāo)記的計算量很大,而且它是基于全局的方法,很難處理遮擋的情況。當(dāng)然,人體的可形變并不是任意的,因此可以先確定先驗的

32、人體外形,一個可行的方法就是降低不同外形參數(shù)的相關(guān)性,在低維空間里用混和高斯模型建模形變的變化[7][8],這樣可以有效的表征全局的形變,但對于局部的形變?nèi)圆粔虺浞?。各向異性的吉伯斯場的提出和在人臉形變領(lǐng)域的成功應(yīng)用,減少了處理人體形變的難度,但需要大量的樣本訓(xùn)練。</p><p>  檢測運動的人體時,基于形狀的分類是利用檢測出來的運動區(qū)域的形狀特征信息來進行物體的分類的。通過檢測模塊得到一個二值化前景圖像,對

33、這個前景圖像進行橫向和縱向的投影可以得到橫向和縱向直方圖[9]。通過多個人體樣本訓(xùn)練可以得到人體的橫向投影寬度和縱向投影寬度的比值,這個橫向投影寬度和縱向投影寬度的比值作為人體的輪廓模式,可以用待分類的樣本和此模型進行對比確定是否為人體。</p><p>  1.3 運動圖像的含義</p><p>  運動圖像處理分析是計算機視覺研究中的一個重要部分,也是最近幾年來研究的熱點。所謂運動圖像

34、(圖像序列),是一種由一系列按時間順序排列的瞬時圖像組。運動圖像是針對運動的物體或景物而言的,它不僅是空間位置的函數(shù),而且是隨時間變化的;與單一圖像相比,運動圖像為我們提供了更加豐富的信息。在對某一景物拍攝到的圖像序列中,相鄰兩幀圖像至少有一部分像素的灰度及色彩發(fā)生了變化,這些圖像序列按照時間順序組合起來就形成了視頻,可以說視頻就是圖像序列,序列中的每一幅圖像稱為視頻的幀[9]。</p><p><b>

35、;  1.4研究內(nèi)容</b></p><p>  人體檢測是對象檢測中的一個極難的問題。在很多學(xué)者眼中甚至是計算機視覺中最難的問題之一。人體檢測問題幾乎涉及到計算機視覺從低層的特征提取到高層的圖像理解的全部問題,而其還有其他問題所不具備的獨有難題,其主要的難題有以下幾點:</p><p>  1.對象復(fù)雜性高:相對于車輛,文字等幾何,顏色,紋理比較簡單的對象而言,人體的對象要復(fù)

36、雜得多,因此很難用簡單的模型對其進行描述。顏色與紋理信息的多樣性:人體由于衣服,膚色,光照等的變化,不同的人在灰度以及顏色空間上擁有不同的特征。同樣由于不同的人有不同的衣服樣式或者膚色變換的不同,在紋理特征方面也沒有統(tǒng)一的特征模式可尋。</p><p>  2.姿態(tài)的多樣性:由于人體不是一個剛體模型,很難用一個統(tǒng)一 人體模型對其進行描述。相比較而言,人臉等問題由于大體上眼耳鼻嘴等位置分布有較為固定的模式,可以相對

37、容易的建立起模型框架。而人體在運動的時候,其姿態(tài)是完全不一樣 的,其各個部分的組合很難找到統(tǒng)一的模式去定義或者描述,這也增加了人體監(jiān)測的難度。</p><p>  3.視覺的多樣性:與很多情況下人臉檢測識別不同的是,人機檢測的應(yīng)用情況統(tǒng)籌并不像人臉檢測識別那樣是在固定的視覺(正常)情況下得到的,人體檢測中的人體可能是從正視或者測試等不同的視覺角度來進行觀測的,更有可能從俯視,平視或者仰視的不同角度觀看。所以視覺的

38、多樣性也是人體檢測中的一個難題。</p><p><b>  1.5 論文結(jié)構(gòu)</b></p><p>  本論文是這樣安排的:論文一共分為六章,其中第一章論述了立題的意義及國內(nèi)外的最新研究現(xiàn)狀;第二章主要主要講述了幀差法,第三章分析了常用的背景差分:第四章主要論述了系統(tǒng)原理及實驗結(jié)果;第五章為系統(tǒng)截圖以及系統(tǒng)程序開源代碼:最后,第六章給出了總結(jié)與展望。</p&

39、gt;<p><b>  2 幀差法</b></p><p>  幀間差分法是一種通過對視頻圖像序列中相鄰兩幀作差分運算來獲得運動目標(biāo)輪廓的方法,它可以很好地適用于存在多個運動目標(biāo)和攝像機移動的情況。當(dāng)監(jiān)控場景中出現(xiàn)異常物體運動時,幀與幀之間會出現(xiàn)較為明顯的差別,兩幀相減,得到兩幀圖像亮度差的絕對值,判斷它是否大于閾值來分析視頻或圖像序列的運動特性,確定圖像序列中有無物體運動。

40、圖像序列逐幀的差分,相當(dāng)于對圖像序列進行了時域卜的高通濾波。 </p><p>  幀間差分法的優(yōu)點是:算法實現(xiàn)簡單,程序設(shè)計復(fù)雜度低;對光線等場景變化不太敏感,能夠適應(yīng)各種動態(tài)環(huán)境,穩(wěn)定性較好。</p><p>  其缺點是: 不能提取出對象的完整區(qū)域,只能提取出邊界;同時依賴于選擇的幀間時間間隔。對快速運動的物體,需要選擇較小的時間間隔,如果選擇不合適,當(dāng)物體在前后兩幀中沒有重疊時,會

41、被檢測為兩個分開的物體:而對慢速運動的物體,應(yīng)該選擇較大的時問差,如果時間選擇不適當(dāng),當(dāng)物體在前后兩幀中幾乎完全重疊時,則檢測不到物體。</p><p>  為了解決兩幀差分法存在的一些問題,很多學(xué)者進行了大量的研究,并提出三幀差分法[12]。其思想是分別對兩個時間單位間隔前后的三幅圖像進行基于像素的時間差分,然后對2次幀間差分的結(jié)果進行行“與”操作即取交集,從而得到運動目標(biāo)比較精確 的輪廓位置。</p&g

42、t;<p>  采用三幀圖像差分法的有點是運算量小,速度快,之對運動物體敏感,而且得到的運動目標(biāo)邊緣比較真實,定位也更加精確,對剛體目標(biāo)(比如行駛的車輛等)的檢測和跟蹤有比較好的結(jié)果。</p><p>  另外,由于幀間差分法實際上只檢測出相對運動的物體,如果進行差分的兩幅(或三幅)圖像的時間間隔很短,所得到的差分圖像受光線變化的影響將十分微弱,從而檢測的結(jié)果更加準(zhǔn)確,因此,幀間差分法非常適合動態(tài)變

43、化的場景。但這種方法在背景比較復(fù)雜的情況只能提取出大部分而不是全部的運動區(qū)域,因此在實際應(yīng)用中仍然存在著一定的局限性,需要作進一步的改進來提高整體的檢測效果[13]。</p><p>  2.1幀差法的具體算法</p><p>  (l)、對序列圖像進行3×3中值濾波預(yù)處理,去掉圖像隨機噪聲。減少以后運算的復(fù)雜度,克服噪聲對圖像處理結(jié)果的干擾。 </p><p

44、> ?。?)、從視頻圖像序列中選取出背景圖像所阢砂,使其只包含固定的背景圖像: </p><p> ?。?)、在視頻圖像序列中選取連續(xù)的兩幀圖像,其中前一幀圖像pk-1(x,y),當(dāng)前幀圖像pk(x,y); </p><p> ?。?)、計算當(dāng)前幀與背景幀的差得FD(x,y),從 圖像中提取出完整的目標(biāo); </p><p> ?。?)、計掉當(dāng)前1幀的差得FG(

45、x,y),得到目標(biāo)的變化量; </p><p>  (6)、求幀差FD(x,y)與,F(xiàn)G(x,y)的交集得到運動目標(biāo)粗糙的運動區(qū)域幽像, </p><p> ?。?)、數(shù)學(xué)形志學(xué)運算使得運動區(qū)域封川、連續(xù)、完整,并去掉背持中的噪聲。</p><p><b>  2.2光流法</b></p><p>  人類主要通過眼睛,

46、耳朵和大腦來獲取、處理與理解獲得的信息。然而圖像具有最直觀、明了、讓人一看就懂的特質(zhì),因為人們獲取信息70%以上依靠視覺,20%左右依靠聽覺,10%左右依靠觸覺和嗅覺,這就是為什么“百聞不如一見”,一幅圖像說明一切問題,勝過千言萬語。 </p><p>  計算機視覺這一領(lǐng)域的先驅(qū)可追溯到很早的時候,但是直到20世紀(jì)70年代后期,當(dāng)計算機的性能提高到足以處理諸如圖像這樣的大規(guī)模數(shù)據(jù)時,計算機視覺才得到了正式的關(guān)注

47、和發(fā)展。計算機視覺就是用各種成像系統(tǒng)代替視覺器官作為輸入敏感手段,由計算機來代替大腦完成處理和解釋,也包括對視覺信息的采集,傳輸,處理,存儲與理解等過程。計算機視覺最終研究目標(biāo)就是使計算機能像人那樣通過視覺觀察和理解世界,具有自主適應(yīng)環(huán)境的能力,要經(jīng)過長期的努力才能達到的目標(biāo)。因此,在實現(xiàn)最終目標(biāo)以前,人們努力的中期目標(biāo)是建立一種視覺系統(tǒng),這個系統(tǒng)能依據(jù)視覺敏感和反饋的某種程度的智能完成一定的任務(wù)。計算機視覺應(yīng)用領(lǐng)域較廣泛,包括航空航天

48、、衛(wèi)星照片、軍事導(dǎo)彈精確制導(dǎo)、移動機器人視覺導(dǎo)航、工業(yè)自動化系統(tǒng)、醫(yī)學(xué)輔助診斷等。 </p><p>  計算機視覺系統(tǒng)的結(jié)構(gòu)形式很大程度上依賴于其具體應(yīng)用方向。有些是獨立工作的,用于解決具體的測量或檢測問題,也有些作為某個大型復(fù)雜系統(tǒng)的組成部分出現(xiàn),比如工業(yè)控制系統(tǒng),汽車導(dǎo)航系統(tǒng)。計算機視覺系統(tǒng)的具體實現(xiàn)方法同時也由其功能決定,有些是預(yù)先固定的,有些是在運行過程中自動學(xué)習(xí)調(diào)整。盡管如此,以下幾個功能卻幾乎是每個

49、計算機系統(tǒng)都需要具備的。 </p><p>  圖像獲取,一幅數(shù)字圖像是由一個或多個圖像感知器產(chǎn)生的,例如攝像機,紅外遙感攝像儀,雷達,超聲波接收器等,所產(chǎn)生的圖片包括二維圖像,三維圖像或者一個圖像序列。 </p><p>  預(yù)處理,在對圖像實施具體的計算機視覺方法來提取某種特定的信息前,首先通過一種或一些方法預(yù)先對圖像進行處理,以滿足后繼圖像處理的要求,包括二次取樣,平滑去噪,提高對比

50、度等。 </p><p>  特征提取,是使用計算機提取圖像信息,檢查每個像素確定該像素是否代表一個特征,例如邊緣提取,邊角檢驗,斑點檢驗。圖像分割,對圖像進行分割來提取有價值的信息用于后繼處理的部分。</p><p>  光流是空間運動物體在觀測成像面上的像素運動的瞬時速度。光流的研究是利用圖像序列中的像素強度數(shù)據(jù)的時域變化和相關(guān)性來確定各自像素位置的“運動”,即研究圖像灰度在時間上的變

51、化與景象中物體結(jié)構(gòu)及其運動的關(guān)系。一般情況下,光流由相機運動、場景中目標(biāo)運動或兩者的共同運動產(chǎn)生。光流計算方法大致可分為三類:基于匹配的、頻域的和梯度的方法。 </p><p>  (1) 基于匹配的光流計算方法包括基于特征和基于區(qū)域兩種?;谔卣鞯姆椒ú粩嗟貙δ繕?biāo)主要特征進行定位和跟蹤,對大目標(biāo)的運動和亮度變化具有魯棒性。存在的問題是光流通常很稀疏,而且特征提取和精確匹配也十分困難?;趨^(qū)域的方法先對類似的區(qū)域

52、進行定位,然后通過相似區(qū)域的位移計算光流。這種方法在視頻編碼中得到了廣泛的應(yīng)用。然而,它計算的光流仍不稠密。 </p><p>  (2) 基于頻域的方法利用速度可調(diào)的濾波組輸出頻率或相位信息。雖然能獲得高精度的初始光流估計,但往往涉及復(fù)雜的計算。另外,進行可靠性評價也十分困難。 </p><p>  (3) 基于梯度的方法利用圖像序列的時空微分計算2D速度場(光流)。由于計算簡單和較好的

53、效果,基于梯度的方法得到了廣泛的研究。雖然很多基于梯度的光流估計方法取得了較好的光流估計,但由于在計算光流時涉及到可調(diào)參數(shù)的人工選取、可靠性評價因子的選擇困難,以及預(yù)處理對光流計算結(jié)果的影響,在應(yīng)用光流對目標(biāo)進行實時監(jiān)測與自動跟蹤時仍存在很多問題。 </p><p>  光流法檢測運動物體的基本原理是:給圖像中的每一個像素點賦予一個速度矢量,這就形成了一個圖像運動場,在運動的一個特定時刻,圖像上的點與三維物體上的

54、點一一對應(yīng),這種對應(yīng)關(guān)系可由投影關(guān)系得到,根據(jù)各個像素點的速度矢量特征,可以對圖像進行動態(tài)分析。如果圖像中沒有運動物體,則光流矢量在整個圖像區(qū)域是連續(xù)變化的。當(dāng)圖像中有運動物體時,目標(biāo)和圖像背景存在相對運動,運動物體所形成的速度矢量必然和鄰域背景速度矢量不同,從而檢測出運動物體及位置。采用光流法進行運動物體檢測的問題主要在于大多數(shù)光流法計算耗時,實時性和實用性都較差。但是光流法的優(yōu)點在于光流不僅攜帶了運動物體的運動信息,而且還攜帶了有關(guān)

55、景物三維結(jié)構(gòu)的豐富信息,它能夠在不知道場景的任何信息的情況下,檢測出運動對象。 </p><p>  對于視頻監(jiān)控系統(tǒng)來說,所用的圖像基本都是攝像機靜止?fàn)顟B(tài)下攝取得,所以對有實時性和準(zhǔn)確性要求的系統(tǒng)來說,純粹使用光流法來檢測目標(biāo)不太實際。更多的是利用光流計算方法與其它方法相結(jié)合來實現(xiàn)對目標(biāo)檢測和運動估計。 </p><p>  然而,在實際應(yīng)用中,由于遮擋性、多光源、透明性和噪聲等原因,使

56、得光流場基本方程的灰度守恒假設(shè)條件不能滿足,不能求解出正確的光流場,同時大多數(shù)的光流計算方法相當(dāng)復(fù)雜,計算量巨大,不能滿足實時的要求,因此,一般不被對精度和實時性要求比較高的監(jiān)控系統(tǒng)所采用。</p><p><b>  3 背景差分</b></p><p>  本文所研究算法的使用背景是在攝像機靜止的條件下,對圖像序列中的人體目標(biāo)進行檢測。</p>&l

57、t;p><b>  3.1背景差分方法</b></p><p>  運動目標(biāo)檢測最常用的一種方法就是背景減除,這種算法估計出一個不帶有運動目標(biāo)的背景模型,通過計算當(dāng)前圖像幀和該背景模型的差別來確定運動目標(biāo)的位置,并利用檢測結(jié)果動態(tài)地更新背景模型。</p><p>  各種背景消減算法的主要差別在于所采用的背景模型類型和更新算法。目前普遍采用的方法是對圖像幀中每一

58、個點,用一個統(tǒng)計模型來描述其亮度(顏色)的概率分布在實際中使用最多的就是正態(tài)概率分布。在背景更新時,則對不同的檢測結(jié)果賦予不同的更新系數(shù),以區(qū)別是傾向于保留還是改變原有的分布。</p><p>  3.1.1時間差分方法</p><p>  時間差分方法是利用視頻序列中當(dāng)前兩幀或當(dāng)前幀與其前某幀的差分來提取出圖像中的運動區(qū)域。這種直接利用t-1時刻的視頻幀作為t時刻背景幀的方法,又叫幀差法

59、((frame difference)。</p><p>  I(x,y,t)-I(x,y,t-1) > Tp (2)</p><p>  顯然,時間差分法具有較強的場景變化適應(yīng)能力,不僅背景不隨時間積累,并且更新速度快,但由于它得到的是兩幀同位置的像素,因此有可能不能判定比較大的、顏色一致的運動目標(biāo)的內(nèi)部像

60、素,以至在運動實體內(nèi)部產(chǎn)生空洞現(xiàn)象。因此要得到好的性能,背景幀選擇必須考慮運動目標(biāo)的速度和幀率。對于快速運動目標(biāo),背景幀應(yīng)該與當(dāng)前幀靠近,甚至就是前一幀,否則很有可能把同一目標(biāo)檢測為兩個目標(biāo)。</p><p>  3.1.2均值-閾值法</p><p>  這種方法比較簡單,即先計算整幅圖像的均值,并以此作為闡值來區(qū)分物體和背景。對一幅尺寸為m*n的圖像,均值(即閾值)的計算公式如下<

61、;/p><p><b>  (3)</b></p><p>  這里,P (m,n)指圖像中點(m, n)處的象素點的灰度值。</p><p>  一般而言,目標(biāo)和背景圖像的灰度值總存在一定的差別。如果這種差別比較大(例如,在一個淺顏色的背景下跟蹤一個深顏色的物體),采用這種方法能起到較好的區(qū)分效果。從圖像的灰度直方圖上來看,包含目標(biāo)的圖像的灰度直

62、方圖應(yīng)該出現(xiàn)兩個明顯的峰值,而闡值應(yīng)該是兩個峰值之間。但有的時候,灰度直方圖兩個峰值之間的最小值不一定就是整幅圖像的均值。這種情況下計算均值(即閾值)時需要對公式(3)乘以一個修正系數(shù),計算公式如下:</p><p><b>  (4)</b></p><p>  這里的x是一個根據(jù)灰度直方圖判斷出來的數(shù)據(jù)。</p><p>  在確定好閾值后

63、,再利用閾值對整幅圖像進行二值化,在圖像的灰度直方圖存在兩個明顯峰值的情況下,利用這種方法能達到把目標(biāo)和背景分離開來的目的。</p><p>  3.2背景差法在本系統(tǒng)中的運用</p><p>  本系統(tǒng)運用了簡單的背景偵差計算,通過簡單相鄰兩幀的標(biāo)準(zhǔn)值減除來提取關(guān)鍵目標(biāo)區(qū)域,用與消除固定的背景圖像,呈現(xiàn)清晰的運動人體目標(biāo)。通過比較,背景差法明顯優(yōu)于幀間差分法,在Matlab中更易于實現(xiàn)和

64、運用。</p><p><b>  4系統(tǒng)原理</b></p><p>  本系統(tǒng)采用簡單的Matlab語言實現(xiàn),主要分為讀取視頻,提取幀畫面,對比運算,消除背景,計算人體目標(biāo),方框表示目標(biāo)等功能。</p><p><b>  圖1 程序流程圖</b></p><p>  4.1 Matlab中讀取

65、并運用視頻幀</p><p>  本系統(tǒng)主要功能為對視頻進行圖像處理,檢測并識別視頻中的人體目標(biāo),首先需要判斷讀取視頻是否字符數(shù)組:</p><p>  if ischar(video)</p><p>  avi = aviread(video);</p><p>  pixels = double(cat(4,avi(1:2:end).c

66、data))/255;</p><p><b>  clear avi</b></p><p><b>  else</b></p><p>  pixels = double(cat(4,video{1:2:end}))/255;</p><p>  clear video</p>

67、<p><b>  end</b></p><p>  需要事先準(zhǔn)備好要處理的視頻,然后用Matlab讀取,判斷視頻是否可以被本系統(tǒng)操作,進行簡單判斷以后若可以,則打開AVI文件。然后從視頻中提取幀圖像,處理成若干個單獨的幀圖像。然后將提取的所有幀圖像,編譯成一個單一的數(shù)據(jù)組,以用以播放處理后的效果圖。</p><p>  4.2用形態(tài)學(xué)提取目標(biāo)</p

68、><p>  首先,需要對提取到的幀圖像進行處理,將其處理成灰度圖像,用以消除絕大部分的噪音干擾方便實現(xiàn)目標(biāo)檢測。并對圖像進行定義,主要是邊界值。</p><p>  然后將前后2張幀圖像,進行幀差計算,得到所有幀差數(shù)據(jù)。這是本文的核心,通過幀差的計算,最后算出最后的人體框架。</p><p>  然后對幀差數(shù)據(jù)進行分類,定義數(shù)據(jù)為0.2,區(qū)分幀差區(qū)和非幀差區(qū),得到原始

69、的對比區(qū)域。 </p><p>  4.3 對目標(biāo)進行邊框確定</p><p>  得到幀差區(qū)域以后,開始對提取區(qū)域的邊界值進行計算,以得到具體的邊界。通過幀差數(shù)據(jù),以及一系列的取值循環(huán)計算,最后得到單一圖像中的目標(biāo)清晰區(qū)域。并直接在幀圖像中顯示出來以明顯表示該目標(biāo)區(qū)域的范圍。</p><p>  得到清晰的范圍以后,通過邊界的平均值計算,得出圖像的中心點,相對比較

70、簡單,用標(biāo)記*號顯示。</p><p>  處理完每張幀圖像以后,得到的是最后的完整的數(shù)據(jù)組,即運動人體被標(biāo)記以后的圖像。對這些圖像進行連續(xù)播放即完成。</p><p><b>  5 實驗截圖及代碼</b></p><p><b>  5.1 實驗截圖</b></p><p>  圖2.1 原視頻

71、圖像</p><p>  圖2.2 原視頻圖像</p><p>  本系統(tǒng)首先運行目標(biāo)視頻,方便作為比較。</p><p>  圖2.3 處理以后的幀圖像</p><p>  圖2.4 處理以后的幀圖像</p><p>  然后通過背景差的運算,取得灰度圖像,得到明確的目標(biāo)圖形。</p><p>

72、;  從得到的處理圖像來看,程序能有效的達到預(yù)期的目標(biāo),實現(xiàn)人體檢測。從視頻中區(qū)分運動人體實現(xiàn)檢測并用矩陣框出,沒有出現(xiàn)較大誤差,目標(biāo)清晰透明準(zhǔn)確規(guī)范,適當(dāng)修改以后可以運用于實際生活中。</p><p><b>  5.2主要程序代碼</b></p><p><b>  代碼1:</b></p><p>  clear d

73、ata</p><p>  disp('input video');</p><p>  avi = aviread('samplevideo.avi');</p><p>  video = {avi.cdata};</p><p>  for a = 1:length(video)</p>&

74、lt;p>  imagesc(video{a});</p><p>  axis image off</p><p><b>  drawnow;</b></p><p><b>  end;</b></p><p>  disp('output video');</p&

75、gt;<p>  tracking(video);</p><p><b>  代碼2:</b></p><p>  function d = tracking(video)</p><p>  if ischar(video)</p><p>  avi = aviread(video);</p&g

76、t;<p>  pixels = double(cat(4,avi(1:2:end).cdata))/255;</p><p><b>  clear avi</b></p><p><b>  else</b></p><p>  pixels = double(cat(4,video{1:2:end}))

77、/255;</p><p>  clear video</p><p><b>  end</b></p><p>  nFrames = size(pixels,4);</p><p>  for f = 1:nFrames</p><p>  pixel(:,:,f) = (rgb2gray(

78、pixels(:,:,:,f))); </p><p><b>  end</b></p><p><b>  rows=240;</b></p><p>  cols=320; </p><p><b>  nrames=f;</b></p><p>

79、;  for l = 2:nrames</p><p>  d(:,:,l)=(abs(pixel(:,:,l)-pixel(:,:,l-1)));</p><p>  k=d(:,:,l);</p><p>  bw(:,:,l) = im2bw(k, .2);</p><p>  bw1=bwlabel(bw(:,:,l));</p

80、><p>  imshow(bw(:,:,l))</p><p><b>  hold on</b></p><p><b>  cou=1;</b></p><p>  for h=1:rows</p><p>  for w=1:cols</p><p&g

81、t;  if(bw(h,w,l)>0.5)</p><p>  toplen = h;</p><p>  if (cou == 1)</p><p>  tpln=toplen;</p><p><b>  end</b></p><p>  cou=cou+1;</p>&

82、lt;p><b>  break</b></p><p><b>  end</b></p><p><b>  end</b></p><p><b>  end</b></p><p>  disp(toplen);</p><

83、;p><b>  coun=1;</b></p><p>  for w=1:cols</p><p>  for h=1:rows</p><p>  if(bw(h,w,l)>0.5)</p><p>  leftsi = w;</p><p>  if (coun == 1)&l

84、t;/p><p>  lftln=leftsi;</p><p>  coun=coun+1;</p><p><b>  end</b></p><p><b>  break</b></p><p><b>  end</b></p>&l

85、t;p><b>  end</b></p><p><b>  end</b></p><p>  disp(leftsi);</p><p>  disp(lftln); </p><p>  widh=leftsi-lftln;</p><p>  heig=t

86、oplen-tpln;</p><p>  widt=widh/2;</p><p>  disp(widt);</p><p>  heit=heig/2;</p><p>  with=lftln+widt;</p><p>  heth=tpln+heit;</p><p>  wth(l

87、)=with;</p><p>  hth(l)=heth;</p><p>  disp(heit);</p><p>  disp(widh);</p><p>  disp(heig);</p><p>  rectangle('Position',[lftln tpln widh heig],&

88、#39;EdgeColor','r');</p><p>  disp(with);</p><p>  disp(heth);</p><p>  plot(with,heth, 'r*');</p><p><b>  drawnow;</b></p><p

89、><b>  hold off</b></p><p><b>  end;</b></p><p><b>  6 總結(jié)與展望</b></p><p>  綜上所訴,人體檢測目前在計算機視覺研究領(lǐng)域還遠(yuǎn)未成熟。而不同的學(xué)者也在通過不同的途徑進行研究,通常情況下都是將復(fù)雜的問題簡化在一定的條件下

90、利用現(xiàn)有的方法進行改進的檢測。文本主要研究固定攝像頭拍攝下的視頻序列中檢測出運動人體的問題。該系統(tǒng)預(yù)期達到的目標(biāo)為:在靜止畫面中能準(zhǔn)確分析提取并區(qū)分和標(biāo)記運動的人體</p><p>  通過分析總結(jié),將運動目標(biāo)檢測和靜止圖像中的人體檢測算法結(jié)合起來,提出了基于視頻序列的運動人體檢測,主要考慮到以下幾點:第一,在視頻監(jiān)控中。由于攝像機靜止,背景主要是光線的變化和局部的擾動,提出的運動目標(biāo)檢測算法可以有效處理:第二,

91、采用離線訓(xùn)練人體分類器的形式,可以將檢測的部分工作預(yù)先做好,相對于利用人體模型或者其他的方法,減少了在線處理的時間。</p><p>  實驗結(jié)果表明,該系統(tǒng)能夠有效的檢測運動的人體,而且檢測速度較直接檢測有了極大的提高,可以滿足監(jiān)控系統(tǒng)的需要.</p><p><b>  參考文獻</b></p><p>  [1] 陳明,蔡自興?;贒ir

92、ectShow技術(shù)的移動機器人視頻采集系統(tǒng)[J]。華中科技大學(xué)學(xué)報:自然科學(xué)版,2004(Z1):87—89。</p><p>  [2] 王亮,胡衛(wèi)明,譚鐵牛。人運動的視覺分析綜述[J]。計算機學(xué)報,2002,25(3):225—237。</p><p>  [3] 周術(shù)誠,周明全,耿國華,基于小波變換的自適應(yīng)閾值三維圖像分割[J],計算機應(yīng)用與軟件,2006,23(10):20-22。

93、</p><p>  [4] 王劍峰,肖國強,江健民 綜合距離和相關(guān)性的圖像檢索算法 2007(10)。</p><p>  [5] 杜慶海,于忠清,張佳,基于不變矩特征的圖像識別,信息技術(shù)與信息化。2008,(6)。 </p><p>  [6] 侯志強,韓崇昭。視覺跟蹤技術(shù)綜述[J]。自動化學(xué)報,2006(4):603—617。</p>

94、<p>  [7] 宋磊,黃祥林,沈蘭蓀。視頻監(jiān)控系統(tǒng)概述[J]。測控技術(shù),2003(5):33—35。</p><p>  [8] 范勇,等, 一種快速運動目標(biāo)檢測和跟蹤算法, 光電工程,2000,12。</p><p>  [9] 劉雷。人體運動建模仿真方法研究[J]。計算機仿真,2009(1):l66—168。</p><p

95、>  [10] 孫劍,李克平。行人運動建模及仿真研究綜述[J]。</p><p>  [11] 圖像工程(上冊) 圖像處理和分析 章毓晉 清華大學(xué)出版社,1999。</p><p>  [12] 王安靜,陳玲等。用Vc++實現(xiàn)圖像連通區(qū)域標(biāo)記。電腦編輯與維護技巧,2003,1:74-77。</p><p>  [13] 楊莉,李玉山。復(fù)雜背景下的多運動目標(biāo)輪廓

96、檢測。電子與信息學(xué)報。2005,2(2)。306~309。</p><p>  [14] I-7]Neri A,Clonnese S,Russo G,et a1。Automatic Moving Ob—ject and Background Separation[J]。Signal Processing,1998,66:219—232。</p><p>  [15] Peter Meer。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論