監(jiān)控視覺內(nèi)容理解的關(guān)鍵技術(shù)研究.pdf_第1頁
已閱讀1頁,還剩151頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、監(jiān)控視覺內(nèi)容理解是計算機視覺智能化的一個重要方面,也是計算機視覺在實際應(yīng)用中亟待解決的問題。監(jiān)控視覺內(nèi)容理解既可以促進計算機視覺理論的不斷完善和發(fā)展,又能產(chǎn)生巨大的社會價值和經(jīng)濟價值?! ”O(jiān)控視覺的內(nèi)容理解是多方面的,不同的應(yīng)用目的有其不同的理解要求;不同理解角度,會得到相應(yīng)的理解結(jié)果?! ”O(jiān)控視覺內(nèi)容理解的特點是可以預(yù)先獲取視覺的場景知識、目標(biāo)類別、目標(biāo)運動等方面知識,并將這些知識運用到相應(yīng)的內(nèi)容理解之中。  本文提出的監(jiān)控視覺

2、內(nèi)容理解的關(guān)鍵技術(shù)包括視覺關(guān)鍵幀、基于內(nèi)容的視覺關(guān)鍵幀、運動目標(biāo)快速分類、目標(biāo)運動理解、以及場景的分析與理解。本文的主要研究工作及其創(chuàng)新點歸納如下:  1.本文提出了視覺關(guān)鍵幀。視覺關(guān)鍵幀能夠節(jié)省視覺信息的存儲量,減少視覺信息的查詢量,并能通過插值算法基本上恢復(fù)原始視覺過程。本文提出了一種基于邊緣信息特征和運動分析進行決策,自動選取視覺關(guān)鍵幀的方法。視覺關(guān)鍵幀自動遴選是在視覺圖像的分析和理解基礎(chǔ)上完成的。在監(jiān)控視覺中,三維目標(biāo)的運動引

3、起二維圖像的變化,得到時變二維圖像系列;首先對其系列二維圖像進行預(yù)處理,消除環(huán)境光變化產(chǎn)生的影響,提取圖像邊緣特征信息,便于分析和計算;然后進行差分分析和圖像邊緣特征信息量分析,確定三維空間中運動目標(biāo)的運動參數(shù)和形變信息,達(dá)到對視覺信息的理解,從系列視覺圖像中自動遴選出關(guān)鍵幀的目的。  2.本文界定了基于內(nèi)容的視覺關(guān)鍵幀,即視覺關(guān)鍵幀為(1)當(dāng)運動目標(biāo)剛進入場景的前后兩幀;(2)運動目標(biāo)退出場景的前后兩幀;(3)目標(biāo)在場景中開始運動到

4、運動結(jié)束的兩幀;(4)運動目標(biāo)發(fā)生遮擋或遮擋解除的視覺幀;(5)場景中3D目標(biāo)2D投影輪廓的顯著變化的前后兩幀。本文提出了一種基于內(nèi)容的視覺關(guān)鍵幀的遴選方法。該方法首先采用差分閾值法、邊緣檢測、“與”運算、投影法獲取運動目標(biāo)的大致輪廓,接著使用基于LevelSet的主動輪廓方法獲取運動目標(biāo)的較為精確輪廓;在分析了多種目標(biāo)輪廓描述的經(jīng)典方法及其相似性度量性能后,采用了小波變換的尺度系數(shù)描述運動目標(biāo)的整體輪廓,用小波系數(shù)的廣義高斯密度分布描

5、述參數(shù)描述目標(biāo)輪廓的細(xì)節(jié),在整體和細(xì)節(jié)兩個層面上理解目標(biāo)輪廓的變化?! ?.本文研究了視覺監(jiān)控中運動目標(biāo)的情況,針對視覺監(jiān)控中的兩類主要運動目標(biāo)——人和車輛,提出了一種逐層細(xì)化的樹形快速分類方法。該方法利用運動目標(biāo)的視覺圖像和運動信息獲取運動目標(biāo)的歸整輪廓,用雙目或者單目視覺測量  運動目標(biāo)的特征數(shù)據(jù),運用場景知識、目標(biāo)知識和運動知識,先將運動目標(biāo)分為人和車輛兩類,然后分別針對人和車輛,采用不同特征進行分類。對于人體采用身高、顏色進

6、行細(xì)化分類;對于車輛,提出了一種具有RST不變性的描述因子,根據(jù)車輛的外觀尺寸和其描述因子,獲取車輛的類型并分類,并采用顏色對車輛進行細(xì)化描述。對于顏色聚類描述效果不佳的情況,本文認(rèn)為是運動目標(biāo)的呈現(xiàn)紋理特征,因此,本文改進了傳統(tǒng)的樹形小波紋理描述的方法,提出了一種新的樹形小波描述紋理的方法。這種樹形小波紋理描述方法用小波分解后的低頻子帶描述紋理的能量特征,根據(jù)能量閾值對其高頻子帶進行多級分解,逼近紋理方向,獲取紋理的能量特征和方向特征

7、,并以此對運動目標(biāo)進行分類。該分類方法避免了樣本訓(xùn)練和模板匹配,分類速度快。  4.本文提出了一種基于知識的人體運動的理解方法。該方法通過分析視覺圖像和應(yīng)用相關(guān)知識推斷場景中人體的運動情況。根據(jù)相鄰兩幀記錄的人體運動信息,確定運動人體目標(biāo)的位置;在改進的HSV空間,對運動目標(biāo)進行區(qū)域顏色聚類,計算區(qū)域的聚類中心和聚類區(qū)域的重心;根據(jù)聚類區(qū)域重心的變化以及人體特征知識、人體運動知識及其相應(yīng)的規(guī)則,從整體或細(xì)節(jié)上理解人體的運動?! ?.

8、本文通過對場景的顏色特征進行分析和研究,理解場景的照度和色調(diào)分布,獲得場景變化的語義描述,并根據(jù)其語義描述或自動控制場景中的相關(guān)設(shè)備,或報告場景中的相關(guān)情況。場景分析與理解研究工作是基于灰度直方圖的場景照度理解和基于色調(diào)的場景理解。首先根據(jù)場景的灰度直方圖分析,理解場景中的整體照度情況和局部照度情況的方法,并說明了根據(jù)場景照度理解得到的結(jié)果,對場景進行控制的方法。然后通過劃分場景,獲取場景各個子區(qū)域的色調(diào)直方圖,分析直方圖,得到場景的色

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論