2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩120頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、機(jī)器視覺(computerVision)是研究如何使計(jì)算機(jī)對(duì)圖像數(shù)據(jù)產(chǎn)生智能化感知的一門科學(xué)。物體識(shí)別在機(jī)器視覺領(lǐng)域?qū)儆谝豁?xiàng)基礎(chǔ)研究,對(duì)圖像理解目標(biāo)的實(shí)現(xiàn)起著至關(guān)重要的作用。有效的物體識(shí)別算法是包括圖像檢索、視頻監(jiān)控、醫(yī)學(xué)圖像處理、工業(yè)機(jī)器人在內(nèi)等眾多應(yīng)用領(lǐng)域的前提與基礎(chǔ)。物體識(shí)別技術(shù)推動(dòng)著工業(yè)、醫(yī)學(xué)、交通、國防等領(lǐng)域朝著自動(dòng)化、智能化方向快速前進(jìn),并有可能從根本上改變它們的發(fā)展模式;隨著相關(guān)科學(xué)技術(shù)在應(yīng)用層面的普及,它甚至走進(jìn)了人們的

2、衣食住行當(dāng)中。然而,物體識(shí)別技術(shù)仍然處在一個(gè)快速發(fā)展的初級(jí)階段,或許對(duì)于某些特定的應(yīng)用可能有一些專門的解決方案,但是一個(gè)通用的魯棒的理論和算法框架尚未出現(xiàn)。本文討論了筆者在這個(gè)課題上的一些研究工作。
   首先,第3章提出一個(gè)簡明的基于形狀點(diǎn)特征的物體識(shí)別算法。在該算法框架中,對(duì)傳統(tǒng)的形狀上下文描述子做了兩方面的改進(jìn),并且基于改進(jìn)的形狀特征在圖像中尋找局部匹配。通過一種通用的霍夫變換投票過程,將匹配結(jié)果組織起來產(chǎn)生物體檢測的假設(shè)

3、。特征改進(jìn)的主要目的是為了避免背景對(duì)物體形狀特征所產(chǎn)生的干擾,以及使特征對(duì)物體形變有更好的容忍度。這種利用先驗(yàn)?zāi)P驮趫D像中尋找可能物體假設(shè)的過程是一種自頂向下的識(shí)別過程,它一般會(huì)有較高的識(shí)別率,但是精度不夠理想。為了有效提高識(shí)別的精度,在第一步識(shí)別的基礎(chǔ)上使用分類器方法對(duì)識(shí)別假設(shè)進(jìn)一步辨別真?zhèn)?并結(jié)合自底向上的圖像分割信息獲取物體在圖像中的前景區(qū)域。
   背景雜物一直是影響物體識(shí)別性能的重要因素?;谥行狞c(diǎn)和鄰域的圖像特征由于

4、背景雜物的存在,往往導(dǎo)致有用信息被嚴(yán)重破壞。大部分的識(shí)別方法會(huì)采用學(xué)習(xí)的策略,通過海量的訓(xùn)練數(shù)據(jù)來教會(huì)計(jì)算機(jī)記住特征中的哪些維度是重要的,哪些維度又應(yīng)該是忽略的。第4章中提出了一種新的方法,可以有效克服背景信號(hào)的干擾,并且對(duì)某一類物體只使用單一的訓(xùn)練樣本。使用自底向上的輪廓線作為基本的圖像元素,并采用很大的領(lǐng)域范圍來提取形狀特征是本方法的一個(gè)特色。選擇很大的領(lǐng)域范圍事實(shí)上加重了背景雜物對(duì)有用信號(hào)的干擾,對(duì)一些形狀狹長的物體來說尤為嚴(yán)重。

5、為了解決背景干擾物問題,本文中的方法模仿人類視覺中的選擇機(jī)制對(duì)輪廓線進(jìn)行組合選擇,利用選擇出來的輪廓線生成形狀特征并與模型進(jìn)行匹配。從實(shí)驗(yàn)結(jié)果可以看到,通過該方法選擇出來的特征可以很好地從特征維度中去掉背景信號(hào),達(dá)到最終的識(shí)別目的。在選擇匹配的過程中保證了輪廓線底層語義的完整性。
   物體識(shí)別的層次不僅僅是判斷圖像中是否存在某類物體,或者物體在圖像中所處的位置等等,還包括對(duì)物體更高層次的理解,姿態(tài)分析便是其中之一。第5章提出了

6、一種同樣是基于選擇的姿態(tài)分析算法。不僅對(duì)圖像中的輪廓線進(jìn)行選擇,對(duì)模型姿態(tài)參數(shù)也進(jìn)行選擇。通過匹配從圖像中選擇出來的輪廓線與從模型中選擇出來的姿態(tài)來判斷其合理性。實(shí)驗(yàn)中,該算法被應(yīng)用在一組棒球運(yùn)動(dòng)員的圖像數(shù)據(jù)庫上,并取得了很好的效果,可以得到較為精準(zhǔn)的姿態(tài)判斷。
   第6章討論的內(nèi)容是物體識(shí)別的一個(gè)子課題:輪廓線聚類。不同于利用輪廓線選擇進(jìn)行自頂向下的物體識(shí)別(本質(zhì)上是利用模型把前景輪廓線聚為一類),這里的輪廓線聚類仍然是一個(gè)

7、自底向上的過程。文中的方法期望把輪廓線進(jìn)行某種聚類以得到更高一層的圖像信號(hào)表示。方法選取了另外一張相關(guān)的圖片(深度相關(guān)、運(yùn)動(dòng)相關(guān)、相似圖片)來幫助完成這個(gè)目標(biāo)。
   在交通領(lǐng)域中,街道場景一直是視覺算法應(yīng)用的重要場合。第7章利用一種混合的識(shí)別方法對(duì)街道場景中的物體進(jìn)行了識(shí)別。這些物體包括交通燈、路標(biāo)、路燈、消防栓、樹木以及汽車。由于這幾類物體內(nèi)在的屬性并不一樣(有的物體是剛性物體,有的是由紋理組成,有的則是半剛性或者容易變形)

8、,本文因地制宜地采用了不同的方法來檢測不同的物體類別。文中列出了對(duì)這幾類物體的檢測結(jié)果。
   形狀特征的提取主要基于邊界信息。為了能夠得到清楚的邊界信息,從而增強(qiáng)形狀特征的描述能力,第8章提出了一種能夠自適應(yīng)調(diào)節(jié)參數(shù)的圖像擴(kuò)散算法。該算法的目標(biāo)是在保持圖像結(jié)構(gòu)的前提下去除圖像的噪聲,特別是一些隨機(jī)噪聲與紋理噪聲。本文設(shè)計(jì)了一種新的核函數(shù)來增強(qiáng)圖像結(jié)構(gòu)的保持性能,并且在實(shí)現(xiàn)中利用自底向上的圖像分割信息自適應(yīng)地調(diào)節(jié)核函數(shù)的參數(shù)。從

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論