版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、圖像中包括哪些類別的對(duì)象?對(duì)象的具體位置在哪里?每一類的對(duì)象有幾個(gè)?對(duì)象有什么姿勢(shì)動(dòng)作?它們之間的關(guān)系又是怎樣?如果讓人們回答這些問(wèn)題,是一件很容易的事情。但普遍意義上的計(jì)算機(jī)理解圖像內(nèi)容,仍然是一個(gè)未解的難題。朝著這個(gè)最終目標(biāo),圖像分類與目標(biāo)檢測(cè)這兩個(gè)基礎(chǔ)問(wèn)題,受到了機(jī)器視覺(jué)領(lǐng)域的廣泛重視,有著大量深入的研究。圖像分類問(wèn)題需要回答某一類或某幾類對(duì)象是否存在于給定的圖像中,但不需要給出對(duì)象的具體位置。而目標(biāo)檢測(cè)問(wèn)題更為困難,除了要回答圖
2、像中存在哪些類別的對(duì)象,同時(shí)還要給出對(duì)象的具體位置。這兩個(gè)問(wèn)題既不同又相關(guān)。不同之處在于是否需要給出對(duì)象具體位置。相關(guān)之處在于能夠處理目標(biāo)檢測(cè)的方法也自然能夠完成圖像分類,但是這樣加大了問(wèn)題的難度,事實(shí)上目標(biāo)檢測(cè)的正確率遠(yuǎn)遠(yuǎn)不如只作圖像分類;但是圖像畢竟還是按照目標(biāo)對(duì)象是否存在而分類,圖像的類別還是主要由對(duì)象所在的區(qū)域而決定。
本論文同時(shí)考慮了問(wèn)題之間的差異性與相關(guān)性,并將這兩者統(tǒng)一看成區(qū)域選擇問(wèn)題。假設(shè)測(cè)試圖像中所有對(duì)象
3、的范圍都被標(biāo)注清楚,那么無(wú)論是圖像分類還是目標(biāo)檢測(cè),剩下的工作就只是對(duì)范圍之內(nèi)的區(qū)域做類別區(qū)分。由此可見,這兩個(gè)問(wèn)題的特殊之處就在于區(qū)域的選擇。從區(qū)域選擇的角度也可以解釋目前主要的研究工作與研究難點(diǎn)。
圖像分類的優(yōu)秀方法常常用到各種不同層次不同種類的圖像特征合并,有些復(fù)雜的方法甚至先采用目標(biāo)檢測(cè)得到重點(diǎn)區(qū)域,然后再特別加入重點(diǎn)區(qū)域中的特征。這些方法雖然沒(méi)有得到精確的對(duì)象區(qū)域,但隱含的盡量選擇了對(duì)象可能存在區(qū)域的特征。如何排
4、除掉明顯無(wú)關(guān)的區(qū)域,盡量用對(duì)象所在區(qū)域決定圖像類別正是這個(gè)問(wèn)題的難點(diǎn)。
目標(biāo)檢測(cè)的兩大流派分別是基于分割的方法和滑動(dòng)窗口方法。前者先將圖像預(yù)先分割成若干區(qū)域,然后判斷每個(gè)區(qū)域是否屬于目標(biāo)類別,這相當(dāng)于是對(duì)區(qū)域區(qū)域做了選擇。此類方法的缺點(diǎn)是檢測(cè)結(jié)果容易受到分割錯(cuò)誤的影響,如果區(qū)域本身就存在錯(cuò)誤,如果區(qū)域本身既不是整個(gè)對(duì)象,也不是對(duì)象的某個(gè)有效部位,那么無(wú)論模型怎么分類,也得不到有意義的檢測(cè)結(jié)果。這時(shí)區(qū)域選擇的難點(diǎn)是如何得到盡
5、量正確的區(qū)域。后者將檢測(cè)窗口置于圖像中的每個(gè)位置,然后判斷窗口內(nèi)部是否包含目標(biāo)對(duì)象,這種區(qū)域選擇的方式就更為直接。此類方法雖然檢測(cè)精確度較高,但檢測(cè)速度較慢,而且還需要后處理方法壓縮多個(gè)重合的檢測(cè)窗口。此時(shí)的難點(diǎn)是如何盡量減少窗口搜索的區(qū)域。如果能有一種方法提供較為穩(wěn)定準(zhǔn)確的對(duì)象出現(xiàn)的位置,就可以只將窗口置于提供的那些位置上進(jìn)行檢測(cè)。
本論文從區(qū)域選擇這個(gè)統(tǒng)一的角度出發(fā),并根據(jù)具體問(wèn)題與難點(diǎn)的不同,提出不同的圖像分解方法,
6、以及對(duì)分解得到的區(qū)域選擇利用的方法。
針對(duì)圖像分類的區(qū)域選擇難點(diǎn),本論文提出一種新的機(jī)器學(xué)習(xí)框架-分解學(xué)習(xí)。它同時(shí)利用了有類別和無(wú)類別的數(shù)據(jù),以類似于子空間聚類的方式搜索圖像原始輸入空間中的有效區(qū)域。每個(gè)區(qū)域被看作類別概念的子概念,單個(gè)基礎(chǔ)分類器在每個(gè)區(qū)域中獨(dú)立訓(xùn)練,其輸出將作為新特征空間的一個(gè)高層特征。在重建的新特征空間中訓(xùn)練最終分類器。實(shí)驗(yàn)在MNIST手寫數(shù)字?jǐn)?shù)據(jù)集和Caltech101圖像分類數(shù)據(jù)集上進(jìn)行,分解學(xué)習(xí)在
7、不采用任何與機(jī)器視覺(jué)相關(guān)的特征提取方法的情況下,仍然有效的提高了分類的正確率。
針對(duì)基于分割的目標(biāo)檢測(cè)方法的區(qū)域選擇難點(diǎn),本論文提出一種最大化間隔分割選擇方法。每張圖像經(jīng)過(guò)多種互補(bǔ)的分割方法預(yù)處理,得到多包區(qū)域,其中存在一包相對(duì)較好的對(duì)象分割結(jié)果。分割選擇的目標(biāo)是將每張圖像的最佳分割結(jié)果選擇出來(lái),將其中的區(qū)域拿出組成訓(xùn)練集?!胺指钸x擇+分類”被統(tǒng)一建模為最大化間隔問(wèn)題,目標(biāo)函數(shù)被表示為二次規(guī)劃的形式。此目標(biāo)函數(shù)經(jīng)過(guò)推導(dǎo)轉(zhuǎn)化
8、,得到其最終的對(duì)偶形式,并通過(guò)模擬煺火解法得到近似最優(yōu)解。實(shí)驗(yàn)在PASCAL VOC2007數(shù)據(jù)集上進(jìn)行,在絕大部分類別上,分割選擇方法的檢測(cè)精確度超過(guò)了單一分割方法。
針對(duì)滑動(dòng)窗口目標(biāo)檢測(cè)方法的區(qū)域選擇難點(diǎn),本論文提出一種區(qū)域位置提示的可變形模型候選點(diǎn)檢測(cè)算法。我們延續(xù)了上面的研究工作,通過(guò)仔細(xì)觀察采樣圖像的分割結(jié)果,發(fā)現(xiàn)一個(gè)有趣的事實(shí):雖然幾乎每張圖里都存在分割錯(cuò)誤,但是在大多數(shù)情況下總會(huì)有某個(gè)區(qū)域的邊角與對(duì)象真實(shí)位置
9、的邊角很接近。由此,如果重用之前的分割結(jié)果,檢測(cè)窗口只需要置于這些邊角位置,就可以避免大量不必要位置上的窮舉搜索??勺冃尾糠帜P捅WC了檢測(cè)器本身的精確性,而分割位置提示保證了檢測(cè)的效率,同時(shí)避免了后處理操作。實(shí)驗(yàn)仍然在PASCAL VOC2007數(shù)據(jù)集上進(jìn)行,候選點(diǎn)檢測(cè)算法在一半類別上超過(guò)了窮舉搜索方法。
除了以上難點(diǎn)之外,目標(biāo)檢測(cè)在具體訓(xùn)練時(shí)還有容易被忽視的地方。目標(biāo)檢測(cè)的訓(xùn)練數(shù)據(jù)由少量的目標(biāo)對(duì)象和大量的其他對(duì)象或背景組
10、成。這是典型的不平衡數(shù)據(jù)集,目標(biāo)類別在其中只占一小部分。不平衡數(shù)據(jù)集往往會(huì)降低分類的性能,尤其是作為目標(biāo)對(duì)象的少數(shù)類容易被忽略。針對(duì)此問(wèn)題,本論文提出了一種處理不平衡數(shù)據(jù)的支持向量機(jī)-IISVM,并將其引入到最大化間隔分割選擇的訓(xùn)練中,進(jìn)一步提高了目標(biāo)檢測(cè)的結(jié)果。
本論文的最后對(duì)研究工作進(jìn)行了總結(jié),說(shuō)明了幾種區(qū)域選擇利用方式之間的發(fā)展過(guò)程。另外,本文還從人類檢測(cè)圖像物體的角度闡述了目前這兩個(gè)問(wèn)題無(wú)法徹底解決的原因,以及今后
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于機(jī)器學(xué)習(xí)方法的生物序列分類研究.pdf
- 機(jī)器學(xué)習(xí)方法在遙感圖像處理中的應(yīng)用研究.pdf
- 基于多特征的主動(dòng)學(xué)習(xí)方法在圖像分類中的應(yīng)用研究.pdf
- 圖像分割和邊緣檢測(cè)方法在昆蟲圖像中的應(yīng)用.pdf
- 基于機(jī)器學(xué)習(xí)方法的網(wǎng)絡(luò)流量分類研究.pdf
- 基于支持向量機(jī)方法的圖像分割與目標(biāo)分類.pdf
- 視頻圖像的運(yùn)動(dòng)目標(biāo)檢測(cè)和分割方法研究.pdf
- 多分類主動(dòng)學(xué)習(xí)方法在地表分類中的應(yīng)用.pdf
- 核機(jī)器學(xué)習(xí)方法及其在視覺(jué)檢測(cè)中的應(yīng)用研究.pdf
- 在線集成學(xué)習(xí)方法及其在視頻目標(biāo)檢測(cè)中應(yīng)用研究.pdf
- 基于視覺(jué)特征與機(jī)器學(xué)習(xí)的圖像分類和圖像檢索方法研究.pdf
- 基于機(jī)器學(xué)習(xí)的圖像邊緣檢測(cè)方法的研究與應(yīng)用.pdf
- 稀疏表示中的字典學(xué)習(xí)方法研究及其在圖像分類中的應(yīng)用.pdf
- AdaBoost和主動(dòng)學(xué)習(xí)方法在郵件分類中的應(yīng)用研究.pdf
- 網(wǎng)絡(luò)入侵檢測(cè)中機(jī)器學(xué)習(xí)方法的應(yīng)用研究.pdf
- 入侵檢測(cè)中的機(jī)器學(xué)習(xí)方法及其應(yīng)用研究.pdf
- 基于目標(biāo)分解與機(jī)器學(xué)習(xí)的極化SAR圖像地物分類.pdf
- 模糊機(jī)器學(xué)習(xí)方法在熱軋層流冷卻中的應(yīng)用.pdf
- 機(jī)器學(xué)習(xí)方法在銀行現(xiàn)金預(yù)測(cè)系統(tǒng)中的應(yīng)用.pdf
- 基于注意力機(jī)制的圖像分類深度學(xué)習(xí)方法研究.pdf
評(píng)論
0/150
提交評(píng)論