2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩82頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、作為計(jì)算機(jī)視覺領(lǐng)域的一個(gè)基礎(chǔ)問題,人體動(dòng)作識(shí)別旨在通過算法讓機(jī)器對(duì)人體動(dòng)作視頻實(shí)現(xiàn)語義上的理解和分析。基于人體動(dòng)作識(shí)別的潛在應(yīng)用包括了智能監(jiān)控、視頻內(nèi)容分析以及人機(jī)交互、智能家居等多個(gè)領(lǐng)域。正是這樣廣泛的應(yīng)用場(chǎng)景和潛在的應(yīng)用價(jià)值,在計(jì)算機(jī)視覺領(lǐng)域,大量的科研工作和研究課題圍繞人體動(dòng)作識(shí)別展開。然而,人體動(dòng)作識(shí)別又是一個(gè)非常有挑戰(zhàn)性的研究課題,存在諸多難點(diǎn)。在動(dòng)作視頻中,往往存在著背景復(fù)雜、人體遮擋、攝像頭移動(dòng)與縮放等問題。即使在帶有深度

2、信息的動(dòng)作視頻中,背景噪聲、人體骨架檢測(cè)的漂移,以及同一動(dòng)作類別下由于動(dòng)作類別的語義范圍大而造成的類內(nèi)差異較高的問題仍然存在。針對(duì)這些問題,本文從人體動(dòng)作視頻的表達(dá)出發(fā),通過對(duì)人體動(dòng)作視頻數(shù)據(jù)的底層特征提取、中層屬性挖掘以及利用深度學(xué)習(xí)模型進(jìn)行特征學(xué)習(xí)的研究,探究視頻中人體動(dòng)作的合理有效的表達(dá),并最終利用機(jī)器學(xué)習(xí)模型進(jìn)行人體動(dòng)作分類識(shí)別。
  本文的研究?jī)?nèi)容主要集中在對(duì)動(dòng)作視頻的特征表達(dá)和屬性挖掘上,分別從底層特征表達(dá)、動(dòng)作屬性挖

3、掘以及多特征融合的三個(gè)角度來探究人體動(dòng)作視頻的有效表達(dá)在視頻動(dòng)作分類上的作用。主要內(nèi)容包括:⑴針對(duì)帶有深度信息的人體骨架數(shù)據(jù),設(shè)計(jì)了合理的底層特征表達(dá)方式,并采用了馬爾可夫隨機(jī)場(chǎng)模型結(jié)合骨架序列本身的空間約束性和時(shí)間一致性,對(duì)特征空間進(jìn)行編碼,抑制了特征空間因?yàn)樵肼晹?shù)據(jù)存在的類內(nèi)差異過大和類間區(qū)分性不夠的問題。同時(shí)針對(duì)應(yīng)用場(chǎng)景的特性,改進(jìn)了多示例學(xué)習(xí)模型,提出了基于模式的多示例學(xué)習(xí)模型,學(xué)習(xí)各動(dòng)作類別中具有區(qū)分性的骨架運(yùn)動(dòng),用于低延時(shí)識(shí)

4、別系統(tǒng)中每幀骨架與各動(dòng)作類別相關(guān)程度的衡量。⑵針對(duì)帶有深度信息的人體骨架的數(shù)據(jù),改進(jìn)并完備了底層人體骨架特征,并設(shè)計(jì)出有效地屬性挖掘方法,盡可能減少底層特征到高層語義之間的鴻溝。同時(shí)完全采用數(shù)據(jù)驅(qū)動(dòng)的方式挖掘?qū)傩蕴卣鳎趯?shí)現(xiàn)有效可靠的人體骨架動(dòng)作識(shí)別系統(tǒng)的同時(shí),提出自動(dòng)生長(zhǎng)的屬性空間模型,能夠在識(shí)別過程中,實(shí)現(xiàn)屬性空間的擴(kuò)展,探究可擴(kuò)展的人體動(dòng)作識(shí)別系統(tǒng)的可能性。⑶針對(duì)傳統(tǒng)的RGB視頻數(shù)據(jù),在應(yīng)用于圖像分類的卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,通過稠

5、密軌跡對(duì)視頻中具有運(yùn)動(dòng)主體區(qū)域檢測(cè)并進(jìn)行跟蹤,并利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)提取運(yùn)動(dòng)主體的外觀特征,同時(shí)沿著稠密軌跡的鄰域,提取相應(yīng)的局部運(yùn)動(dòng)特征。采用了AdaBoost算法,實(shí)現(xiàn)多特征融合有效地表達(dá)動(dòng)作視頻,討論其在動(dòng)作視頻分類上的性能。
  本文針對(duì)基于視頻的人體動(dòng)作識(shí)別問題,從視頻的特征設(shè)計(jì)和提取以及動(dòng)作屬性的挖掘等多個(gè)角度來對(duì)視頻數(shù)據(jù)進(jìn)行表達(dá),同時(shí)涉及到帶有深度信息的人體骨架序列的動(dòng)作分類和不帶有深度信息的傳統(tǒng)RGB空間下的視頻數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論