基于TLD框架的手熱檢測與跟蹤系統(tǒng)的研究與實現(xiàn).pdf_第1頁
已閱讀1頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、最近幾年,隨著各種智能設備如手機、平板電腦、智能電視等的普及,人與計算機之間的交互活動越來成為人們?nèi)粘I钪胁豢苫蛉钡囊粋€重要組成部分。自然人機交互系統(tǒng)充分利用了這些身體語言來進行人與機器之間的交互。其中,手勢是很重要的一種手段。本文將嘗試設計一個簡單的基于視覺的手勢交互系統(tǒng)原型,其最終目的是用人手模擬計算機鼠標的功能。該系統(tǒng)設計的關(guān)鍵功能是實時地跟蹤并檢測人手的位置、狀態(tài)并輸出結(jié)果。
   在計算機視覺領(lǐng)域,實時目標檢測與跟蹤

2、是指在一個視頻流(通常是由攝像機實時拍攝的畫面)中跟蹤一個或多個具有選定特征的目標的過程。目前,靜止圖像中目標檢測(如人臉檢測)的相應技術(shù)已經(jīng)非常成熟,但是在運動場景中實時地捕捉目標卻一直是一個比較艱難的課題。由于應用場景的復雜性,跟蹤目標的多樣性、以及對實時性和魯棒性等的高要求,實時目標檢測與跟蹤數(shù)十年來一直是國內(nèi)研究的熱點。
   本文的主要研究了一種基于TLD框架的實時手勢檢測與跟蹤系統(tǒng),對手勢檢測,手勢跟蹤,在線學習等各

3、個環(huán)節(jié)的誤差優(yōu)化等都進行了理論研究與測試,最后,在BeagleBoard嵌入式開發(fā)板上實現(xiàn)了一個簡單的手勢人機交互系統(tǒng)原型。具體而言,本文的主要工作如下:
   (1)結(jié)合TLD的跟蹤框架,采用Lucas-Kanade金字塔算法計算光流,并針對該算法計算耗時的缺點,采用了一種改進的金字塔光流計算法,并結(jié)合前后兩幀雙向跟蹤估計誤差,降低了跟蹤的錯誤率,使得光流法對像素點的跟蹤更加可靠,有效地避免了跟蹤中經(jīng)常出現(xiàn)的漂移問題,并且在O

4、penCV下對圖像匹配進行了測試。
   (2)針對當前各種模版匹配算法不能處理目標在視野中消失或部分被遮蓋的問題,提出了采用一種基于圖像局部小塊集合的手勢表示模型,采用隨機蕨分類器做模版匹配,并結(jié)合在線學習實時更新模型,有效解決了在目標消失后無法重新跟蹤或者當目標被部分遮蓋時難以給出正確結(jié)果的困難。
   (3)設計了一個簡單的手勢人機交互系統(tǒng)原型,結(jié)合OMAP處理器的特點,將算法的處理過程平均分配給ARM核心和DSP

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論