唇讀的靜動態(tài)特征表示方法研究.pdf_第1頁
已閱讀1頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、唇讀(Lipreading)研究試圖賦予計算機根據(jù)唇部運動辨別說話內(nèi)容和根據(jù)唇部運動規(guī)律辨別人物身份的能力。該研究具有重要的科學(xué)意義和應(yīng)用價值。從學(xué)科建設(shè)和發(fā)展的角度,唇讀作為一個科學(xué)問題,是一個典型的圖像模式分析、理解和分類計算的問題,涉及模式識別,計算機視覺,智能人機交互,認(rèn)知科學(xué)等多個學(xué)科。同時,作為生物特征識別技術(shù)之一的基于唇讀的說話人識別技術(shù)則在公共安全、信息安全等領(lǐng)域具有潛在的應(yīng)用前景。
  目前,唇讀在說話內(nèi)容識別上

2、還沒有獲得理想的識別性能,其中一個重要的原因就是沒有對唇區(qū)特征區(qū)域給出很好的定義和有效的特征表示。本文重點探討了特征表示的一些技術(shù)和關(guān)鍵問題,對唇區(qū)的特征區(qū)域標(biāo)定,靜、動態(tài)特征表示方面進行了專門研究。本文主要的研究工作如下:
  1.提出了基于統(tǒng)計的自適應(yīng)特征區(qū)域標(biāo)定方法。特征區(qū)域的標(biāo)定是唇讀特征表示的第一步,本文提出的標(biāo)定方法首先通過手動標(biāo)定唇的“紅色區(qū)域”,然后對其范圍進行統(tǒng)計,得到以中心點為基準(zhǔn)的最大尺寸,并將統(tǒng)計信息反饋給

3、預(yù)處理模塊,由預(yù)處理模塊自動對特征區(qū)域重新標(biāo)定,由此可以使標(biāo)定尺寸自適應(yīng)于不同的圖片集。這種方法在本文的所有特征表示方法上取得了性能提升。
  2.基于靜態(tài)圖像的特征表示的研究中,本文對PCA、DCT、Gabor方法在唇讀中的應(yīng)用進行了深入研究和實驗對比。針對目前的特征表示方法沒有泛化能力的問題進行了探討,引入一種新的特征描述子:局部二值模式,提出局部二值模式在唇讀中的應(yīng)用方法,該方法具有良好的泛化能力和較快的計算速度,在未來的實

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論