自動語音識別特征補償方法研究.pdf_第1頁
已閱讀1頁,還剩58頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、本文主要研究的是自動語音識別中的前端噪聲魯棒性問題。眾所周知,語音識別的根本目的就是使機器能夠聽懂人類的語言。在當前的實驗室環(huán)境下,很多識別系統(tǒng)已經能夠達到很好的性能。但在實際環(huán)境中,由于噪聲的復雜多變和未知因素的干擾,系統(tǒng)性能往往會急劇下降以至于遠遠不能達到實用的目的。因此,噪聲魯棒性一直是語音識別研究中一個非常重要的方面。噪聲魯棒性關鍵問題是解決訓練環(huán)境和測試環(huán)境的失配。實際中這種失配是由語音采集環(huán)境的影響(如加性噪聲、信道畸變等)

2、以及說話人自身的影響(如說話風格、口音等)引起的。為了使語音識別系統(tǒng)在不同噪聲環(huán)境下仍能具有較好的性能,就需要采用各種方法來增強識別系統(tǒng)的魯棒性。
   噪聲魯棒性的方法多種多樣,但一般來說可分為前端方法和后端方法兩大類。前端方法集中于對語音信號本身或者語音特征做處理,達到消除或盡可能抑制噪聲影響的效果;后端方法主要集中于增強語音聲學模型自身的寬容度和適應能力,使模型能夠容忍一定程度的噪聲,或者調整模型參數(shù)使之跟上噪聲環(huán)境的變化

3、。本文主要是對噪聲魯棒性的前端方法進行了研究,改善了一些已有的方法,也提出了一些新的方法。
   首先,在本文第一章中,對語音識別技術的發(fā)展歷程做了簡單的概述,并重點介紹了一下基于統(tǒng)計建??蚣芟伦詣诱Z音識別系統(tǒng)的幾個重要組成部分。
   由于實際中噪聲的多樣化,相應的噪聲魯棒性方法也有很多種,每種方法都有它的特點和適用范圍。正是針對這種情況,論文在第二章中分別從魯棒性特征的提取、語音增強、特征補償/增強、模型補償四個方面

4、對噪聲魯棒性問題進行了比較全面的介紹和總結。
   在本文第三章中,首先介紹了基于顯式模型的一階矢量泰勒級數(shù)(VTS)離線特征補償算法,但是離線算法在實用時并不完美,它最大的缺陷在于其巨大的運算量極大的降低了系統(tǒng)處理的效率。因此,在離線算法的基礎上我們提出了高實時性的一階VTS特征補償算法,它在保證離線算法性能的同時,大大提升了算法處理的實時性。
   雖然在第三章中介紹的高實時性的一階VTS特征補償算法取得了不錯的效果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論