2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩83頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、目前大多數(shù)語音識別系統(tǒng)在靜音環(huán)境下具有較高的識別率,但在噪聲環(huán)境下,系統(tǒng)的性能會嚴(yán)重下降,為了使語音識別系統(tǒng)實用化,抗噪語音識別研究具有重要意義。 人耳具有很強(qiáng)的識別能力,即使在噪聲環(huán)境下也如此。因此研究人耳的聽覺特性,進(jìn)行語音特征參數(shù)的提取,有利于提高系統(tǒng)的魯棒性。 本文圍繞抗噪語音識別這個中心,完成了以下研究工作。首先實現(xiàn)了具有過零峰值幅度(ZCPA:Zero-crossingwithPeakAmplitude)特征

2、的語音識別系統(tǒng),它是基于人耳的聽覺模型建立起來的。該模型通過分析和計算語音信號相鄰上升過零點(diǎn)間的間隔,并將之分配到對應(yīng)的頻率箱,以此反映信號的頻率信息;再通過檢測相鄰上升過零點(diǎn)間的峰值幅度并進(jìn)行非線性壓縮,對頻率箱幅度進(jìn)行加權(quán)。論文分析了該系統(tǒng)的抗噪性能,通過實驗證明了這種系統(tǒng)的抗噪性能優(yōu)于常用的由LPCC,MFCC作為識別特征的系統(tǒng)性能。 接著,論文以上述系統(tǒng)為基礎(chǔ),提出了改進(jìn)ZCPA特征,即組合差分ZCPA特征。該特征利用了

3、語音差分信號的特性,增加信號差分信息到ZCPA特征中。新特征能提取疊加在低頻中的高頻信息,一定程度上彌補(bǔ)了ZCPA特征的不足,獲得了改進(jìn)的實驗結(jié)果。 本文同時對識別系統(tǒng)的前端濾波器進(jìn)行了研究。提出使用Bark小波濾波器代替FIR濾波器。由于大多數(shù)小波,無論是二進(jìn)小波、小波包還是M帶小波,其頻域的劃分都是一種倍頻程關(guān)系,這與人耳的臨界頻帶的劃分相差很大。因此,若有一種小波能按照臨界帶寬劃分頻帶,則這樣的小波更符合人耳對聲音的感知。

4、Bark小波就是這樣一種小波,它按照臨界帶寬來非均勻地劃分頻帶,更接近人耳對聲音頻率的感知。構(gòu)造Bark小波的基本思想是:所選擇的小波母函數(shù)在Bark域滿足時間一帶寬積最小,即為Bark域的高斯函數(shù);母小波在Bark域的帶寬相等。論文分析了該小波的分解和重構(gòu)性質(zhì),給出了其時域和頻域特性以及Bark小波濾波器用于前端處理的原理,仿真實現(xiàn)了基于Bark小波濾波器和ZCPA特征的語音識別系統(tǒng),獲得了改進(jìn)后的結(jié)果,提高了系統(tǒng)的識別率。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論