版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、非特定人語音識別在干凈環(huán)境下識別性能良好,但在噪聲情況下,其系統(tǒng)性能將會大大下降。不僅如此,其識別率還受到語音多變性的影響,使識別的難度加大。本文針對非特定人識別系統(tǒng)中的噪音魯棒性和多變性魯棒性問題,對在特征提取時起重要作用的前端濾波器進(jìn)行研究。分別從聽覺感知和語音信號本身這兩個角度出發(fā)來設(shè)計濾波器,使得濾波器更符合人耳聽覺特性,或更精確地分析待識別的語音信號??乖雽?shí)驗(yàn)表明,隨著濾波器性能的不斷提高,對應(yīng)提取特征的噪音魯棒性逐漸提高,不
2、僅如此,多變性魯棒性的實(shí)驗(yàn)表明,濾波器性能的提高與多變性魯棒性的提高是一致的。本文主要完成了如下工作:
(1)在FIR濾波器設(shè)計的基礎(chǔ)上給出Laguerre濾波器設(shè)計的詳細(xì)步驟,并用后者代替前者用于過零峰值幅度(Zero Crossing Peak Amplitude,ZCPA)特征的提取。給出頻域法實(shí)現(xiàn)Laguetrre濾波器提取.ZCPA特征的詳細(xì)過程。
Laguerre濾波器具有FIR濾波器的線性相位和
3、IIR濾波器的長時記憶性,彌補(bǔ)了FIR濾波器通阻帶特性差的缺點(diǎn)。實(shí)驗(yàn)表明,精確設(shè)計每一通道的中心頻率和帶寬得到的Laguer濾波器較FIR濾波器明顯提高了噪音魯棒性。
(2)針對FIR,Laguerre濾波器帶寬呈對稱性分布,不符合人耳聽覺特性這一缺點(diǎn),設(shè)計實(shí)現(xiàn)了彎折濾波器組(Warped Filter Banks,WFBs),并將其應(yīng)用于ZCPA特征提取。通過一階全通函數(shù)中的彎折因子δ控制濾波器中心頻率和帶寬的分布,從而
4、得到非均勻的頻帶分布和非對稱性的帶寬分布。
典型的彎折因子δ=0.48,δ=O.63分別對應(yīng)Bark,:ERB尺度濾波器。同F(xiàn)IR,Laguerre濾波器相比,WFBs不需要嚴(yán)格控制每一通道的中心頻率和帶寬,而是同時得到16個通道的頻率響應(yīng)。實(shí)驗(yàn)表明,非均勻分布的頻帶和非對稱分布的帶寬較均勻分布的頻帶和對稱分布的帶寬明顯提高了識別率;同F(xiàn)IR,Laguerre濾波器相比,盡管。WFBs設(shè)計簡單,但滿足非對稱性帶寬分布的特性
5、,因此:ERB尺度的WFBs識別率更高,其噪音魯棒性更好。
(3)從待識別的語音信號本身出發(fā),依據(jù)數(shù)字信號處理理論設(shè)計出優(yōu)化濾波器組(Optimized Filter Bank,OFB)模型,并簡化得到自適應(yīng)帶寬濾波器組(Adaptive:Bands Filter Bank,ABFB)模型。FIR,L,aguerre以及WFBs均是在人耳聽覺感知準(zhǔn)則上建立的濾波器模型,而OFB的設(shè)計則創(chuàng)新性地以識別性能為基準(zhǔn),首次通過遺傳
6、算法將前端濾波器和后端識別系統(tǒng)結(jié)合為一個整體,形成一個閉環(huán)系統(tǒng)進(jìn)行優(yōu)化。實(shí)現(xiàn)表明.OFB模型較Bark尺度濾波器明顯提高了識別率,但由于其個數(shù)較多,不利于應(yīng)用。因此簡化OFB模型后得到ABFB模型,實(shí)驗(yàn)表明后者識別率仍明顯高于Barlk尺度濾波器,甚至優(yōu)于ERB尺度濾波器。因此FIR.,Laguerre,WFBs,ABFB四種濾波器中,ABFB濾波器的噪音魯棒性最好,這也表明從分析語音信號本身出發(fā)對濾波器設(shè)計的重要性。
(
7、4)濾波器通道的個數(shù),對濾波器分析信號的精度也有一定的影響。FIR,Laguerile,WFBs以及ABFB濾波器都是采用16通道的帶通濾波器和1 6個頻率箱提取ZCPA。使用Gammatone(GT)濾波器提取ZCPA時,采用K通道帶通濾波器,并設(shè)計相應(yīng)數(shù)日的頻率箱接收幅度信息。實(shí)驗(yàn)表明,18通道較其他通道數(shù)的GT濾波器識別效果更好。
(5)將FIR,GT,Laguerrc,以及WFBs濾波器應(yīng)用于多變性語料庫的非特定人
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 非特定人連續(xù)數(shù)字語音識別研究.pdf
- 非特定人孤立詞語音識別技術(shù)的研究.pdf
- 非特定人孤立詞語音識別技術(shù)研究.pdf
- 非特定人孤立詞語音識別系統(tǒng)的研究.pdf
- 語音識別前端噪聲魯棒性方法研究.pdf
- 非特定人連續(xù)語音識別技術(shù)研究與應(yīng)用.pdf
- 語音識別魯棒性前端若干方法的研究.pdf
- 復(fù)雜環(huán)境非特定人語音識別方法研究.pdf
- 基于HMM和ANN的漢語語音非特定人識別.pdf
- 基于仿生模式識別的非特定人連續(xù)語音識別的研究.pdf
- 非特定人連續(xù)語音識別的理論、分析和實(shí)驗(yàn).pdf
- 漢語非特定人連續(xù)數(shù)碼串語音識別系統(tǒng)的研究.pdf
- Laguerre濾波器在語音識別前端處理中的應(yīng)用研究.pdf
- 基于音素的非特定人語音識別及其拒識算法研究.pdf
- 小詞匯量非特定人連續(xù)語音識別系統(tǒng)的研究.pdf
- 針對非特定人的重卡車載語音識別系統(tǒng)設(shè)計.pdf
- 基于DSP的非特定人孤立詞語音識別系統(tǒng)的研究.pdf
- 基于DHMM非特定人孤立詞語音識別及硬件設(shè)計研究.pdf
- 非特定人漢語連續(xù)數(shù)字語音識別系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 基于DSP平臺的非特定人孤立詞語音識別研究與實(shí)現(xiàn).pdf
評論
0/150
提交評論