魯棒語音識別中的特征補償與模型自適應(yīng)算法研究.pdf_第1頁
已閱讀1頁,還剩119頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、在實際應(yīng)用中,由于測試環(huán)境與訓(xùn)練環(huán)境不匹配,語音識別系統(tǒng)的識別性能可能會急劇惡化。外部環(huán)境因素的影響和語音本身的變異性是導(dǎo)致環(huán)境失配的主要原因。本文從前端特征域和后端模型域兩個方面,研究語音識別系統(tǒng)的聲學(xué)與環(huán)境魯棒問題,減小環(huán)境噪聲、說話人的改變和其它語音變異性對語音識別系統(tǒng)的影響,提高語音識別系統(tǒng)在實際環(huán)境中的識別性能。
   本文的研究工作主要包括:
   (1)提出了一種基于隱馬爾可夫模型(HMM)和并行模型組合(

2、PMC)的特征補償算法。該算法用一個包含較多狀態(tài)的遍歷結(jié)構(gòu)HMM取代傳統(tǒng)特征補償算法中的高斯混合模型(GMM),來描述整個語音特征空間的概率分布;然后,用PMC方法調(diào)整該HMM的均值向量和協(xié)方差矩陣;最后,用最小均方誤差(MMSE)方法,估計純凈語音特征向量。該算法在純凈語音特征估計時,考慮了同一單詞樣本內(nèi)部不同特征向量之間的時變關(guān)系,因此取得了更好的補償效果,識別性能明顯優(yōu)于基于GMM的特征補償算法。
   (2)深入研究了基

3、于矢量泰勒級數(shù)(VTS)的特征補償和模型自適應(yīng)算法。首先根據(jù)倒譜域特征向量各維系數(shù)之間相關(guān)性較小且將多個高斯單元的數(shù)據(jù)合并估計噪聲方差時加權(quán)因子對未知的噪聲方差不敏感的特點,提出了一種具有快速收斂特性的方差估計方法,較好地解決了VTS算法的方差估計問題。然后,用遍歷結(jié)構(gòu)HMM取代GMM,估計純凈語音特征向量,進一步提高了特征補償?shù)木取嶒灲Y(jié)果表明,用HMM進行特征補償,其識別性能可接近后端模型自適應(yīng)算法,且具有計算量較小、受狀態(tài)數(shù)目的

4、影響較小等優(yōu)點,可以在識別率和計算量之間取得較好的平衡。最后,將所提算法從特征空間擴展到模型空間,給出了動態(tài)噪聲參數(shù)的估計公式。從而將聲學(xué)模型的動態(tài)參數(shù)和靜態(tài)參數(shù)變換到測試環(huán)境,對含噪語音進行識別。
   (3)在低信噪比環(huán)境下,含噪語音與純凈語音之間的差異較大,通過變換純凈語音聲學(xué)模型得到的含噪語音聲學(xué)模型不能很好地描述含噪語音分布。為了進一步提高低信噪比環(huán)境下的識別性能,提出了基于矢量泰勒級數(shù)的多環(huán)境模型自適應(yīng)算法,用多個基

5、本訓(xùn)練環(huán)境預(yù)測實際測試環(huán)境,并通過含噪測試語音與含噪訓(xùn)練語音之間的矢量泰勒級數(shù)關(guān)系式,將選取的基本環(huán)境聲學(xué)模型的參數(shù)變換到測試環(huán)境。實驗結(jié)果表明,該算法可以進一步提高較低信噪比時語音識別系統(tǒng)的識別性能,優(yōu)于傳統(tǒng)模型自適應(yīng)算法和基于線性變換的多環(huán)境方法。
   (4)為了解決基于變換的模型自適應(yīng)算法中的線性假設(shè)問題,將多項式回歸方法用于模型自適應(yīng),構(gòu)建了基于最大似然多項式回歸的非線性模型自適應(yīng)算法。該算法在對數(shù)譜域的每個Mel通道

6、上,用多項式回歸逼近測試環(huán)境模型均值與訓(xùn)練環(huán)境模型均值之間的非線性關(guān)系。多項式系數(shù)通過EM算法和最大似然準(zhǔn)則,從測試環(huán)境下的少量自適應(yīng)數(shù)據(jù)中估計。該算法較好地克服了線性假設(shè)的缺陷,可同時減小環(huán)境噪聲、說話人的改變或其它變異性因素對語音識別系統(tǒng)的影響,在噪聲補償和說話人自適應(yīng)中識別性能均優(yōu)于傳統(tǒng)線性回歸算法。
   (5)研究了基于變換的模型自適應(yīng)中的數(shù)據(jù)稀疏問題,提出了基于子帶回歸的模型自適應(yīng)算法。該算法考慮了Mel濾波器組相鄰

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論