基于因子分析概率統(tǒng)計(jì)模型的說(shuō)話人識(shí)別.pdf

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-03-10 格式：pdf 頁(yè)數(shù)：51 大?。?.05MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題（含答案詳解+作文范文）_第1頁(yè)

已閱讀1頁(yè)，還剩50頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、說(shuō)話人識(shí)別是根據(jù)說(shuō)話人所發(fā)語(yǔ)音，確定出說(shuō)話人是誰(shuí)的過(guò)程，也就是基于聲音這個(gè)生物特征作為身份認(rèn)證依據(jù)的識(shí)別技術(shù)。說(shuō)話人識(shí)別具有廣泛的應(yīng)用前景，如保安、公安司法、軍事、財(cái)經(jīng)和信息服務(wù)等領(lǐng)域。其研究具有越來(lái)越重要的社會(huì)意義和實(shí)用價(jià)值，因而在國(guó)際和國(guó)內(nèi)都受到了極大的關(guān)注。根據(jù)不同的應(yīng)用場(chǎng)合，說(shuō)話人識(shí)別可以分為說(shuō)話人辯認(rèn)和說(shuō)話人確認(rèn)。本論文就說(shuō)話人識(shí)別中的說(shuō)話人辨認(rèn)問(wèn)題，采用基于因子分析的概率統(tǒng)計(jì)模型方法，從與文本無(wú)關(guān)的角度，對(duì)語(yǔ)音端點(diǎn)

2、檢測(cè)、基于FAHMM和FAGMM的說(shuō)話人模型、基于最大似然估計(jì)(MLE)的EM算法和基于區(qū)分性訓(xùn)練的MCE算法等各方面進(jìn)行了較深入的研究。首先，詳細(xì)討論了說(shuō)話人確認(rèn)中兩種最常用到的基于概率統(tǒng)計(jì)的說(shuō)話人模型：隱馬爾柯夫模型(HMM)和高斯混合模型(GMM)。仔細(xì)分析了HMM和GMM作為說(shuō)話人模型的優(yōu)越之處及其意義。在對(duì)HMM和GMM的概念進(jìn)行了詳細(xì)的討論后，我們重點(diǎn)分析了影響其識(shí)別性能的一個(gè)關(guān)鍵問(wèn)題，即模型的訓(xùn)練算法。主要介紹了

3、常規(guī)的基于最大似然估計(jì)的Baum-Welch算法。接著，探討了語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)及噪聲魯棒性問(wèn)題。在強(qiáng)噪聲環(huán)境下，現(xiàn)有的算法無(wú)法檢測(cè)到準(zhǔn)確的端點(diǎn)，研究自適應(yīng)于環(huán)境噪聲的語(yǔ)音端點(diǎn)檢測(cè)方法是解決噪聲背景下說(shuō)話人識(shí)別和語(yǔ)音識(shí)別的關(guān)鍵。為了提高端點(diǎn)檢測(cè)的正確率，選擇合適的聲學(xué)特征也至關(guān)重要。我們以表征語(yǔ)音信號(hào)復(fù)雜程度的近似熵(Approximate Entropy, ApEn)為聲學(xué)特征，嘗試性地提出了一種在噪聲環(huán)境下的端點(diǎn)檢測(cè)方法，

4、即通過(guò)分析語(yǔ)音信號(hào)的近似熵來(lái)進(jìn)行。實(shí)驗(yàn)表明，在強(qiáng)噪聲環(huán)境下，該方法能夠比較準(zhǔn)確地檢測(cè)語(yǔ)音信號(hào)的端點(diǎn)。為了解決說(shuō)話人識(shí)別中的幀內(nèi)相關(guān)問(wèn)題，從模型端出發(fā)，引入因子分析的降維統(tǒng)計(jì)方法，結(jié)合目前的主流模型HMM和GMM分別對(duì)說(shuō)話人進(jìn)行建模，即FAHMM和FAGMM，并在我們自己錄制的50個(gè)人(30個(gè)男性，20個(gè)女性)的數(shù)據(jù)集上，對(duì)這兩個(gè)模型進(jìn)行了與文本無(wú)關(guān)的說(shuō)話人辨認(rèn)實(shí)驗(yàn)：在基于FAHMM的實(shí)驗(yàn)中，討論了三種不同的參數(shù)共享方

5、式下說(shuō)話人識(shí)別的性能。實(shí)驗(yàn)表明：FAHMM相對(duì)于采用對(duì)角陣形式的HMM，能夠更好的解決特征矢量幀內(nèi)相關(guān)問(wèn)題；在相同的實(shí)驗(yàn)條件下，采用共享觀測(cè)矩陣的FAHMM能夠得到更好的識(shí)別性能，相對(duì)于HMM，誤識(shí)率相對(duì)下降了30％。在基于FAGMM的系統(tǒng)中，我們推導(dǎo)了FAGMM的期望最大訓(xùn)練算法和最小分類(lèi)錯(cuò)誤算法。實(shí)驗(yàn)結(jié)果表明，F(xiàn)AGMM在同一測(cè)試數(shù)據(jù)集上的識(shí)別性能比GMM要好。而且通過(guò)可區(qū)分性算法，即最小分類(lèi)錯(cuò)誤算法使得系統(tǒng)的性能得到進(jìn)一

眾賞文庫(kù)> 全部分類(lèi)> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

基于因子分析概率統(tǒng)計(jì)模型的說(shuō)話人識(shí)別.pdf

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

基于因子分析概率統(tǒng)計(jì)模型的說(shuō)話人識(shí)別.pdf

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載