版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、說(shuō)話人識(shí)別是根據(jù)說(shuō)話人所發(fā)語(yǔ)音,確定出說(shuō)話人是誰(shuí)的過(guò)程,也就是基于聲音這個(gè)生物特征作為身份認(rèn)證依據(jù)的識(shí)別技術(shù)。說(shuō)話人識(shí)別具有廣泛的應(yīng)用前景,如保安、公安司法、軍事、財(cái)經(jīng)和信息服務(wù)等領(lǐng)域。其研究具有越來(lái)越重要的社會(huì)意義和實(shí)用價(jià)值,因而在國(guó)際和國(guó)內(nèi)都受到了極大的關(guān)注。 根據(jù)不同的應(yīng)用場(chǎng)合,說(shuō)話人識(shí)別可以分為說(shuō)話人辯認(rèn)和說(shuō)話人確認(rèn)。本論文就說(shuō)話人識(shí)別中的說(shuō)話人辨認(rèn)問(wèn)題,采用基于因子分析的概率統(tǒng)計(jì)模型方法,從與文本無(wú)關(guān)的角度,對(duì)語(yǔ)音端點(diǎn)
2、檢測(cè)、基于FAHMM和FAGMM的說(shuō)話人模型、基于最大似然估計(jì)(MLE)的EM算法和基于區(qū)分性訓(xùn)練的MCE算法等各方面進(jìn)行了較深入的研究。 首先,詳細(xì)討論了說(shuō)話人確認(rèn)中兩種最常用到的基于概率統(tǒng)計(jì)的說(shuō)話人模型:隱馬爾柯夫模型(HMM)和高斯混合模型(GMM)。仔細(xì)分析了HMM和GMM作為說(shuō)話人模型的優(yōu)越之處及其意義。在對(duì)HMM和GMM的概念進(jìn)行了詳細(xì)的討論后,我們重點(diǎn)分析了影響其識(shí)別性能的一個(gè)關(guān)鍵問(wèn)題,即模型的訓(xùn)練算法。主要介紹了
3、常規(guī)的基于最大似然估計(jì)的Baum-Welch算法。 接著,探討了語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)及噪聲魯棒性問(wèn)題。在強(qiáng)噪聲環(huán)境下,現(xiàn)有的算法無(wú)法檢測(cè)到準(zhǔn)確的端點(diǎn),研究自適應(yīng)于環(huán)境噪聲的語(yǔ)音端點(diǎn)檢測(cè)方法是解決噪聲背景下說(shuō)話人識(shí)別和語(yǔ)音識(shí)別的關(guān)鍵。為了提高端點(diǎn)檢測(cè)的正確率,選擇合適的聲學(xué)特征也至關(guān)重要。我們以表征語(yǔ)音信號(hào)復(fù)雜程度的近似熵(Approximate Entropy, ApEn)為聲學(xué)特征,嘗試性地提出了一種在噪聲環(huán)境下的端點(diǎn)檢測(cè)方法,
4、即通過(guò)分析語(yǔ)音信號(hào)的近似熵來(lái)進(jìn)行。實(shí)驗(yàn)表明,在強(qiáng)噪聲環(huán)境下,該方法能夠比較準(zhǔn)確地檢測(cè)語(yǔ)音信號(hào)的端點(diǎn)。 為了解決說(shuō)話人識(shí)別中的幀內(nèi)相關(guān)問(wèn)題,從模型端出發(fā),引入因子分析的降維統(tǒng)計(jì)方法,結(jié)合目前的主流模型HMM和GMM分別對(duì)說(shuō)話人進(jìn)行建模,即FAHMM和FAGMM,并在我們自己錄制的50個(gè)人(30個(gè)男性,20個(gè)女性)的數(shù)據(jù)集上,對(duì)這兩個(gè)模型進(jìn)行了與文本無(wú)關(guān)的說(shuō)話人辨認(rèn)實(shí)驗(yàn): 在基于FAHMM的實(shí)驗(yàn)中,討論了三種不同的參數(shù)共享方
5、式下說(shuō)話人識(shí)別的性能。實(shí)驗(yàn)表明:FAHMM相對(duì)于采用對(duì)角陣形式的HMM,能夠更好的解決特征矢量幀內(nèi)相關(guān)問(wèn)題;在相同的實(shí)驗(yàn)條件下,采用共享觀測(cè)矩陣的FAHMM能夠得到更好的識(shí)別性能,相對(duì)于HMM,誤識(shí)率相對(duì)下降了30%。 在基于FAGMM的系統(tǒng)中,我們推導(dǎo)了FAGMM的期望最大訓(xùn)練算法和最小分類(lèi)錯(cuò)誤算法。實(shí)驗(yàn)結(jié)果表明,F(xiàn)AGMM在同一測(cè)試數(shù)據(jù)集上的識(shí)別性能比GMM要好。而且通過(guò)可區(qū)分性算法,即最小分類(lèi)錯(cuò)誤算法使得系統(tǒng)的性能得到進(jìn)一
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于因子分析的說(shuō)話人確認(rèn).pdf
- 基于聯(lián)合因子分析的耳語(yǔ)音說(shuō)話人識(shí)別研究.pdf
- 基于因子分析和支持向量機(jī)的耳語(yǔ)說(shuō)話人識(shí)別.pdf
- 基于概率統(tǒng)計(jì)模型的說(shuō)話人確認(rèn)的研究.pdf
- MMCE算法在因子分析概率統(tǒng)計(jì)模型中的應(yīng)用.pdf
- 基于因子分析的說(shuō)話人分離技術(shù)研究.pdf
- 基于統(tǒng)計(jì)模型的說(shuō)話人識(shí)別研究與實(shí)現(xiàn).pdf
- 基于因子分析的與文本無(wú)關(guān)的說(shuō)話人辯認(rèn)方法研究.pdf
- 多元統(tǒng)計(jì)因子分析
- 說(shuō)話人識(shí)別情感合成問(wèn)題的概率模型研究.pdf
- 基于混合高斯模型的說(shuō)話人識(shí)別.pdf
- 基于概率統(tǒng)計(jì)模型的雷達(dá)目標(biāo)HRRP識(shí)別.pdf
- 基于高斯混合模型的說(shuō)話人識(shí)別研究.pdf
- 基于高斯混合模型的說(shuō)話人識(shí)別算法研究.pdf
- 基于軌線模型和VQ模型的說(shuō)話人識(shí)別研究.pdf
- 基于PLDA模型的說(shuō)話人識(shí)別方法研究.pdf
- 基于高斯混合模型的說(shuō)話人識(shí)別技術(shù)研究.pdf
- 基于模型聚類(lèi)的說(shuō)話人識(shí)別方法研究.pdf
- 基于特征模糊度分析的說(shuō)話人識(shí)別.pdf
- 基于小波分析的說(shuō)話人識(shí)別研究.pdf
評(píng)論
0/150
提交評(píng)論