版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、語(yǔ)音轉(zhuǎn)換技術(shù)是當(dāng)前語(yǔ)音信號(hào)處理領(lǐng)域的研究熱點(diǎn)之一,其在人機(jī)交互、語(yǔ)音修復(fù)、影視配音、語(yǔ)音偽裝和保密通信等方面有著廣泛的應(yīng)用。目前語(yǔ)音轉(zhuǎn)換的研究主要集中在頻譜包絡(luò)和韻律特征等的轉(zhuǎn)換上,但在對(duì)其的轉(zhuǎn)換上還未達(dá)到好的效果。本文在研究分析現(xiàn)有語(yǔ)音轉(zhuǎn)換算法的基礎(chǔ)上,設(shè)計(jì)構(gòu)建了基于高斯混合模型GMM和BP神經(jīng)網(wǎng)絡(luò)的語(yǔ)音轉(zhuǎn)換系統(tǒng),并完成了算法仿真和語(yǔ)音轉(zhuǎn)換系統(tǒng)實(shí)現(xiàn)。最后采用客觀評(píng)價(jià)和主觀評(píng)價(jià)方法對(duì)系統(tǒng)進(jìn)行了性能評(píng)價(jià)。
本文主要研究?jī)?nèi)容如
2、下:
(1)在分析語(yǔ)音轉(zhuǎn)換的基本原理、語(yǔ)音的時(shí)域特性、語(yǔ)音的個(gè)性特征參數(shù)和語(yǔ)音轉(zhuǎn)換算法的基礎(chǔ)上,選取了語(yǔ)音信號(hào)的頻譜包絡(luò)及其殘差和基音周期作為語(yǔ)音轉(zhuǎn)換的特征參數(shù),選用了GMM模型和BP網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練和轉(zhuǎn)換。設(shè)計(jì)了基于GMM和BP網(wǎng)絡(luò)的語(yǔ)音轉(zhuǎn)換系統(tǒng)總體框架。
(2)完成了源和目標(biāo)說(shuō)話人譜包絡(luò)LPC系數(shù)及頻譜包絡(luò)殘差的提取,在研究GMM模型基本原理的基礎(chǔ)上,用EM算法和K-Means算法對(duì)GMM模型的初始參數(shù)進(jìn)
3、行估計(jì),利用估計(jì)的初始參數(shù)對(duì)提取的LPC參數(shù)進(jìn)行GMM模型訓(xùn)練,得到其映射函數(shù),并據(jù)此對(duì)源語(yǔ)音的LPC系數(shù)進(jìn)行轉(zhuǎn)換,仿真分析了基于GMM模型譜包絡(luò)的源、目標(biāo)和轉(zhuǎn)換后語(yǔ)音的時(shí)域波形和語(yǔ)譜圖。
(3)采用GMM模型完成了對(duì)源和目標(biāo)語(yǔ)音譜包絡(luò)殘差的訓(xùn)練,得到了源和目標(biāo)語(yǔ)音殘差碼本的映射關(guān)系,并通過(guò)映射關(guān)系對(duì)源語(yǔ)音的殘差進(jìn)行了轉(zhuǎn)換,仿真分析了基于GMM模型殘差的源、目標(biāo)和轉(zhuǎn)換后語(yǔ)音的時(shí)域波形和語(yǔ)譜圖。
(4)在分析討
4、論BP網(wǎng)絡(luò)基本原理和算法的基礎(chǔ)上,完成了源和目標(biāo)說(shuō)話人的基音周期的訓(xùn)練,通過(guò)訓(xùn)練網(wǎng)絡(luò)實(shí)現(xiàn)了源與目標(biāo)說(shuō)話人的基音周期的轉(zhuǎn)換,并仿真分析了源、目標(biāo)和轉(zhuǎn)換后的時(shí)域波形與語(yǔ)譜圖。
(5)完成了GMM和BP網(wǎng)絡(luò)兩種模型相結(jié)合后分別對(duì)說(shuō)話人語(yǔ)音的頻譜包絡(luò)LSF參數(shù)、頻譜包絡(luò)殘差和基音周期三種特征參數(shù)的訓(xùn)練和轉(zhuǎn)換,仿真分析了轉(zhuǎn)換前后的時(shí)域波形和語(yǔ)譜圖;并完成了基于GMM和BP網(wǎng)絡(luò)的語(yǔ)音轉(zhuǎn)換系統(tǒng)功能設(shè)計(jì)及系統(tǒng)實(shí)現(xiàn),采用客觀評(píng)價(jià)和主觀評(píng)價(jià)的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于MFCC和GMM語(yǔ)音轉(zhuǎn)換技術(shù)研究.pdf
- 基于VQ模型和BP網(wǎng)絡(luò)的高自然度語(yǔ)音轉(zhuǎn)換.pdf
- 語(yǔ)音轉(zhuǎn)換關(guān)鍵技術(shù)研究及基于AMR的語(yǔ)音轉(zhuǎn)換系統(tǒng)設(shè)計(jì).pdf
- 漢語(yǔ)語(yǔ)音轉(zhuǎn)換系統(tǒng)的研究.pdf
- 基于GMM和碼本映射相結(jié)合的語(yǔ)音轉(zhuǎn)換方法研究.pdf
- 特定目標(biāo)說(shuō)話人的語(yǔ)音轉(zhuǎn)換系統(tǒng)設(shè)計(jì).pdf
- 計(jì)算機(jī)語(yǔ)音轉(zhuǎn)換系統(tǒng)的研究.pdf
- 特定對(duì)象漢語(yǔ)語(yǔ)音轉(zhuǎn)換系統(tǒng)的研究.pdf
- 多參數(shù)驅(qū)動(dòng)的年齡語(yǔ)音轉(zhuǎn)換系統(tǒng).pdf
- 語(yǔ)音轉(zhuǎn)換系統(tǒng)中特征參數(shù)的研究.pdf
- 基于LPAC-PSOLA合成算法語(yǔ)音轉(zhuǎn)換系統(tǒng).pdf
- 基于VxWorks的網(wǎng)絡(luò)地址轉(zhuǎn)換系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于改進(jìn)的GMM和頻率彎折的高質(zhì)量語(yǔ)音轉(zhuǎn)換算法的研究.pdf
- 基于BP神經(jīng)網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)系統(tǒng)研究.pdf
- 方言轉(zhuǎn)換系統(tǒng)中的語(yǔ)音識(shí)別技術(shù)研究.pdf
- 基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)音轉(zhuǎn)換.pdf
- 語(yǔ)音特征提取及在音色轉(zhuǎn)換系統(tǒng)的應(yīng)用.pdf
- 基于FFMPEG的視頻轉(zhuǎn)換系統(tǒng).pdf
- 基于SWFTOOLS的文檔轉(zhuǎn)換系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于BP神經(jīng)網(wǎng)絡(luò)的低延遲矢量激勵(lì)語(yǔ)音編碼系統(tǒng).pdf
評(píng)論
0/150
提交評(píng)論