2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩79頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、隨著信息技術(shù)和多媒體技術(shù)的發(fā)展,普通的音視頻素材已經(jīng)不能滿足人們生產(chǎn)活動(dòng)和娛樂生活的需求。應(yīng)運(yùn)而生的語音變調(diào)技術(shù),是在保持音頻文件播放速度不變的前提下,按照某種算法對說話人的音調(diào)進(jìn)行調(diào)整,從而實(shí)現(xiàn)音調(diào)的升高或降低,而語音音調(diào)的不同主要是由基音頻率和共振峰頻率來決定,因此音調(diào)的改變可以通過改變原始語音信號的基音頻率和共振峰頻率來實(shí)現(xiàn)。目前存在的語音變調(diào)方法都還不是很完善,還存在著各種各樣的缺點(diǎn)。
   語音合成技術(shù)是隨著人們對人機(jī)

2、交互提出要求而發(fā)展起來的一種語音信號處理技術(shù),是將計(jì)算機(jī)輸出的或人為輸入的一些非語音信息如文字、數(shù)字、標(biāo)點(diǎn)符號等轉(zhuǎn)換為清晰自然可懂的語音輸出,這種技術(shù)又稱為文語轉(zhuǎn)換技術(shù)(簡稱TTS)。較早的文語轉(zhuǎn)換系統(tǒng)在合成模塊一般采用參數(shù)合成法,其中共振峰合成法和LPC合成法應(yīng)用較多。對參數(shù)合成法的研究起步比較早,所以參數(shù)合成法已具有相對成熟的理論基礎(chǔ),而且實(shí)現(xiàn)起來較簡單,但實(shí)際合成的連續(xù)語音不自然,有明顯的機(jī)器腔。二十世紀(jì)九十年代初,基音同步疊加技

3、術(shù)的研究開始興起,并成功運(yùn)用到了TTS系統(tǒng)中。基音同步疊加(PSOLA)技術(shù)不同于簡單的波形拼接技術(shù),它在對語音基元拼接的時(shí)候,首先對音頻文件分析得到基音標(biāo)注,然后以基音周期為單位對拼接單元的基頻、音長和音強(qiáng)等韻律特征做出適合的調(diào)整,在不改變原始語音基元音質(zhì)的基礎(chǔ)上,靈活地改變語音的韻律特征。本文通過分析研究現(xiàn)有語音合成方法存在的優(yōu)缺點(diǎn),在PSOLA算法的基礎(chǔ)上,提出了一種時(shí)長和基頻分步處理的語音合成方法,并通過實(shí)驗(yàn)證實(shí)了其有效性。

4、r>   本文主要工作如下:
   1、對現(xiàn)有變調(diào)方法作了分類分析,主要分析了3種典型方法的變調(diào)原理和特點(diǎn),即時(shí)域同步疊加固定合成法(SOLA-FS)、頻域插值法和相位聲碼器法,并通過分析研究指出了它們的優(yōu)缺點(diǎn)。然后在SOLA-FS算法的基礎(chǔ)上,提出了一種改進(jìn)的基于SOLA-FS的變調(diào)方法,仿真實(shí)驗(yàn)發(fā)現(xiàn)該變調(diào)方法不僅能在保持音頻播放時(shí)間不變的前提下改變音調(diào),而且降低了算法復(fù)雜度,并在一定程度上減少了噪音,并給出了改進(jìn)前后運(yùn)行時(shí)

5、間的比較,以及改進(jìn)前后對應(yīng)的語譜圖。實(shí)驗(yàn)發(fā)現(xiàn)改進(jìn)的SOLA-FS方法在自然度上的優(yōu)勢明顯優(yōu)于其他變調(diào)方法,然后給出了三種不同變調(diào)算法下變調(diào)結(jié)果的主觀測聽對比。結(jié)果表明:不論對語音音調(diào)的升高還是降低,在相同變調(diào)系數(shù)下,改進(jìn)的SOLA-FS方法均具有最好的變調(diào)效果。
   2、將改進(jìn)的SOLA-FS變調(diào)方法與波形拼接技術(shù)相結(jié)合,提出了一種音高、時(shí)長分步處理的語音韻律拼接合成方法,既保持了語音拼接單元的清晰度和自然度,也在一定程度上提

6、高了合成語音的韻律修改能力。文中給出了在不同的音高調(diào)整參數(shù)下,傳統(tǒng)的TD-PSOLA方法與時(shí)頻分步合成法在基頻修改時(shí)所對應(yīng)的合成語音的時(shí)域圖和基頻軌跡圖,并在最后給出了算法復(fù)雜度的比較。實(shí)驗(yàn)證明,傳統(tǒng)的TD-PSLOA方法在音高修改時(shí),其合成語音對應(yīng)的基頻軌跡的包絡(luò)與語音樣本的基頻包絡(luò)有較大出入,尤其是當(dāng)基頻修改幅度較大時(shí),會(huì)造成疊加單元的混疊或遺漏,從而影響合成語音的效果。而時(shí)頻分步法在音高修改時(shí),其合成語音對應(yīng)的基頻包絡(luò)相對語音樣本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論