2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩68頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、近年來,多語種語音信息處理成為了智能語音信息處理中的重要研究方向。其中,由于跨語言的語音合成能夠利用同一個語音合成系統(tǒng)合成出不同語言的語音,成為了目前的研究熱點。中國是一個少數(shù)民族語言和方言眾多的國家,跨語言語音合成技術(shù)的研究對促進方言和民族語言語音技術(shù)的發(fā)展有著重要的意義。但是,目前國內(nèi)外的研究中,并沒有一個完整的普通話/民族語言或普通話/方言的多語種語音合成系統(tǒng)。本文選取了漢語普通話和藏語拉薩方言作為研究對象,研究了兩種語言在發(fā)音上

2、的特點及共性,設計了普通話和藏語通用的標音方案、語音基元的語境信息標注格式以及對聲學模型進行決策樹聚類的問題集。在此基礎上,利用一個多說話人的普通話語料庫和一個單說話人的藏語拉薩方言語料庫,將說話人自適應訓練引入基于隱Markov模型(Hidden Markov Model,HMM)的語音合成方法中,訓練獲得了一個混合語言的平均音模型;之后,再利用待合成藏語或漢語的少量訓練語句,采用說話人自適應變換算法獲得藏語或者普通話的說話人相關(guān)模型

3、,最終合成出藏語或漢語語音,實現(xiàn)了漢藏雙語跨語言語音合成系統(tǒng)。論文的主要工作和創(chuàng)新如下:
  1.設計了一套面向統(tǒng)計參數(shù)語音合成的藏漢雙語的機讀音標方案。從聲母、韻母和聲調(diào)等方面對藏語和漢語的發(fā)音特點做了對比研究,找出了兩者在發(fā)音上的共性,利用國際通用的機讀音標,設計了一套漢藏雙語的機讀音標,實現(xiàn)了文本到字音的轉(zhuǎn)換。
  2.設計了一套面向統(tǒng)計參數(shù)語音合成的漢藏雙語的上下文相關(guān)的標注格式。標注格式包括聲韻母層、音節(jié)層、詞層、

4、韻律詞層、韻律短語層和語句層6層,用來標注藏語或者漢語語句中的每個聲韻母的語境信息。同時,設計了涵蓋兩種語言語音特色的決策樹問題集,用于聲學模型的訓練過程中對模型的聚類。
  3.提出了一種利用說話人自適應訓練實現(xiàn)漢藏雙語跨語言語音合成的方法。利用一個多說話人的普通話語料和一個單說話人的藏語語料,在HMM模型的訓練中引入說話人自適應訓練,得到一個語言無關(guān)的平均音模型;然后采用1個藏語說話人的訓練語料或者1個普通話說話人的訓練語料,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論