版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、XIMERA中的漢語語音合成技術(shù)倪 晉富 坂井 信輔 中村 哲 (NICT/ATR-SLC)(2008/03/22),日本中國語學(xué)會(huì)關(guān)東支部擴(kuò)大會(huì)議?中央大學(xué),發(fā)表概要,語音合成系統(tǒng)概述 演示 相關(guān)工作,語調(diào)轉(zhuǎn)換 韻律再合成 強(qiáng)化虛詞處理,語音合成系統(tǒng)略圖,源濾波器型合成器,波形拼接型合成器,注:語音合成系統(tǒng)合成語音,但現(xiàn)在的合成系統(tǒng)并不具有文本理解能力。,,,分詞、詞性標(biāo)記及發(fā)音生成,,詞典,語言模型,文本規(guī)
2、范化,,口語規(guī)則,,,口語規(guī)則,,,語音參數(shù)預(yù)測(cè),,聲學(xué)模型,,單元選擇及波形拼接,,語音數(shù)據(jù)庫,,輸入文本,輸出合成語音,,,,說什么,,,,怎么說,房價(jià)是$150。,房價(jià)是一百五十美元。,房價(jià) 是 一百五十 美元 。 名詞 動(dòng)詞 數(shù)詞 名詞 符號(hào) fang2jia4 shi4 yi1bai2wu3shi2mei3yuan2,1 句子基頻曲線2 音素時(shí)長參數(shù)3 能量參數(shù)4 譜參數(shù),XIMERA漢語語
3、音合成概述,韻律詞及短語預(yù)測(cè),文本規(guī)范化,符號(hào),數(shù)詞,詞典構(gòu)成,,(290,624條漢語詞及符號(hào)),語言模型,分詞及詞性標(biāo)記評(píng)價(jià),分析軟件:和布蕪 訓(xùn)練語料庫:人工檢查過詞邊界及詞性標(biāo)記訓(xùn)練集大?。汉?,406,780詞的句子測(cè)試集(訓(xùn)練集外)大?。汉?,396,950詞的句子,Mecab (http://mecab.sourceforge.net),長 【名詞】 chang2 長 1米長 【動(dòng)詞】 zhang3 長
4、 1米藏 【名詞】 zang4 藏 族藏 【動(dòng)詞】 cang2 藏 東西地 【名詞】 di4 種 地 地 【助詞】 de0 慢慢 地好 【形容詞】 hao3 好 吃好 【副詞】 hao4 好 吃圈 【名詞】 juan4 羊 圈圈 【動(dòng)詞】 quan1 圈 東西…,調(diào) 【動(dòng)詞】 tiao3 調(diào) 音量 調(diào) 【動(dòng)詞】 diao4 調(diào) 文件系 【動(dòng)詞】 ji4
5、 系 鞋帶系 【動(dòng)詞】 xi4 系 哺育類…,拼音轉(zhuǎn)換評(píng)價(jià),測(cè)試集:約15000句(229,332音節(jié)),人工檢查過拼音有調(diào)音節(jié)正確率:97.0%無調(diào)音節(jié)正確率:99.2%,典型錯(cuò)誤分析:,詞性錯(cuò)誤,模糊性,韻律參數(shù)預(yù)測(cè),平價(jià)商店選購。,語言特征,聲學(xué)特征,聲學(xué)模型,,HMM模型訓(xùn)練,,(約1.5小時(shí)語音),,1 句子基頻曲線2 音素時(shí)長參數(shù)3 能量參數(shù)4 譜參數(shù),基頻,,句子基頻曲線、音節(jié)位置時(shí)長、能量參數(shù)、譜
6、參數(shù),音節(jié),聲調(diào),前音節(jié)聲調(diào),后音節(jié)聲調(diào)該音節(jié)所在詞的詞性,詞長,在短語中前、后位置(音節(jié)數(shù))該音節(jié)所在短語長,短語在句中前后序號(hào),前位置(音節(jié)數(shù)),實(shí)驗(yàn)材料: 8874句(8.3小時(shí)語音) 考察標(biāo)點(diǎn) 、,:;???。 破折號(hào)及省略號(hào) 100ms以上的停頓:7093個(gè) 300ms以上的停頓:3610個(gè),實(shí)驗(yàn)結(jié)果及觀察: 99%的逗號(hào)處伴隨有100ms以上的停頓 ? 標(biāo)點(diǎn)是重要的停頓標(biāo)志 57.4%的停頓(100ms以
7、上)非與標(biāo)點(diǎn)相連 ? 僅標(biāo)點(diǎn)處停頓顯然是不足夠的 86%的韻律短語長為3至9個(gè)音節(jié),韻律短語預(yù)測(cè),韻律和句法結(jié)構(gòu)的交叉依賴性,實(shí)驗(yàn)材料: 1091句(3小時(shí)語音) 句子選自PENN Treebank n交叉:n個(gè)句法分枝橫切一韻 律短語; 0交叉表示韻律短語是 一句法短語的子串,觀察: 大約有26.7%的停頓(短語內(nèi)含1-5交叉)是不能由句法結(jié)構(gòu)來預(yù)測(cè)。,實(shí)驗(yàn)結(jié)果:,語音數(shù)據(jù)庫,,合成樣本演示,您好,下面是幾例有關(guān)旅行
8、會(huì)話和新聞方面的漢語語音合成樣本.,您是用現(xiàn)金還是用信用卡付款?,請(qǐng)告訴我您的姓名和房間號(hào)。,美國民主黨總統(tǒng)參選人奧巴馬 先后贏得威斯康辛州和夏威夷州初選,挫敗對(duì)手希拉里,這是他自“超級(jí)星期二”以來取得的連續(xù)第10場(chǎng)勝利。共和黨方面,麥凱恩再次壓倒對(duì)手赫卡比,進(jìn)一步鎖定他在共和黨總統(tǒng)參選人提名戰(zhàn)中的勝局。,(倫敦/紐約綜合訊) 國際油價(jià)星期二在紐約隔夜市場(chǎng)大幅飆升,收盤價(jià)首度突破100美元,盤中一度觸及每桶100.10美元的歷史新高。,
9、,陳述-疑問語調(diào)相互轉(zhuǎn)換(分析合成例子),過路客照相,紅鼻頭沒權(quán),陳述句 ? 疑問句,陳述句 ? 疑問句,都快八點(diǎn)了。,都快八點(diǎn)了。,都快八點(diǎn)了。,韻律再合成,,,語音波形,基頻波形,,語音波形,基頻波形,我想 起來了,我 想起來了,【趨向動(dòng)詞】,【一般動(dòng)詞】,需要強(qiáng)化虛詞處理,,,起來,與動(dòng)詞相關(guān)聯(lián)的例子:【了著過】安排了/過 /著 三次報(bào)告會(huì)【動(dòng)介】安排給 /在 南方【重疊】安排安排 生活【結(jié)果】安排得著/ 不著/
10、成/ 不成/ 好/ 不好/ 得上/不上/下/不下 生活【趨向】安排上來/上去/下來/下去/進(jìn)來/進(jìn)去/出來/進(jìn)去 幾個(gè)客人【趨向】安排幾個(gè)客人 上來/上去/下來/下去/進(jìn)來/進(jìn)去/出來/進(jìn)去【趨向】安排上/下 / 進(jìn)/出 幾個(gè)客人來 /去【趨向】安排得過來 /不過來 /得開 /不開 /起來 球賽【趨向】安排起 球賽 來 了【趨向】安排到 計(jì)劃里 去 / 來,從韻律特征上看,虛詞和實(shí)詞存在一定區(qū)別;從會(huì)話角度看,處理好虛詞更
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 韻律對(duì)英漢短語句法結(jié)構(gòu)的制約.pdf
- 漢語韻律句法學(xué)
- 韻律和句法的互動(dòng)關(guān)系.pdf
- 英漢名詞短語、動(dòng)詞短語韻律結(jié)構(gòu)的對(duì)比研究.pdf
- 基于主動(dòng)學(xué)習(xí)的漢語韻律短語預(yù)測(cè)研究.pdf
- 英漢介詞短語韻律結(jié)構(gòu)對(duì)比研究.pdf
- 基于句法特征的漢語韻律邊界預(yù)測(cè)的研究.pdf
- 基于半監(jiān)督學(xué)習(xí)的漢語韻律短語預(yù)測(cè)研究.pdf
- 語音合成中韻律結(jié)構(gòu)預(yù)測(cè)改進(jìn)——深度學(xué)習(xí)在韻律預(yù)測(cè)模塊中的應(yīng)用研究.pdf
- 基于語法信息的漢語韻律結(jié)構(gòu)預(yù)測(cè).pdf
- 基于統(tǒng)計(jì)模型的韻律結(jié)構(gòu)預(yù)測(cè)研究.pdf
- 基于AMEMM的漢語韻律短語預(yù)測(cè)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 漢語韻律結(jié)構(gòu)預(yù)測(cè)模型的研究與實(shí)現(xiàn).pdf
- 采用無標(biāo)注語料及詞“粘連”剔除策略的韻律短語預(yù)測(cè).pdf
- 漢語動(dòng)趨式的韻律句法分析.pdf
- 基于深度神經(jīng)網(wǎng)絡(luò)的韻律結(jié)構(gòu)預(yù)測(cè)研究.pdf
- 基于語塊的漢語韻律短語邊界識(shí)別研究.pdf
- 基于條件隨機(jī)場(chǎng)模型的半監(jiān)督漢語韻律短語預(yù)測(cè)的研究與實(shí)現(xiàn).pdf
- 蒙古語的韻律預(yù)測(cè)方法研究.pdf
- 中文語音合成系統(tǒng)中的文本正則化和韻律結(jié)構(gòu)預(yù)測(cè)方法的研究.pdf
評(píng)論
0/150
提交評(píng)論