2023年全國(guó)碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩122頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、語音活動(dòng)檢測(cè)是指在連續(xù)輸入的聲音信號(hào)中自動(dòng)地檢出語音存在時(shí)段的一種檢測(cè)技術(shù)。它是語音信號(hào)處理的一個(gè)重要環(huán)節(jié),在語音處理的多個(gè)研究領(lǐng)域中有著廣泛的應(yīng)用。近年來,隨著各種現(xiàn)實(shí)應(yīng)用服務(wù)對(duì)語音處理技術(shù)的需求日益增加,對(duì)新環(huán)境下的語音活動(dòng)檢測(cè)技術(shù)也提出新的挑戰(zhàn),這主要表現(xiàn)為非平穩(wěn)低信噪比環(huán)境下的魯棒語音活動(dòng)檢測(cè)問題,它是語音處理中的一個(gè)重要的亟待解決的熱點(diǎn)問題。近十余年來,雖然研究者們對(duì)此問題提出了許多檢測(cè)方法,并取得了長(zhǎng)足進(jìn)步,但當(dāng)前所取得的成

2、果與實(shí)際的系統(tǒng)需求還有較大的距離。
  語音活動(dòng)檢測(cè),從處理問題的應(yīng)用環(huán)境上可分為噪聲類型已知且不變的限定環(huán)境,以及噪聲類型未知且變化的開放環(huán)境下的檢測(cè)方法。本文分別從檢測(cè)方法是否需要快速響應(yīng)兩個(gè)角度,對(duì)限定環(huán)境和開放環(huán)境下的語音活動(dòng)檢測(cè)進(jìn)行了研究,提出了一系列解決方法。論文的主要?jiǎng)?chuàng)新工作包括:
  (1)提出了以信號(hào)稀疏表示為魯棒特征的語音活動(dòng)檢測(cè)方法。在噪聲類型不變的限定環(huán)境下,語音與環(huán)境噪聲在信號(hào)結(jié)構(gòu)上有著明顯的區(qū)別,

3、可用做語音∕非語音的鑒別特征。然而,在低信噪比環(huán)境下傳統(tǒng)的基于正交分解提取信號(hào)結(jié)構(gòu)信息的方法容易受噪聲干擾,從而使特征失去魯棒性。針對(duì)這一問題,本文提出使用基于原子字典稀疏分解的方法來獲取信號(hào)的結(jié)構(gòu)信息,將分解得到的信號(hào)稀疏表示作為語音∕非語音的鑒別特征用于語音活動(dòng)檢測(cè)。依據(jù)構(gòu)造字典所使用的先驗(yàn)知識(shí)的不同,將原子字典分為預(yù)構(gòu)建字典和學(xué)習(xí)字典,文中討論了在語音檢測(cè)問題中兩種字典的構(gòu)造方法,并分別提出了基于預(yù)構(gòu)建字典和學(xué)習(xí)字典下信號(hào)稀疏表示

4、的檢測(cè)方法。此外,本文還基于分層Bayesian模型從理論上論證了將稀疏表示作為特征應(yīng)用于信號(hào)檢測(cè)問題的合理性。實(shí)驗(yàn)表明,在低信噪比噪聲環(huán)境下信號(hào)的稀疏表示相比于傳統(tǒng)的離散傅立葉變換(discrete Fourier transform,DFT)系數(shù)具有更好的魯棒性,在語音活動(dòng)檢測(cè)中取得了更好的檢測(cè)性能。
  (2)提出了基于信噪角特征的語音活動(dòng)檢測(cè)方法。針對(duì)噪聲類型未知且變化的開放噪聲環(huán)境,基于噪聲最小統(tǒng)計(jì)量追蹤提出了一種具有相

5、對(duì)穩(wěn)定性質(zhì)的信噪角特征用于語音活動(dòng)檢測(cè)。信噪角特征能夠快速適應(yīng)噪聲類型的變化,在不同類型的噪聲環(huán)境下具有相近的尾分布,這一性質(zhì)使得信噪角特征能夠適合開放環(huán)境下語音活動(dòng)檢測(cè)的需要,并可采用基于統(tǒng)計(jì)模型的方法進(jìn)行決策。針對(duì)有經(jīng)驗(yàn)數(shù)據(jù)的情況,本文還提出了兩種基于可區(qū)分訓(xùn)練加權(quán)的檢測(cè)方法,其中加權(quán)值通過經(jīng)驗(yàn)數(shù)據(jù)學(xué)習(xí)得到。實(shí)驗(yàn)表明,所提出的信噪角特征和檢測(cè)方法能夠有效地適應(yīng)開放環(huán)境下的語音活動(dòng)檢測(cè)任務(wù),并取得了較好的檢測(cè)性能。此外,實(shí)驗(yàn)結(jié)果還表明

6、:在有經(jīng)驗(yàn)數(shù)據(jù)的情況下,加權(quán)后的檢測(cè)方法可以明顯地提高檢測(cè)性能。
  (3)提出了基于二層決策的多幀似然比檢測(cè)方法。語音活動(dòng)在連續(xù)的語音幀中存在著較強(qiáng)的相關(guān)性,本文將這種幀間相關(guān)性以隱馬爾可夫模型(hidden Markov model,HMM)建模,提出了基于HMM修正最大后驗(yàn)概率(maximum a posteriori,MAP)準(zhǔn)則的決策方法來對(duì)單幀語音進(jìn)行檢測(cè)。針對(duì)多語音幀檢測(cè)問題,以單幀語音檢測(cè)的似然比為研究對(duì)象,提出了

7、符號(hào)似然比檢測(cè)方法,并分析了檢測(cè)性能。結(jié)合上述所提出的單幀與多幀檢測(cè)方法,給出了二層決策的多幀似然比檢測(cè)方法。實(shí)驗(yàn)表明,相比于傳統(tǒng)的統(tǒng)計(jì)模型方法,本文所提出的方法都取得了更好的檢測(cè)結(jié)果。
  (4)提出了基于核方法與Chernoff不等式的非參數(shù)語音活動(dòng)檢測(cè)方法。開放環(huán)境下噪聲的類型未知且變化,很難使用先驗(yàn)知識(shí)來選擇統(tǒng)計(jì)模型進(jìn)行決策。本文提出的非參數(shù)的檢測(cè)方法只使用信號(hào)的局部數(shù)據(jù),在再生核Hilbert空間中估計(jì)語音活動(dòng)出現(xiàn)的后驗(yàn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論