基于語音稀疏性的欠定信號盲分離研究.pdf_第1頁
已閱讀1頁,還剩69頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、在實(shí)際場景中,我們同他人或者機(jī)器之間的交流總會不可避免地受到其他說話人以及周圍噪聲的干擾,這使得我們同外界的交流更加困難。為了從被污染的信號中恢復(fù)我們想要的信號,盲分離技術(shù)被學(xué)者們提出來解決這個問題,這里“盲”的意思是混合過程以及源信號信息都是不可獲知的。語音盲分離作為盲分離的一種,在很多實(shí)際場景中起著重要的作用,其中包括穩(wěn)健自動語音識別的前端處理,場景分析,視頻會議,助聽器以及監(jiān)控。
  按照混合過程來分,語音盲分離可以分為不考

2、慮回聲的模型即線性瞬時混合模型和考慮回聲的模型即卷積模型。按照源信號個數(shù)和混合信號個數(shù)來分,可以分為超定即混合信號個數(shù)大于源信號個數(shù)、適定即兩者個數(shù)相等和欠定。超定情況比欠定情況獲得的信息更多,因此分離效果更好。但是實(shí)際中由于環(huán)境和設(shè)備的限制,源信號個數(shù)很可能大于混合信號個數(shù),因此對于欠定盲分離研究具有重要的意義。本文主要是針對欠定情況下的盲分離從兩個模型即欠定線性瞬時混合模型和欠定卷積模型分別討論和解決:
  1.針對欠定瞬時混

3、合模型,我們提出了一個基于壓縮感知(CompressedSensing,CS)的無監(jiān)督分離方法,這個想法的創(chuàng)新之處在于將字典自學(xué)習(xí)策略和CS恢復(fù)融合在一起。所提算法主要包括兩步:第一步我們利用一個穩(wěn)健的方法得到混合矩陣的比較精準(zhǔn)的估計;第二步為字典自學(xué)習(xí)過程,即用分離的信號去訓(xùn)練字典達(dá)到更新字典的目的,然后用更新的字典去估計新的分離信號,字典更新和源信號估計兩個過程交替進(jìn)行直至收斂。通過自適應(yīng)地更新字典,最終得到的字典接近于源信號的最優(yōu)

4、稀疏基,同時分離性能也在不斷提升。本文所提的字典自學(xué)習(xí)方法沒有用到源信號的先驗信息,因此它是一個無監(jiān)督的方法,具有著更廣泛的應(yīng)用。
  2.針對欠定卷積盲分離模型,我們研究了一個將分頻帶處理與基于去混響的后處理相結(jié)合的分離策略,主要包含三個步驟,即:第一步在子頻帶內(nèi)基于每個時頻點(diǎn)只有一個信號作用的假設(shè)通過聚類對混合矩陣進(jìn)行估計,然后對估計的混合矩陣進(jìn)行排列;第二步是假設(shè)源信號服從廣義拉普拉斯分布,在最大后驗概率框架下重建源信號;最

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論