混合聲音信號辨別的并行化方法的研究與實現(xiàn).pdf_第1頁
已閱讀1頁,還剩78頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、人們聽到的聲音往往都是由多個聲音混合而成的,如何從混合的聲音信號中快速而準(zhǔn)確的分辨出感興趣的聲音信號,一直是研究的熱點。傳統(tǒng)的方法可以進行簡單的聲源辨別,但是當(dāng)涉及到大數(shù)據(jù)量的聲音信號處理時,影響了其應(yīng)用的實時性和準(zhǔn)確性。隨著人工智能時代的到來,以深度學(xué)習(xí)和GPU并行計算為代表的新技術(shù)為大數(shù)據(jù)量的聲音信號處理提供了解決思路,為此本文設(shè)計了混合聲音信號辨別的并行化方法,并開展了以下工作:
  1.分析了國內(nèi)外混合聲音信號的研究現(xiàn)狀以

2、及發(fā)展趨勢,以混合聲音信號為切入點,學(xué)習(xí)了混合聲音信號辨別和GPU并行計算的相關(guān)知識,并研究了混合聲音信號分離以及聲源辨別的常用方法。
  2.對混合聲音信號進行去均值和白化等預(yù)處理,選取基于負熵的Fast-ICA算法進行混合聲音信號分離,通過分析混合聲音信號分離過程尋找制約其快速分離的原因,并利用GPU并行化進行加速改進。
  3.對分離后的聲音信號進行多特征值提取,并將提取出的特征值進行融合組成復(fù)合特征值,再進行聲源辨別

3、。在辨別過程中,由于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)存在學(xué)習(xí)能力不足的問題,針對這個缺陷,引入了基于深度信念網(wǎng)絡(luò)(DBN)的聲源辨別模型,以提升混合聲音信號辨別的準(zhǔn)確率。
  4.由于要進行大數(shù)據(jù)量的聲音信號處理,并且聲音信號在處理過程中同時又具有方法一致、獨立性強的特點,于是采用GPU并行化方法分別對基于負熵的Fast ICA算法、特征值提取和深度信念網(wǎng)絡(luò)模型的訓(xùn)練過程等操作進行優(yōu)化,提高了混合聲音信號辨別方法的處理效率。
  通過仿真和實驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論