基于聽覺機理的音頻指紋算法研究與實現(xiàn).pdf_第1頁
已閱讀1頁,還剩63頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著大數(shù)據(jù)時代的到來,互聯(lián)網(wǎng)上的信息量呈爆炸式增長。傳統(tǒng)的基于文本標注的檢索已經(jīng)不能滿足人們對多媒體檢索的需求?;诙嗝襟w文件自身內容信息的檢索已經(jīng)成為今年來的研究熱點。在基于內容的多媒體檢索中,樣例檢索(Query-By-Example)具有使用方便、不需要標注信息、對用戶要求低等特點。以音頻為例,人們可以通過提交一小段未知錄音來搜索數(shù)據(jù)庫從而獲取該段錄音相關信息。音頻指紋檢索是樣例檢索的一種重要形式,它具有體積小、檢索速度快等優(yōu)點。

2、本文針對音頻指紋算法存在的一些關鍵問題進行研究,主要研究工作如下:
  首先,針對短查詢指紋搜索檢出率低的問題,采用基于聽覺機理的音頻指紋生成方法。在計算音頻指紋時的峰值點選取過程中,充分利用人耳聽覺的掩蔽效應,以峰值點能量為基準,生成掩蔽閾值曲線,并將其用于后續(xù)峰值點的選取,在選出新的峰值點的同時,采用疊加的方式更新該閾值曲線,從而將不易被人耳感知的峰值點濾除。本文采用掩蔽效應構建動態(tài)閾值曲線,從而選取出更具魯棒性的頻譜峰值點,

3、以這些峰值點為基礎生成的音頻指紋將具有更好的魯棒性,更有利于提高音頻指紋檢索的檢出率。實驗結果表明,該方法能明顯提高檢出率。
  其次,本文針對音頻指紋算法參數(shù)的數(shù)量多、數(shù)值范圍大,以及難以通過人工選擇的方式尋找最優(yōu)參數(shù)組合的問題,鑒于群智能方法能夠在高維空間中快速搜索到最優(yōu)解的特點,使用粒子群算法(Particle Swarm Optimization,PSO)、遺傳算法(Genetic Algorithm,GA)進行參數(shù)尋優(yōu),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論