基于音頻內(nèi)容的多媒體文件相似性快速比對研究.pdf_第1頁
已閱讀1頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、當前,網(wǎng)絡和多媒體技術(shù)迅猛發(fā)展,多媒體信息急劇增長,網(wǎng)絡多媒體數(shù)據(jù)中數(shù)據(jù)重復現(xiàn)象很常見,尤其是一些大型多媒體分享網(wǎng)站中,用戶上傳了大量重復的多媒體數(shù)據(jù)。重復數(shù)據(jù)不僅增加了數(shù)據(jù)庫存儲和管理代價,也嚴重影響網(wǎng)站訪問者的用戶體驗。因此,多媒體數(shù)據(jù)的重復檢測顯得尤為重要。本文圍繞多媒體數(shù)據(jù)庫重復檢測問題展開研究,在分析現(xiàn)有技術(shù)的基礎之上,提出了利用直方圖、GMM和K-L散度的兩級重復檢測方案,設計了多媒體數(shù)據(jù)庫重復檢測系統(tǒng)。圍繞以上問題,本文主

2、要完成了以下工作:
  首先,提出了基于直方圖的文件快速匹配方法,以文件為單位進行相似度比對,在很大程度上提高了重復檢測的速度。由于直方圖忽略了文件的時序信息,并考慮長度差異大的文件,容易誤識,影響檢測效果。因此,借鑒分段檢索的思想,將較長的多媒體文件分成若干段,每段建立一個直方圖模型,形成直方圖序列。通過計算直方圖序列間的總體相似度,判斷文件是否相似。實驗結(jié)果表明,通過直方圖方法可以提高重復檢測的速度。
  其次,直方圖方

3、法雖然提高了重復檢測的速度,但是犧牲了檢測精度。針對直方圖方法檢索結(jié)果不精確的缺點,提出了基于GMM和K-L散度的相似性比對方法,用于文件的相似性確認。實驗結(jié)果證明,該方法能夠有效提高結(jié)果的正確率。
  最后,介紹基于直方圖、GMM和K-L散度的二級檢索機制的多媒體數(shù)據(jù)庫重復檢測系統(tǒng)的設計與實現(xiàn)。本系統(tǒng)主要作為大規(guī)模數(shù)據(jù)庫管理的一種數(shù)據(jù)重復檢測手段,以便將重復的多媒體文件檢測出來,便于數(shù)據(jù)庫管理者根據(jù)需要對重復數(shù)據(jù)進行管理。本系統(tǒng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論