2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩123頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、近年來,光學(xué)樂譜識(shí)別逐漸受到國內(nèi)外學(xué)術(shù)界的關(guān)注。盡管在譜線檢測與刪除、樂譜分割、音樂符號(hào)分類等方面已取得一些進(jìn)展,但目前的樂譜識(shí)別效果還不夠理想,尤其是手寫樂譜的識(shí)別,其識(shí)別速度及準(zhǔn)確率仍有很大的提升空間。本文對手寫和印刷樂譜圖像的自動(dòng)識(shí)別進(jìn)行了系統(tǒng)的研究,在譜線檢測與刪除、音樂符號(hào)分類、音樂樂譜識(shí)別系統(tǒng)的建立等方面取得了一系列進(jìn)展,并提出了一些新的思路和方法。
  論文完成的主要工作如下:
  (1)提出了預(yù)選擇穩(wěn)定路徑譜

2、線檢測方法,通過計(jì)算連通分量,來將譜線組周邊大面積空白以及文字區(qū)域去除,使計(jì)算穩(wěn)定路徑的區(qū)域鎖定在譜線組范圍內(nèi),從而提升譜線檢測速度。該算法在保持了穩(wěn)定路徑方法抗噪聲能力強(qiáng)的這一原有優(yōu)勢的同時(shí),彌補(bǔ)了其運(yùn)行時(shí)間過長的不足。經(jīng)測試,該算法對彎曲、不連續(xù)、以及傾斜的譜線魯棒性很好,而且計(jì)算量降低三分之一甚至更多,有效解決了現(xiàn)有方法存在的抗噪性和計(jì)算時(shí)間長之間的矛盾。
  (2)根據(jù)音樂符號(hào)的多樣性和多態(tài)性特點(diǎn),提出了一種基于集成神經(jīng)網(wǎng)

3、絡(luò)的音樂符號(hào)分類方法。該方法將三個(gè)不同的多層感知模型組合,根據(jù)符號(hào)的不同形狀確定三個(gè)模型的輸入圖像大小,然后對得到的三個(gè)分類結(jié)果進(jìn)行投票,得出最終的類別,從而大大減小了分錯(cuò)的幾率。同時(shí),針對樂譜識(shí)別領(lǐng)域數(shù)據(jù)庫的欠缺狀態(tài),本文建立了一個(gè)標(biāo)準(zhǔn)的音樂符號(hào)分類數(shù)據(jù)庫,該數(shù)據(jù)庫包含了20類手寫符號(hào)和20類印刷符號(hào),對今后的音樂符號(hào)分類算法評(píng)估具有重要的意義。
  (3)提出一種基于有向無環(huán)圖——大間隔分布機(jī)的手寫音樂符號(hào)分類方法。該方法利用

4、有向無環(huán)圖結(jié)構(gòu)將現(xiàn)有的二類分類器大間隔分布機(jī)拓展到多類,建立了基于大間隔分布機(jī)的多分類模型。我們對N類音樂符號(hào)訓(xùn)練N(N-1)/2個(gè)分類器,N類音樂符號(hào)的順序依照其特征合理排序,從而防止了有向無環(huán)圖結(jié)構(gòu)的錯(cuò)誤累積效應(yīng)。實(shí)驗(yàn)表明用這種有向無環(huán)圖結(jié)構(gòu)解決多類分類問題的效率更高,速度更快,同時(shí),該算法在識(shí)別手寫音樂符號(hào)時(shí)效果優(yōu)于其他主流分類算法。
  (4)針對各類樣本數(shù)目相差比較大的情況,提出了不平衡大間隔分布機(jī)。該算法在最大化樣本分

5、布的均值和最小化其方差的同時(shí)添加了誤分懲罰系數(shù),使得分類面逐漸向多類樣本靠近,從而提高少類樣本的分類準(zhǔn)確率。不平衡大間隔分布機(jī)有效地解決了樂譜圖像中各類音樂符號(hào)樣本數(shù)量懸殊導(dǎo)致的分類效果低下的問題。實(shí)驗(yàn)表明,隨著懲罰的增大,少類樣本的分類準(zhǔn)確率顯著提高。
  (5)針對樂譜分割造成的符號(hào)漏檢率高的情況,提出了音樂符號(hào)分割和分類交替進(jìn)行的識(shí)別算法。將樂譜圖像交替地進(jìn)行分割與分類,并應(yīng)用滑動(dòng)窗對初次分割的殘缺符號(hào)或者高密度符號(hào)集合進(jìn)行

6、復(fù)原與多次分割,再通過提前訓(xùn)練的多個(gè)分類器來對音樂符號(hào)進(jìn)行分類,動(dòng)態(tài)找回因分割而殘缺的符號(hào),并將識(shí)別的所有符號(hào)保存。最后通過音符的類別與附點(diǎn)的個(gè)數(shù)確定音符的時(shí)長,通過計(jì)算符頭與譜線的相對位置確定音符的音高,最終得到重建的樂譜,并輸出為MIDI(Musical Instrument Digital Interface)文件。
  (6)最后,應(yīng)用MATLAB GUI開發(fā)了一個(gè)完整的光學(xué)樂譜識(shí)別系統(tǒng)。該系統(tǒng)結(jié)合音樂背景知識(shí),實(shí)現(xiàn)了樂譜

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論