版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、近年來,光學樂譜識別逐漸受到國內(nèi)外學術(shù)界的關(guān)注。盡管在譜線檢測與刪除、樂譜分割、音樂符號分類等方面已取得一些進展,但目前的樂譜識別效果還不夠理想,尤其是手寫樂譜的識別,其識別速度及準確率仍有很大的提升空間。本文對手寫和印刷樂譜圖像的自動識別進行了系統(tǒng)的研究,在譜線檢測與刪除、音樂符號分類、音樂樂譜識別系統(tǒng)的建立等方面取得了一系列進展,并提出了一些新的思路和方法。
論文完成的主要工作如下:
(1)提出了預選擇穩(wěn)定路徑譜
2、線檢測方法,通過計算連通分量,來將譜線組周邊大面積空白以及文字區(qū)域去除,使計算穩(wěn)定路徑的區(qū)域鎖定在譜線組范圍內(nèi),從而提升譜線檢測速度。該算法在保持了穩(wěn)定路徑方法抗噪聲能力強的這一原有優(yōu)勢的同時,彌補了其運行時間過長的不足。經(jīng)測試,該算法對彎曲、不連續(xù)、以及傾斜的譜線魯棒性很好,而且計算量降低三分之一甚至更多,有效解決了現(xiàn)有方法存在的抗噪性和計算時間長之間的矛盾。
(2)根據(jù)音樂符號的多樣性和多態(tài)性特點,提出了一種基于集成神經(jīng)網(wǎng)
3、絡的音樂符號分類方法。該方法將三個不同的多層感知模型組合,根據(jù)符號的不同形狀確定三個模型的輸入圖像大小,然后對得到的三個分類結(jié)果進行投票,得出最終的類別,從而大大減小了分錯的幾率。同時,針對樂譜識別領(lǐng)域數(shù)據(jù)庫的欠缺狀態(tài),本文建立了一個標準的音樂符號分類數(shù)據(jù)庫,該數(shù)據(jù)庫包含了20類手寫符號和20類印刷符號,對今后的音樂符號分類算法評估具有重要的意義。
(3)提出一種基于有向無環(huán)圖——大間隔分布機的手寫音樂符號分類方法。該方法利用
4、有向無環(huán)圖結(jié)構(gòu)將現(xiàn)有的二類分類器大間隔分布機拓展到多類,建立了基于大間隔分布機的多分類模型。我們對N類音樂符號訓練N(N-1)/2個分類器,N類音樂符號的順序依照其特征合理排序,從而防止了有向無環(huán)圖結(jié)構(gòu)的錯誤累積效應。實驗表明用這種有向無環(huán)圖結(jié)構(gòu)解決多類分類問題的效率更高,速度更快,同時,該算法在識別手寫音樂符號時效果優(yōu)于其他主流分類算法。
(4)針對各類樣本數(shù)目相差比較大的情況,提出了不平衡大間隔分布機。該算法在最大化樣本分
5、布的均值和最小化其方差的同時添加了誤分懲罰系數(shù),使得分類面逐漸向多類樣本靠近,從而提高少類樣本的分類準確率。不平衡大間隔分布機有效地解決了樂譜圖像中各類音樂符號樣本數(shù)量懸殊導致的分類效果低下的問題。實驗表明,隨著懲罰的增大,少類樣本的分類準確率顯著提高。
(5)針對樂譜分割造成的符號漏檢率高的情況,提出了音樂符號分割和分類交替進行的識別算法。將樂譜圖像交替地進行分割與分類,并應用滑動窗對初次分割的殘缺符號或者高密度符號集合進行
6、復原與多次分割,再通過提前訓練的多個分類器來對音樂符號進行分類,動態(tài)找回因分割而殘缺的符號,并將識別的所有符號保存。最后通過音符的類別與附點的個數(shù)確定音符的時長,通過計算符頭與譜線的相對位置確定音符的音高,最終得到重建的樂譜,并輸出為MIDI(Musical Instrument Digital Interface)文件。
(6)最后,應用MATLAB GUI開發(fā)了一個完整的光學樂譜識別系統(tǒng)。該系統(tǒng)結(jié)合音樂背景知識,實現(xiàn)了樂譜
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 手寫數(shù)字識別的gmm與最近鄰分類器系統(tǒng)比較模式識別論文
- 基于仿生模式識別的虹膜識別算法研究.pdf
- 票據(jù)中手寫數(shù)字識別的研究.pdf
- 基于SVM技術(shù)的手寫數(shù)字識別的研究.pdf
- 基于模式識別的流型判別.pdf
- 基于模式識別的癲癇腦網(wǎng)絡研究.pdf
- 基于仿生模式識別的非特定人連續(xù)語音識別的研究.pdf
- 基于數(shù)字圖象處理的物流信息模式識別的研究.pdf
- 模式識別的核方法研究.pdf
- 基于支持向量機的手寫數(shù)字識別的研究.pdf
- 基于支持向量機的手寫數(shù)字識別的研究(1)
- 基于模式識別的跌倒檢測儀研究.pdf
- 基于Spiking神經(jīng)網(wǎng)絡模式識別的研究.pdf
- 基于統(tǒng)計模式識別的發(fā)音錯誤檢測研究.pdf
- 基于模式識別的不良短信識別研究及應用.pdf
- 基于仿生模式識別的連續(xù)語音關(guān)鍵詞識別的研究.pdf
- 基于句法模式識別的雷達輻射源識別研究.pdf
- 基于模式識別的車牌字符識別研究與實現(xiàn).pdf
- 基于人工神經(jīng)網(wǎng)絡的手寫數(shù)字模式識別和分類.pdf
- 樂譜數(shù)字化的研究與實現(xiàn).pdf
評論
0/150
提交評論