敦煌遺書綴殘中的相關(guān)殘片檢索技術(shù)研究及系統(tǒng)實現(xiàn).pdf_第1頁
已閱讀1頁,還剩100頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、敦煌遺書是指敦煌莫高窟中出土的一批具有重要研究價值的古代文籍?,F(xiàn)今敦煌遺書由于出土?xí)r代對文物不重視等各類原因,散布在世界各地,不便于學(xué)者們的研究工作。2012年開始的國家重點項目敦煌遺書數(shù)據(jù)庫的建設(shè),使學(xué)者們能夠更方便地在線對敦煌遺書進行研究。由于年代久遠(yuǎn),敦煌遺書中存在大量殘片殘卷,其中許多是可以綴合的。但由于遺書整體數(shù)量眾多,人工綴合費時費力。隨著數(shù)字化技術(shù)的發(fā)展,利用圖像檢索技術(shù)幫助進行敦煌遺書綴殘工作成為可能,這既是敦煌遺書相關(guān)

2、研究的基本需求,也是敦煌遺書數(shù)據(jù)庫項目的重要功能。在數(shù)字化敦煌遺書綴殘工作中,核心問題是相關(guān)殘片檢索,即可以綴合的殘片檢索,這也是本文的主要研究課題。
  本文的研究工作主要內(nèi)容如下:
  首先,針對遺書綴殘的需求,確定了遺書殘片的材質(zhì)、邊緣和字形三個主要特征,并提出了基于這三個特征組成的遺書殘片圖像特征模型。針對遺書殘片圖像顏色組成類別較為明確的特點,設(shè)計了篩選主次要顏色的方法,并利用主色調(diào)顏色直方圖的思想設(shè)計了材質(zhì)特征直

3、方圖表示材質(zhì)特征。針對遺書綴殘主要考慮殘片圖像左右邊緣匹配程度的特點,提出了基于Canny算法的遺書殘片左右邊緣提取算法,并利用左右邊緣點集表示邊緣特征。研究并綜合SURF算法和最大最小聚類算法,設(shè)計了字形特征提取算法,并利用每個字的特征點集表示字形特征。
  其次,研究了各個特征的差異度定義,并綜合提出了遺書殘片圖像差異度定義以及基于遺書殘片圖像差異度的相關(guān)殘片檢索算法。研究了利用EMD距離定義材質(zhì)差異度的方法。設(shè)計了統(tǒng)一圖像邊

4、緣基準(zhǔn)的方法,并利用統(tǒng)一基準(zhǔn)后的Hausdorff距離定義邊緣差異度。設(shè)計了建立字形方向向量直方圖的方法,然后利用EMD距離定義字形差異度。并在以上三者基礎(chǔ)上,提出了遺書殘片圖像的差異度定義,并提出了基于此差異度的相關(guān)殘片檢索算法。該算法輸入一個殘片圖像集合,然后先將所有圖像根據(jù)材質(zhì)特征聚類,然后分別計算聚類中所有圖像間綜合差異度,并根據(jù)朝代信息進行過濾,最后輸出殘片集合中每一張殘片的對應(yīng)匹配殘片。
  最后,針對國家重點項目敦煌

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論