2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、金融票據(jù)的自動識別是模式識別的重要應(yīng)用領(lǐng)域。幾乎涉及了模式識別與圖像處理的所有重要分支,是一個綜合的研究課題,具有理論和實用兩方面的價值。本文在收集和分析大量近年來國內(nèi)外文檔圖像處理方面的研究報告、學(xué)術(shù)論文的基礎(chǔ)上,對文檔圖像版面理解所涉及的若干問題進行了深入探討;著重對文檔圖像的傾斜校正、版面分析和版面識別進行了研究,并且完成了原型系統(tǒng)的實現(xiàn),經(jīng)測試,可以滿足要求。主要工作包括: 1.對文檔圖像的預(yù)處理進行了研究。文檔圖像輸入

2、時會產(chǎn)生一定的歪斜,文檔版面理解和OCR識別算法對文檔的傾斜非常敏感,文檔圖像的傾斜校正十分重要。針對種類繁多、版面復(fù)雜的文檔,本文對基于整數(shù)Bresenham算法求方向投影的傾斜檢測方法進行了研究,并與改進的Hough變換方法進行了比較,發(fā)現(xiàn)其具有很強的抗干擾性和應(yīng)用適應(yīng)性,可以自動進行傾斜調(diào)整并且具有較高的可變的精度。 2.對表格文檔圖像的版面結(jié)構(gòu)進行了分析。論文研究了完整的表格結(jié)構(gòu)表示方法,提出了基于表格線段交點為特征的文

3、檔類型識別算法。該算法由兩個步驟組成:首先是文檔圖像中表格線段的提取。目前,在圖像中提取線段的算法有很多,這些算法各有優(yōu)缺點。在分析這些算法優(yōu)缺點的基礎(chǔ)上,根據(jù)文檔圖像中線條的特點采用了一個基于線段支持區(qū)域的線段檢測算法。第二步,在表格線段檢測的基礎(chǔ)上,根據(jù)不同文檔有不同幾何和拓撲結(jié)構(gòu)這一原理,提出了一種以參數(shù)化表格交點為特征點的文檔類型匹配算法。 3.對表格文檔圖像的邏輯結(jié)構(gòu)進行了分析,論文提出了一種基于數(shù)據(jù)域與標(biāo)題域聯(lián)系的樹

4、形結(jié)構(gòu)表格全局邏輯結(jié)構(gòu)的表示方法,此方法可以很好地將表格的邏輯結(jié)構(gòu)與數(shù)據(jù)庫中表中的數(shù)據(jù)結(jié)構(gòu)對應(yīng)起來。并對一種關(guān)于表格文件邏輯結(jié)構(gòu)提取的方法進行了研究。此方法主要分為整表的全局劃分、局部的邏輯結(jié)構(gòu)分析、整表的再次全局劃分和將分析出的各個局部表區(qū)用樹形結(jié)構(gòu)表示,最后將整個表格用樹形結(jié)構(gòu)表示等幾個步驟。該方法強調(diào)對文件全局和局部布局結(jié)構(gòu)的綜合分析,與以往的僅僅從局部上對表格邏輯結(jié)構(gòu)進行確定的方法相比,它具有較高的識別正確率,并可以識別結(jié)構(gòu)更為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論