版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、文檔圖像檢索是圖像檢索的重要方面,在數(shù)字圖書館、辦公自動化等方面具有廣泛應(yīng)用。文檔圖像檢索的最終目標(biāo)是從文檔圖像數(shù)據(jù)庫中獲得與輸入圖像或特征具有高相似度的一組圖像序列。常見的文檔圖像檢索算法可以歸為基于文檔字符內(nèi)容的檢索和基于圖像特征的檢索兩大類。在基于特征的文檔圖像檢索中,文檔圖像匹配技術(shù)是核心技術(shù),它主要是從文檔數(shù)據(jù)庫中給出輸入圖像的最佳匹配。匹配技術(shù)是建立在特征定義及其提取基礎(chǔ)之上的。 本文在分析現(xiàn)有基于特征的文檔圖像檢索
2、方法優(yōu)缺點(diǎn)的基礎(chǔ)上,沿用基于圖像特征的文檔圖像檢索的基本思路,并借鑒基于內(nèi)容的圖像檢索中基于圖像子塊的方法給出一種新的文檔圖像檢索方法。首先對圖像進(jìn)行預(yù)處理,包括去噪處理和傾斜檢測。去噪采用濾波模版簡單有效,去噪后提取SIFT特征。作為傾斜檢測第一步的二值化使用結(jié)合全局和局部的文檔圖像二值化方法,然后提取文檔圖像的邊界線進(jìn)行傾斜檢測,并且引入的LMS自適應(yīng)算法能使其具有更好的智能性。同時,在傾斜檢測中提取的邊界線特征可以作為文檔的特征用
3、于后續(xù)檢索。之后再對整個文檔圖像定位有效區(qū)域,定義和提取有效區(qū)域的長度、寬度、密度特征;然后利用基于ISI學(xué)習(xí)算法的方法,通過對分割樣例的學(xué)習(xí),將有效區(qū)域分割成文字區(qū)域和非文字區(qū)域。對文字區(qū)域提取連通體對之間的距離(字間空白)、連通體高度、寬度等局部特征以及連通體的個數(shù)、空穴個數(shù)、平均空白、平均連通體高度、平均連通體寬度、段落特征等全局特征;對非文字區(qū)域提取關(guān)鍵塊特征。這些特征中SHIF特征具有對伸縮、平移、扭曲的不變性,是一種對文檔圖
4、像畸變具有高魯棒性的特征。文字區(qū)域特征是較低層次的特征,能較好的區(qū)分文檔圖像。密度特征和關(guān)鍵塊特征已經(jīng)被證明具有良好的區(qū)分度。所以提取的特征既包含了全局特征也包含了局部特征,既包括高層次特征也包含低層次特征。因此,它們的組合能充分表征文檔圖像。將這些特征按照性質(zhì)和特征向量維數(shù)分成三個組。然后本文引入已經(jīng)證明對維數(shù)較高的數(shù)據(jù)仍然具有很好檢索效果的A—Tree來組織這些數(shù)據(jù),對三個組分別建立高維索引A—Tree。分別查詢這三個A—Tree得
5、到三個圖像集合,取并集得到候選圖像集合,然后根據(jù)候選圖像的集合權(quán)值更新,給出最終結(jié)果。 本文的方法對手寫體文檔圖像、印刷體文檔圖像和兩者混合的文檔圖像均適用。 最后,在包含主要為文字的3900張文檔圖像的數(shù)據(jù)庫Ⅰ和包含文字、圖片、表格混合的2124張圖像的數(shù)據(jù)庫Ⅱ上分別進(jìn)行實(shí)驗(yàn)測試了各特征的適用性。然后在總數(shù)據(jù)庫上對基于綜合特征的檢索進(jìn)行了測試,并與已有算法做了對比。實(shí)驗(yàn)表明:本文的方法具有普適性和較高的效率,具有較強(qiáng)的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 文檔圖像特征提取和檢索.pdf
- 基于特征的文檔圖像檢索技術(shù)研究與應(yīng)用.pdf
- 基于顏色特征的圖像檢索
- 基于圖像內(nèi)容的文檔檢索方法研究.pdf
- 基于形狀特征的圖像檢索.pdf
- 基于特征水印的圖像檢索.pdf
- 基于底層特征的圖像檢索.pdf
- 基于不變特征的圖像檢索.pdf
- 基于形狀特征的圖像檢索研究.pdf
- 基于彩色基元特征的圖像檢索.pdf
- 基于顏色特征的圖像檢索模型.pdf
- 基于紋理特征的醫(yī)學(xué)圖像檢索.pdf
- 基于版面分析的文檔圖像檢索算法研究.pdf
- 基于特征融合的醫(yī)學(xué)圖像檢索.pdf
- 基于區(qū)域綜合特征的圖像檢索.pdf
- 基于局部特征的圖像檢索研究.pdf
- 基于紋理特征的圖像檢索技術(shù).pdf
- 基于語義特征的圖像檢索研究.pdf
- 基于紋理特征的圖像檢索.doc
- 基于融合顏色特征與形狀特征的圖像檢索.pdf
評論
0/150
提交評論