基于BP神經(jīng)網(wǎng)絡(luò)的印刷字符識(shí)別系統(tǒng).pdf_第1頁(yè)
已閱讀1頁(yè),還剩67頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、光學(xué)字符識(shí)別(OCR)是人類(lèi)的一項(xiàng)瑣碎任務(wù),但要建立一個(gè)計(jì)算機(jī)程序進(jìn)行字符識(shí)別是很困難的。識(shí)別這些模式僅僅是這些瑣碎任務(wù)中的一件,人能很好的做到但計(jì)算機(jī)不能,主要因?yàn)槭菍?shí)際應(yīng)用中有許多可變因素。例如,由隨機(jī)變化的模式組成的噪聲,特別是靠近邊緣處,并且有許多噪音的字符很可能被計(jì)算機(jī)程序解釋成一個(gè)完全不同的字符。另一個(gè)混亂的來(lái)源是高水平的抽象化;必須認(rèn)識(shí)到有成千上萬(wàn)風(fēng)格的常用類(lèi)型和字符,其中大部分對(duì)識(shí)別程序是沒(méi)有用的。這些因素以及其他因?yàn)槭?/p>

2、得這個(gè)領(lǐng)域非常有趣和有挑戰(zhàn)性,這就是為什么選擇這方面作為論文的研究來(lái)源。還應(yīng)該提到的是:在過(guò)去幾十年里,光學(xué)字符識(shí)別已成為許多研究者的研究目標(biāo),是因?yàn)樗谠S多不同的行業(yè),如銀行業(yè),航運(yùn),商業(yè),通信,市場(chǎng)營(yíng)銷(xiāo),車(chē)牌識(shí)別等有重要影響。由于這一領(lǐng)域的重要性和美好未來(lái),人們對(duì)這一領(lǐng)域的研究興趣非常濃厚。
   光學(xué)字符識(shí)別在大約1929年開(kāi)始并由古斯塔夫陶舍所做。光學(xué)字符識(shí)別,通??s寫(xiě)為OCR,是圖像的機(jī)械或電子轉(zhuǎn)換成機(jī)器可編輯的文本。

3、雖然,在這一領(lǐng)域的學(xué)術(shù)研究仍在繼續(xù),對(duì)光學(xué)字符識(shí)別的重點(diǎn)已轉(zhuǎn)移到技術(shù)證明。用光學(xué)技術(shù),例如光學(xué)反射鏡和透鏡技術(shù)的光學(xué)字符識(shí)別,用掃描儀和計(jì)算機(jī)算法的數(shù)字字符識(shí)別,起初都被認(rèn)為是單獨(dú)的領(lǐng)域,現(xiàn)已擴(kuò)大到包括數(shù)字圖像處理領(lǐng)域中。
   商業(yè)上,光學(xué)字符閱讀器出現(xiàn)在20世紀(jì)50年代,從那時(shí)起,字符和文檔識(shí)別技術(shù)已經(jīng)提供了非常先進(jìn)的產(chǎn)品和系統(tǒng),以滿(mǎn)足整個(gè)開(kāi)發(fā)過(guò)程中的工業(yè)和商業(yè)的需要。同時(shí),基于此項(xiàng)技術(shù)的企業(yè)投資到研究和開(kāi)發(fā)更先進(jìn)的技術(shù)。在

4、這里我們可以看到一個(gè)良性循環(huán),即新技術(shù)促使新的應(yīng)用,以及新的應(yīng)用支持開(kāi)發(fā)更先進(jìn)的技術(shù)。
   因此,我們認(rèn)為研究和發(fā)明一個(gè)能夠識(shí)別機(jī)打印字符的系統(tǒng)是非常有意義的。雖然,我們知道創(chuàng)造一個(gè)百分之百正確識(shí)別率的系統(tǒng)在充斥噪音和不同的字體風(fēng)格的世界里很可能無(wú)法實(shí)現(xiàn),因?yàn)樵诓煌盗械奶卣魃纤惴ǖ淖饔闷毡槎嘤谌祟?lèi)不同的功能設(shè)置。不過(guò),我們?nèi)匀豢梢蚤_(kāi)發(fā)一個(gè)能夠識(shí)別出大量樣品的系統(tǒng)??傊?本論文提出了一個(gè)識(shí)別系統(tǒng),這個(gè)系統(tǒng)使用功能特征提取和神經(jīng)

5、網(wǎng)絡(luò)分類(lèi)器的反向傳播算法訓(xùn)練,可以正確識(shí)別一定數(shù)量的印刷英文字符。
   事實(shí)上,這存在著幾個(gè)不同的技術(shù)來(lái)識(shí)別字符,但我們選擇使用人工BP神經(jīng)網(wǎng)絡(luò)。這是因?yàn)槿斯ど窠?jīng)網(wǎng)絡(luò)在OCR中應(yīng)用可以大大簡(jiǎn)化代碼,提高識(shí)別質(zhì)量,同時(shí)實(shí)現(xiàn)良好的性能。利用光學(xué)字符識(shí)別的另一個(gè)好處是神經(jīng)網(wǎng)絡(luò)系統(tǒng)的可擴(kuò)展性,它能夠識(shí)別比初始定義的更多的字符集。因此,人工神經(jīng)網(wǎng)絡(luò)(ANN)是一種奇妙的工具,有助于解決此類(lèi)問(wèn)題。人工神經(jīng)網(wǎng)絡(luò),往往善于解決對(duì)于傳統(tǒng)技術(shù)過(guò)于

6、復(fù)雜的問(wèn)題,例如,沒(méi)有一個(gè)算法解決問(wèn)題或?qū)τ谶@個(gè)問(wèn)題解決方案的算法由于過(guò)于復(fù)雜而無(wú)法找到,它們是優(yōu)良的模式識(shí)別器和強(qiáng)大的分類(lèi)器。對(duì)于不同的分類(lèi)問(wèn)題,提供了理想的解決方案,如講話(huà),性格,信號(hào)識(shí)別,以及預(yù)測(cè)功能和系統(tǒng)建模(其中的物理過(guò)程很難理解,或者是高度復(fù)雜的),由于這些優(yōu)勢(shì),所以我們選擇BP神經(jīng)網(wǎng)絡(luò)作為分類(lèi)器。
   該系統(tǒng)首先應(yīng)用于二值化,是指一個(gè)灰度圖像轉(zhuǎn)換成二值圖像,以及其他主要的預(yù)處理,通過(guò)假設(shè)輸入數(shù)據(jù)有噪聲。有了這個(gè)假

7、設(shè),然后繼續(xù)尋找特征點(diǎn)。特征點(diǎn)的選擇問(wèn)題意味著從一整套可用的功能子集的選擇,允許判別性地選擇合適的子集。一個(gè)良好的特征點(diǎn)集的選擇是分類(lèi)過(guò)程的關(guān)鍵,如果所考慮的特征點(diǎn)集不包括所有的信息需求,以區(qū)分屬于不同階級(jí)的樣本,不管學(xué)習(xí)算法的有效性,所達(dá)到的性能可能會(huì)不理想。
   在我們的工作中,所描述的特征點(diǎn)提取一共有兩種方法:第一種是所謂的離散特征點(diǎn)提取,這種方法掃描圖像的某些預(yù)先確定的點(diǎn),依次檢查每一個(gè)像素,同時(shí)它檢查其8個(gè)鄰居點(diǎn),并

8、對(duì)現(xiàn)有的系統(tǒng)有10個(gè)顯著特征點(diǎn)的定義,這足夠?qū)崿F(xiàn)我們的目標(biāo),其優(yōu)勢(shì)是不會(huì)擁有太多無(wú)趣的點(diǎn),使特征點(diǎn)提取更快和更可靠。第二種方法是所謂的分區(qū),這需要以圖像的亮度圖為基礎(chǔ)功能,劃分區(qū)域中的圖像,并計(jì)算每個(gè)亮度圖的平均水平。
   一旦我們從特征提取中收集數(shù)據(jù),仍然需要修復(fù)圖像。其功能需要我們從特征矩陣轉(zhuǎn)移到一個(gè)向量形式,以使用它作為輸入向量送入神經(jīng)網(wǎng)絡(luò)來(lái)學(xué)習(xí)和分類(lèi)。為了達(dá)到這個(gè)目標(biāo),需要改變矩陣的值,以適應(yīng)變化的差別。這只是因?yàn)楦鶕?jù)

9、分類(lèi)器(神經(jīng)網(wǎng)絡(luò))每個(gè)字母都是一種模式?;旧?每個(gè)訓(xùn)練模式包括:兩個(gè)浮點(diǎn)數(shù)字的一維數(shù)組的以及輸入和輸出(目標(biāo))陣列。輸入數(shù)組包含每個(gè)特征提取方法的每個(gè)字母的特征向量表示,輸出數(shù)組代表預(yù)期的反應(yīng),在輸出數(shù)組系統(tǒng)能夠識(shí)別和字符一樣多的元素。因此,為了使人們認(rèn)識(shí)所有的英文詞匯字母,我們將需要26個(gè)輸出數(shù)組元素。
   我們?cè)谒械哪J皆O(shè)置完畢后,加入神經(jīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)被設(shè)計(jì)成一個(gè)使用三層S形輸出功能和反向傳播算法。但清晰的反向傳播運(yùn)行

10、很慢,我們希望它更快。因此,我們有一些可以被設(shè)置為加快學(xué)習(xí)階段的調(diào)整。對(duì)一些輸出功能進(jìn)行調(diào)整與修改,這使系統(tǒng)運(yùn)算要求不高,其次我們依照一些技術(shù)在每一層找到適當(dāng)?shù)碾[藏層和神經(jīng)元的數(shù)量。進(jìn)行一些測(cè)試之后,發(fā)現(xiàn)變量更適合我們?cè)O(shè)計(jì)的系統(tǒng)。隨著這些都作了調(diào)整,并對(duì)網(wǎng)絡(luò)進(jìn)行有效訓(xùn)練,可以嘗試對(duì)表現(xiàn)最好的訓(xùn)練集中識(shí)別所有的模式。
   在實(shí)驗(yàn)部分,用不同的樣本進(jìn)行了多次試驗(yàn)。在第一個(gè)實(shí)驗(yàn)中,從英語(yǔ)詞匯所有的26個(gè)字母中選擇了一個(gè)非正規(guī)的圖像數(shù)

11、據(jù)集(模糊,傾斜和洗圖像),發(fā)現(xiàn)訓(xùn)練時(shí)間之間存在差異,這是因?yàn)槭褂秒x散特征接近網(wǎng)絡(luò)所用的收斂時(shí)間比使用分區(qū)方法要長(zhǎng)。另一個(gè)重要區(qū)別是識(shí)別率,用分區(qū)制得到85%的識(shí)別率,但是用離散特征只得到78%的識(shí)別率,略低于分區(qū)制。
   第二個(gè)實(shí)驗(yàn)是調(diào)查輸入特征向量的大小如何會(huì)影響識(shí)別率的準(zhǔn)確性。因此,我們嘗試了四種不同的圖像大小,并運(yùn)用兩種方法進(jìn)行測(cè)試。對(duì)于離散特征方法,注意到增加特征向量的大小越多,在網(wǎng)絡(luò)融合所花費(fèi)的時(shí)間越多,而字符的識(shí)

12、別率下降越多。至于分區(qū)方法,用同一種方法進(jìn)行實(shí)驗(yàn),但網(wǎng)絡(luò)的行為結(jié)果卻不同,在這種情況下,發(fā)現(xiàn)隨著向量大小的增加,可以得到更好的識(shí)別率,直至到達(dá)一個(gè)點(diǎn)才開(kāi)始下降。
   我們還進(jìn)行了第三個(gè)實(shí)驗(yàn),這一次是當(dāng)我們?cè)跇颖局蟹謩e添加模糊和噪聲時(shí)觀察網(wǎng)絡(luò)的行為。首先,我們添加模糊特性到樣本中,通過(guò)使用高斯方法對(duì)字符數(shù)據(jù)加入噪聲。之后,將模糊的樣本輸入到系統(tǒng),接著進(jìn)行識(shí)別過(guò)程,正如預(yù)期的那樣,用分區(qū)制和離散特征方法都增加了模糊量樣本的識(shí)別率。

13、即用分區(qū)方法也可以取得較高的識(shí)別率。在這個(gè)實(shí)驗(yàn)的第二部分,為了研究,如果增加噪音到樣本中將得到什么樣的結(jié)果,采用椒鹽噪聲添加到字符中。在四個(gè)運(yùn)行階段的每一步,我們都增加噪音量,這明顯降低兩者的識(shí)別率。我們注意到,用圖像噪音并用分區(qū)的方法可得到更好的效果。
   最后,總結(jié)我們的工作,文章開(kāi)始提到如何調(diào)查和對(duì)模式識(shí)別的研究,特別是光學(xué)字符識(shí)別系統(tǒng),詳細(xì)闡述了它的背景、定義、應(yīng)用和技術(shù)。選擇離散特征和分區(qū)制作為特征提取的兩種方法。研

14、究的另一項(xiàng)內(nèi)容是分類(lèi)器,選擇BP神經(jīng)網(wǎng)絡(luò),實(shí)驗(yàn)證明了這種網(wǎng)絡(luò)的優(yōu)越性。在達(dá)到良好的識(shí)別性能的同時(shí)能夠改善質(zhì)量,并使得系統(tǒng)更具有擴(kuò)展性,能夠識(shí)別比初始定義更多的字符集。
   仔細(xì)分析和研究了上述過(guò)程之后可以發(fā)現(xiàn),先前提到的兩個(gè)特征點(diǎn)提取的技術(shù)在結(jié)合神經(jīng)網(wǎng)絡(luò)分類(lèi)器,對(duì)機(jī)器印刷的英文字符識(shí)別時(shí)存在差異。實(shí)驗(yàn)結(jié)果表明上述描述的光學(xué)字符識(shí)別系統(tǒng)的性能相當(dāng)高。當(dāng)考慮到所測(cè)試幾個(gè)非正常的圖像(原始的,干凈的,模糊的,有噪聲的圖像)時(shí),我們沒(méi)

15、有使用任何噪聲濾波技術(shù)。在我們的研究中,使用分區(qū)制技術(shù)獲得高達(dá)85%的識(shí)別率,用離散特征技術(shù)獲得78.57%的識(shí)別率。顯然,我們看到的分區(qū)制技術(shù)稍微好一點(diǎn),盡管大多數(shù)實(shí)驗(yàn)中得知,兩種技術(shù)的得到的識(shí)別率都很高。
   此外,我們對(duì)樣本進(jìn)行添加噪聲和不同幅度模糊處理兩種方法做了比較,結(jié)果顯示:性能呈現(xiàn)一定程度下降,并對(duì)于這兩種方法是令人滿(mǎn)意的。盡管用分區(qū)制得到了更好的識(shí)別率。結(jié)果還表明:使用神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)光學(xué)字符識(shí)別系統(tǒng),發(fā)現(xiàn)面向?qū)ο?/p>

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論