畢業(yè)設(shè)計(jì)(論文)-基于貝葉斯判別的數(shù)字圖像識(shí)別的實(shí)現(xiàn)與分析_第1頁(yè)
已閱讀1頁(yè),還剩36頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p>  計(jì)算機(jī)科學(xué)與工程學(xué)院</p><p><b>  綜合設(shè)計(jì)報(bào)告</b></p><p>  設(shè)計(jì)名稱: 圖像處理與機(jī)器視覺(jué)綜合設(shè)計(jì) </p><p>  設(shè)計(jì)題目:基于貝葉斯判別的數(shù)字圖像識(shí)別的實(shí)現(xiàn)與分析 </p><p>  學(xué)生學(xué)號(hào):

2、 </p><p>  專業(yè)班級(jí): </p><p>  學(xué)生姓名: </p><p>  學(xué)生成績(jī):

3、 </p><p>  指導(dǎo)教師(職稱): </p><p>  課題工作時(shí)間: 2015.5.10 至 2015.5.26 </p><p><b>  說(shuō)明:</b></p><p>  1、報(bào)告中的第一、二、三項(xiàng)由指導(dǎo)教師在綜合設(shè)計(jì)開(kāi)始前

4、填寫(xiě)并發(fā)給每個(gè)學(xué)生;四、五兩項(xiàng)(中英文摘要)由學(xué)生在完成綜合設(shè)計(jì)后填寫(xiě)。</p><p>  2、學(xué)生成績(jī)由指導(dǎo)教師根據(jù)學(xué)生的設(shè)計(jì)情況給出各項(xiàng)分值及總評(píng)成績(jī)。</p><p>  3、指導(dǎo)教師評(píng)語(yǔ)一欄由指導(dǎo)教師就學(xué)生在整個(gè)設(shè)計(jì)期間的平時(shí)表現(xiàn)、設(shè)計(jì)完成情況、報(bào)告的質(zhì)量及答辯情況,給出客觀、全面的評(píng)價(jià)。</p><p>  4、所有學(xué)生必須參加綜合設(shè)計(jì)的答辯環(huán)節(jié),凡不參

5、加答辯者,其成績(jī)一律按不及格處理。答辯小組成員應(yīng)由2人及以上教師組成。</p><p>  5、報(bào)告正文字?jǐn)?shù)一般應(yīng)不少于5000字,也可由指導(dǎo)教師根據(jù)本門綜合設(shè)計(jì)的情況另行規(guī)定。</p><p>  6、平時(shí)表現(xiàn)成績(jī)低于6分的學(xué)生,其綜合設(shè)計(jì)成績(jī)按不及格處理。</p><p>  7、此表格式為武漢工程大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院提供的基本格式(適用于學(xué)院各類綜合設(shè)計(jì))

6、,各教研室可根據(jù)本門綜合設(shè)計(jì)的特點(diǎn)及內(nèi)容做適當(dāng)?shù)恼{(diào)整,并上報(bào)學(xué)院批準(zhǔn)。</p><p><b>  成績(jī)?cè)u(píng)定表</b></p><p>  學(xué)生姓名: 學(xué)號(hào): 班級(jí): </p><p><b>  答辯記錄表</b></p><p><b>  指導(dǎo)教

7、師評(píng)語(yǔ)</b></p><p><b>  目 錄</b></p><p><b>  目 錄I</b></p><p><b>  摘 要II</b></p><p>  AbstractII</p><p><b>  

8、第一章 緒論1</b></p><p>  1.1課題研究的意義1</p><p>  1.2國(guó)內(nèi)外究動(dòng)態(tài)目前水平1</p><p>  1.3手寫(xiě)體數(shù)字識(shí)別簡(jiǎn)介2</p><p>  1.4識(shí)別的技術(shù)難點(diǎn)2</p><p>  第二章 貝葉斯方法應(yīng)用于手寫(xiě)體數(shù)字識(shí)別3</p>

9、<p>  2.1貝葉斯由來(lái)3</p><p>  2.2貝葉斯公式3</p><p>  2.3貝葉斯公式Bayes決策理論4</p><p>  2.4貝葉斯應(yīng)用于的手寫(xiě)體數(shù)字理論部分7</p><p>  2.4.1 特征描述7</p><p>  2.4.2最小錯(cuò)誤分類器進(jìn)行判別分類9&

10、lt;/p><p>  第三章 數(shù)字識(shí)別的設(shè)計(jì)流程及功能的實(shí)現(xiàn)11</p><p>  3.1 系統(tǒng)整體功能模塊設(shè)計(jì)11</p><p>  3.2 手寫(xiě)數(shù)字識(shí)別系統(tǒng)的基本原理11</p><p>  3.2.1 圖像的預(yù)處理11</p><p>  3.2.2 圖像的特征提取12</p>&l

11、t;p>  3.2.3 特征庫(kù)的建立12</p><p>  3.2.4 圖像數(shù)字的識(shí)別13</p><p>  第四章 設(shè)計(jì)結(jié)果及分析14</p><p>  4.1 數(shù)字的特征提取14</p><p>  4.2 數(shù)字的識(shí)別15</p><p><b>  總 結(jié)18</b

12、></p><p><b>  致 謝19</b></p><p><b>  參考文獻(xiàn)20</b></p><p><b>  附錄21</b></p><p><b>  摘 要</b></p><p>  數(shù)

13、字識(shí)別就是通過(guò)計(jì)算機(jī)用數(shù)學(xué)技術(shù)方法來(lái)研究模式的自動(dòng)處理和識(shí)別。隨著計(jì)算機(jī)技術(shù)的發(fā)展,人類對(duì)模式識(shí)別技術(shù)提出了更高的要求。特別是對(duì)于大量己有的印刷資料和手稿,計(jì)算機(jī)自動(dòng)識(shí)別輸入己成為必須研究的課題,所以數(shù)字識(shí)別在文獻(xiàn)檢索、辦公自動(dòng)化、郵政系統(tǒng)、銀行票據(jù)處理等方面有著廣闊的應(yīng)用前景。</p><p>  關(guān)鍵詞:自動(dòng);模式識(shí)別;應(yīng)用前景</p><p><b>  Abstract&

14、lt;/b></p><p>  The digital recognition researches how to treat with and recognize pattern automatically through computer with math arithmetic. Along with the development of computer technology, human nee

15、d more advanced digital recognition technology. Especially for large numbers of printed data and manuscript, the automatic recognition and input of Chinese characters becomes a stringent task, therefore the digital recog

16、nition will have a broad application prospect on literature retrieval, office automation, po</p><p>  Keywords:automatically;digital recognition;application prospect</p><p><b>  第一章 緒論<

17、;/b></p><p>  1.1課題研究的意義</p><p>  手寫(xiě)體數(shù)字識(shí)別的研究有很大的實(shí)用價(jià)值,例如在郵政編碼、稅務(wù)報(bào)表、統(tǒng)計(jì)報(bào)表財(cái)務(wù)報(bào)表、銀行票據(jù)、海關(guān)等需要處理大量字符信息錄入的場(chǎng)合,在很大程度上要依賴數(shù)據(jù)信息的輸入。隨著人們生活水平的提高,經(jīng)濟(jì)活動(dòng)的發(fā)展,通信聯(lián)系的需求使信函的互換量大幅度增加,我國(guó)函件業(yè)務(wù)量也在不斷增長(zhǎng),預(yù)計(jì)到2010年,一些大城市的中心郵局每天

18、處理量將高達(dá)幾百萬(wàn)件,業(yè)務(wù)量的急劇上升使得郵件的分揀自動(dòng)化成為大勢(shì)所趨。在郵件的自動(dòng)分揀中,手寫(xiě)數(shù)字識(shí)別(OCR)往往與光學(xué)條碼識(shí)別(OBR---Optical Bar Reading),人工輔助識(shí)別等手段相結(jié)合,完成郵政編碼的閱讀。目前使用量最大的OVCS分揀機(jī)的性能指標(biāo):OCR拒分率30%,OCR分揀差錯(cuò)率1.1%。如果能通過(guò)手寫(xiě)數(shù)字識(shí)別技術(shù)實(shí)現(xiàn)信息的自動(dòng)錄入,將會(huì)促進(jìn)這一事業(yè)的進(jìn)展。</p><p>  手

19、寫(xiě)體數(shù)字識(shí)別的研究不僅有很大的應(yīng)用價(jià)值,而且有重要的理論價(jià)值,由于數(shù)字別的類別較小,有助于作深入分析及驗(yàn)證一些新的理論。例如人工神經(jīng)網(wǎng)絡(luò),相當(dāng)一部分的ANN模型和算法都以手寫(xiě)數(shù)字識(shí)別作為具體的實(shí)驗(yàn)平臺(tái)。可以說(shuō),手寫(xiě)體數(shù)字識(shí)別的研究將有助于模式識(shí)別、機(jī)器理解、機(jī)器人技術(shù)的發(fā)展,對(duì)今后研究如何更好地進(jìn)行人機(jī)交互,使計(jì)算機(jī)具有和人一樣的能力有很大的理論價(jià)值。</p><p>  1.2國(guó)內(nèi)外究動(dòng)態(tài)目前水平</p&

20、gt;<p>  手寫(xiě)體字符的識(shí)別在很早以前就開(kāi)始了。國(guó)外從20世紀(jì)70年代初研制成“光學(xué)字符別機(jī)(OCR)”,能夠自動(dòng)識(shí)別印刷體的英文文字及阿拉伯?dāng)?shù)字。20世紀(jì)70年代中期出現(xiàn)了能識(shí)別手寫(xiě)數(shù)字的OCR。在20世紀(jì)70年代末和80年代初又出現(xiàn)了能識(shí)別手寫(xiě)英文母的OCR。日本于20世紀(jì)80年代初研制了印刷體漢字識(shí)別樣機(jī),這是最早的漢字OCR。我國(guó)從20世紀(jì)70年代就開(kāi)始進(jìn)行了字符(英文字母和數(shù)字)識(shí)別的研究,20世紀(jì)80年代

21、己進(jìn)入實(shí)用階段,主要用于郵政信函自動(dòng)分檢,人口普查和生產(chǎn)統(tǒng)計(jì)報(bào)表。手寫(xiě)體數(shù)字識(shí)別是手寫(xiě)字符識(shí)別的一個(gè)重要分支,它又分為在線手寫(xiě)體識(shí)別和離線寫(xiě)體識(shí)別。在線手寫(xiě)體識(shí)別通過(guò)記錄文字圖像抬筆、落筆、筆跡上各像素的空間位,以及各筆段之間的時(shí)間關(guān)系等信息,對(duì)這些信息進(jìn)行處理,在處理過(guò)程中,系統(tǒng)以定的規(guī)則提取信息特征,再由識(shí)別模塊將信息特征與識(shí)別庫(kù)的特征進(jìn)行比較、加以識(shí)別,最后轉(zhuǎn)化為計(jì)算機(jī)所使用的文字代碼。在線手寫(xiě)體識(shí)別的一個(gè)重要的不足就是要求寫(xiě)入者

22、必須在指定的設(shè)備上書(shū)寫(xiě)。而離線手寫(xiě)體識(shí)別則是通過(guò)使用任何一種圖像采集設(shè)備,如CCD、掃描儀、數(shù)碼相機(jī)等將手寫(xiě)者已寫(xiě)好的文字作為圖像輸入到計(jì)算機(jī)中,然后由</p><p>  手寫(xiě)體識(shí)別目前的研究方向是:特征提取問(wèn)題,這個(gè)方面一是在現(xiàn)有基礎(chǔ)上進(jìn)行組合,另一個(gè)是引入新的特征技術(shù);分類器研究,一是多分類器繼集成,另一個(gè)方向是研究新的分類器。、</p><p>  1.3手寫(xiě)體數(shù)字識(shí)別簡(jiǎn)介<

23、/p><p>  手寫(xiě)體數(shù)字識(shí)別是指利用電子計(jì)算機(jī)自動(dòng)辨認(rèn)手寫(xiě)體阿拉伯?dāng)?shù)字的一種技</p><p>  術(shù),它屬于光學(xué)字符識(shí)別(OCR)的范疇·手寫(xiě)體數(shù)字識(shí)別又分為聯(lián)機(jī)識(shí)別(on-line)和脫機(jī)識(shí)別(off-line)兩種。其中,最為困難的就是脫機(jī)手寫(xiě)字符的識(shí)別。主要是因?yàn)槊摍C(jī)手寫(xiě)體識(shí)別過(guò)程無(wú)法獲得字符書(shū)寫(xiě)時(shí)的一些動(dòng)態(tài)信息。然而,手寫(xiě)體數(shù)字識(shí)別技術(shù)的研究是非常有價(jià)值的,它具有廣闊的

24、應(yīng)用前景。</p><p>  手寫(xiě)體數(shù)字識(shí)別系統(tǒng)性能的評(píng)價(jià)方法</p><p>  作為一個(gè)識(shí)別系統(tǒng),我們最終要用某些參數(shù)來(lái)評(píng)價(jià)其性能的高低,手寫(xiě)數(shù)字識(shí)別也不例外。評(píng)價(jià)的指標(biāo)除了借用一般文字識(shí)別里的通常做法外,還要根據(jù)數(shù)字識(shí)別的特點(diǎn)進(jìn)行修改和補(bǔ)充。</p><p>  對(duì)一個(gè)手寫(xiě)數(shù)字識(shí)別系統(tǒng),可以用兩方面的指標(biāo)表征系統(tǒng)的性能:</p><p&g

25、t;  識(shí)別率 A 正確識(shí)別樣本數(shù)/全部樣本數(shù)*100% (1.1)</p><p>  誤識(shí)率 S 誤識(shí)樣本/全部樣本數(shù) *100% (1.2)</p><p>  兩者的關(guān)系 A+S=100% (1.3)</p><p>  數(shù)字識(shí)別的應(yīng)用中,人們往往很關(guān)心的一個(gè)指標(biāo)是“識(shí)別精

26、度”,即在所有識(shí)</p><p>  別的字符中,正確識(shí)別的比例,表示如下::</p><p>  識(shí)別精度:P=A/(A+S)*100% (1.4)</p><p>  一個(gè)理想的系統(tǒng)應(yīng)是S盡量小,然而A盡可能大。</p><p>  1.4識(shí)別的技術(shù)難點(diǎn)</p><p> 

27、 手寫(xiě)體數(shù)字識(shí)別的研究是一項(xiàng)具有相當(dāng)難度的工作,此項(xiàng)工作的難點(diǎn)主要在</p><p><b>  于以下幾方面:</b></p><p>  1.阿拉伯?dāng)?shù)字的字形信息量很小,不同數(shù)字寫(xiě)法字形相差不大,使得準(zhǔn)確區(qū)分某些數(shù)字相當(dāng)困難。</p><p>  2.要識(shí)別的數(shù)字雖然只有十種,而且筆劃簡(jiǎn)單,但同一數(shù)字寫(xiě)法千差萬(wàn)別,不同的人寫(xiě)法也不盡相同,很

28、難完全做到兼顧各種寫(xiě)法的極高識(shí)別率的通用性數(shù)字識(shí)別系統(tǒng)。</p><p>  3.在實(shí)際應(yīng)用中,對(duì)數(shù)字的單字識(shí)別正確率的要求要比文字要苛刻得多。這是因?yàn)槲淖钟猩舷挛年P(guān)系,但數(shù)字沒(méi)有上下文關(guān)系,每個(gè)單字的識(shí)別都至關(guān)重要,</p><p>  而且數(shù)字識(shí)別經(jīng)常涉及的財(cái)會(huì)、金融領(lǐng)域,其嚴(yán)格性更是不言而喻的。因此,</p><p>  用戶的要求不是單純的高正確率,更重要的

29、是極低的誤識(shí)率。</p><p>  4.大批量數(shù)據(jù)處理對(duì)系統(tǒng)速度又有相當(dāng)?shù)囊?,許多理論上很完美但速度過(guò)低的方法也是行不通的。綜上所述,研究高性能的手寫(xiě)數(shù)字識(shí)別算法是一個(gè)有相當(dāng)?shù)奶魬?zhàn)性的課題,同樣的把高效的手寫(xiě)體數(shù)字識(shí)別算法應(yīng)用于實(shí)際工作之中也是具有重要意義的。</p><p>  第二章 貝葉斯方法應(yīng)用于手寫(xiě)體數(shù)字識(shí)別</p><p><b>  2

30、.1貝葉斯由來(lái)</b></p><p>  貝葉斯(R.T.Bayes,1702—1761)學(xué)派奠基性的工作,是英國(guó)學(xué)者貝葉斯的一篇具有哲學(xué)性的論文——《關(guān)于幾率性問(wèn)題求解的討論》。著名數(shù)學(xué)家拉普拉斯利用貝葉斯的方法導(dǎo)出了重要的“相繼律”,從而引起人們對(duì)貝葉斯的方法和理論的重視。盡管利用貝葉斯方法可以推導(dǎo)出很多有意義的結(jié)果,但是,由于理論上和實(shí)際應(yīng)用中存在很多問(wèn)題,在19世紀(jì),貝葉斯理論并未被普遍接受

31、。進(jìn)入20世紀(jì),意大利的菲納特、英國(guó)的杰弗萊、古特、薩凡奇、林德萊對(duì)貝葉斯學(xué)派的形成做出了重要貢獻(xiàn),1958年英國(guó)歷史最長(zhǎng)的統(tǒng)計(jì)雜志Biometrika重新全文刊載了貝葉斯的論文。20世紀(jì)50年代,羅賓斯(H.Robbins)將經(jīng)典統(tǒng)計(jì)學(xué)派的方法和貝葉斯學(xué)派的方法進(jìn)行融合,提出了經(jīng)驗(yàn)貝葉斯方法(EB方法)。如今,貝葉斯學(xué)派的思想方法已滲透到了許多學(xué)科。</p><p>  貝葉斯理論在人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘

32、等方面也有廣泛應(yīng)用。20世紀(jì)80年代,貝葉斯網(wǎng)絡(luò)被用于專家系統(tǒng)的知識(shí)表示,90年代可學(xué)習(xí)的貝葉斯網(wǎng)絡(luò)被用于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)。涉及因果推理、不確定性知識(shí)表達(dá)、聚類分析等方面的貝葉斯方法的文章大量涌現(xiàn)。并且出現(xiàn)了專門研究貝葉斯理論的組織和學(xué)術(shù)刊物ISBA。</p><p>  貝葉斯分類是一種統(tǒng)計(jì)學(xué)分類方法,可以預(yù)測(cè)類成員關(guān)系的可能性,如給定樣本屬于一個(gè)特定類的概率。目前,貝葉斯分類方法已在文本分類、字母識(shí)別、經(jīng)濟(jì)

33、預(yù)測(cè)等領(lǐng)域獲得了成功的應(yīng)用。貝葉斯方法正在以其獨(dú)特的不確定性知識(shí)表達(dá)形式、豐富的概率表達(dá)能力、綜合先驗(yàn)知識(shí)的增量學(xué)習(xí)等特性成為眾多數(shù)據(jù)挖掘方法中最引人注目的焦點(diǎn)之一。</p><p><b>  2.2貝葉斯公式</b></p><p>  貝葉斯公式建立起先驗(yàn)概率和后驗(yàn)概率的聯(lián)系。先驗(yàn)概率是指根據(jù)歷史資料或主觀判斷確定的各事件發(fā)生的概率,由于沒(méi)能經(jīng)過(guò)實(shí)驗(yàn)證實(shí),屬于檢

34、驗(yàn)前的概率,所以稱為先驗(yàn)概率。先驗(yàn)概率一般分為兩類,一是客觀先驗(yàn)概率,指利用歷史資料計(jì)算得到的概率;二是主觀先驗(yàn)概率,指在沒(méi)有歷史資料或歷史資料不全的情況下,僅僅憑借主觀經(jīng)驗(yàn)判斷得到的概率。</p><p>  后驗(yàn)概率是指利用貝葉斯公式,結(jié)合調(diào)查等方式獲取了新的附加信息,對(duì)先驗(yàn)概率進(jìn)行修正后得到的更符合實(shí)際的概率。</p><p><b>  先驗(yàn)概率 </b>&l

35、t;/p><p>  先驗(yàn)概率針對(duì)M個(gè)事件出現(xiàn)的可能性而言,不考慮其他任何條件。例如,由統(tǒng)計(jì)資料表明總藥品數(shù)為N,其中正常的藥品數(shù)位,異常藥品數(shù)位,則:</p><p><b> ?。?.1)</b></p><p>  我們稱及為先驗(yàn)概率。顯然在一般情況下正常藥品占比例大,即</p><p>  。僅按先驗(yàn)概率來(lái)決策,就會(huì)

36、吧所有藥品都劃歸為正常藥品,并沒(méi)有達(dá)到將正常藥品與異常藥品分開(kāi)的目的。這表明由先驗(yàn)概率所提供的信息太少。</p><p>  2.貝葉斯公式也稱為后驗(yàn)概率公式或逆概率公式,有幾種不同的形式。通常采用事件形式或隨機(jī)變量形式表示。</p><p><b>  2.1.事件形式</b></p><p>  設(shè)A1, A2,…, An互不相容,并且有(

37、必然事件),則對(duì)于任一事件B,有</p><p>  (i=1, 2,…, n) (2.2)</p><p><b>  2.2隨機(jī)變量形式</b></p><p>  設(shè)x和θ為兩個(gè)隨機(jī)變量,x是觀測(cè)向量,θ是未知參數(shù)向量,其聯(lián)合分布密度是p(x,θ),p(x|θ)是x對(duì)θ的條件密度,π (θ)是θ的先驗(yàn)分布密度,于是θ對(duì)x的條件密度p(θ

38、|x)為</p><p><b> ?。?.3)</b></p><p>  貝葉斯假設(shè)指出,在沒(méi)有任何關(guān)于θ的信息時(shí),可以認(rèn)為θ的先驗(yàn)分布是均勻分布。當(dāng)然,確定先驗(yàn)分布的準(zhǔn)則還包括杰弗萊準(zhǔn)則、最大熵準(zhǔn)則、共軛分布族等??傊?,貝葉斯方法的重點(diǎn)在于研究如何合理地使用先驗(yàn)信息。</p><p>  2.3貝葉斯公式Bayes決策理論</p&g

39、t;<p>  在分類的時(shí)候難免出現(xiàn)錯(cuò)分類的情況,如何做出合理的判決就是Bayes決策理論所要討論的問(wèn)題,其中具有代表性的是最小錯(cuò)誤概率的Bayes決策[3]</p><p>  基于最小錯(cuò)誤率的貝葉斯決策:</p><p>  假定得到一個(gè)待識(shí)別量的特征X后,每個(gè)樣品X有n個(gè)特征,即,通過(guò)樣品庫(kù),計(jì)算先驗(yàn)概率及類別條件概率密度函數(shù),得到呈現(xiàn)狀態(tài)X時(shí),該樣品分屬各類別的概率,

40、顯然這個(gè)概率值可以作為識(shí)別對(duì)象判屬的依據(jù),從后驗(yàn)概率分布圖4—4可見(jiàn)。在X值小時(shí),藥品被判為正常比較合理的,判斷錯(cuò)誤的可能性小?;谧钚″e(cuò)誤概率的貝葉斯決策就是按后驗(yàn)概率的大小判別的。這個(gè)判別又可以根據(jù)類別數(shù)目,寫(xiě)成不同的集中等價(jià)形式。</p><p><b>  圖(2.1)</b></p><p><b>  1.兩類問(wèn)題</b></p

41、><p>  若兩類樣品屬于類中的一類,已知兩類的先驗(yàn)概率分別為,。兩類的類條件概率密度為,.則任給一X。判別X的類別。由貝葉斯公式可知:</p><p><b> ?。?.4)</b></p><p><b>  由全概率公式可知</b></p><p><b> ?。?.5)</b&

42、gt;</p><p><b>  其中M為類別。</b></p><p><b>  對(duì)于兩類問(wèn)題</b></p><p><b> ?。?.6)</b></p><p>  所以用后驗(yàn)概率來(lái)判別為</p><p><b> ?。?.7)&l

43、t;/b></p><p>  判別函數(shù)還有另外兩種形式。</p><p><b> ?。?)似然比形式</b></p><p><b> ?。?.8)</b></p><p>  其中上面公式中的在統(tǒng)計(jì)學(xué)中稱為似然比,而稱為似然比閥值。</p><p><b&g

44、t;  對(duì)數(shù)形式</b></p><p><b> ?。?.9)</b></p><p>  上面三種判別函數(shù)是一致的,也可以用后驗(yàn)概率來(lái)表示判別函數(shù)。</p><p><b>  多類問(wèn)題</b></p><p>  現(xiàn)在討論多類問(wèn)題的情況。判別函數(shù)的一般形式如下圖:</p>

45、;<p><b>  圖(2.2)</b></p><p>  若樣本分為M類,各類的先驗(yàn)概率分別為</p><p>  ,,...,各類的類條件概率密度分別為,,...,就有M個(gè)判別函數(shù)。在取得一個(gè)觀察特征X之后,在特征X的條件下,看哪個(gè)類的概率最大,就應(yīng)該把X歸于概率最大的那個(gè)類。因此對(duì)于任一模式X,可以通過(guò)比較各個(gè)判別函數(shù)來(lái)確定X的類別。</

46、p><p><b>  (2.10)</b></p><p>  就是把X代入M個(gè)判別函數(shù)中,看哪個(gè)判別函數(shù)最大,就把X歸于這一類。</p><p>  判別函數(shù)的對(duì)數(shù)形式為:</p><p><b> ?。?.11)</b></p><p>  由于先驗(yàn)概率通常是很容易求出來(lái)的

47、,貝葉斯分類器的核心問(wèn)題就是求出類條件概率密度如果求出了條件概率,則后驗(yàn)概率就可以求出了,判別問(wèn)題就可以解決了。在大多數(shù)情況下,類條件密度可以采用多維變量的正態(tài)密度函數(shù)來(lái)模擬。</p><p>  在工程上的許多問(wèn)題中,統(tǒng)計(jì)數(shù)據(jù)往往滿足正態(tài)分布規(guī)律,多維變量的正態(tài)密度函數(shù)為:</p><p><b>  (2.12)</b></p><p>&

48、lt;b>  其中:</b></p><p>  所以此時(shí)的正態(tài)分布的貝葉斯分類器判別函數(shù)為:</p><p><b> ?。?.13)</b></p><p>  2.4貝葉斯應(yīng)用于的手寫(xiě)體數(shù)字理論部分</p><p>  2.4.1 特征描述</p><p>  在模式識(shí)別技

49、術(shù)中,被觀測(cè)的每個(gè)對(duì)象稱為樣品,例如本文中的每個(gè)手寫(xiě)數(shù)字可以作為一個(gè)樣品,共寫(xiě)了10個(gè)數(shù)字,所以就有10個(gè)樣品(X1,X2,X3,X4,X5,X6,X7,X8,X9,X10),一共有10個(gè)不同的類別。對(duì)于一個(gè)樣品來(lái)說(shuō),必須確定一些與識(shí)別有關(guān)的因素作為研究的根據(jù),每一個(gè)因素稱為一個(gè)特征。模式就是樣品所具有的特征描述。模式的特征集由處于同一個(gè)特征空間的特征向量表示,特征向量的每個(gè)元素稱為特征,該向量也因此稱為特征向量。一般用小寫(xiě)字母x, y

50、, z來(lái)表示特征。如果一個(gè)樣品X有n 個(gè)特征,則可把X看成一個(gè)n維列向量,該向量稱為特征向量X,記作:</p><p>  X==T (2.14)</p><p>  抽取圖像特征的目的是為了進(jìn)行分類,識(shí)別圖像。也就是把圖像變成n維空間的一個(gè)向量,實(shí)際上就是看成n維空間中的一個(gè)點(diǎn),這樣有利于從幾何上考慮問(wèn)題,計(jì)算上比較方便。</p><p>  如果

51、一個(gè)對(duì)象的特征觀察值為{x1,x2,…,xn},它可構(gòu)成一個(gè)n維的特征向量值X,即X={x1,x2,…,xn}T,式中x1,x2,…,xn為特征向量X的各個(gè)分量。在模式識(shí)別的過(guò)程中,要對(duì)許多具體對(duì)象進(jìn)行測(cè)量,以獲得許多觀測(cè)值,其中有均值、方差、協(xié)方差與協(xié)方差矩陣。</p><p><b>  1.均值</b></p><p>  N 個(gè)樣品的均值可表示為:</p

52、><p><b> ?。?.15)</b></p><p>  其中是第i 個(gè)特征的平均值,</p><p><b> ?。?.16)</b></p><p><b>  2.方差 </b></p><p>  方差用來(lái)描述一批數(shù)的分散程度,第i 個(gè)特征的N

53、個(gè)數(shù)的方差公式是: (2.17) </p><p>  3.協(xié)方差與協(xié)方差矩陣:</p><p>  在N個(gè)樣品中,第i個(gè)特征和第j個(gè)特征之間的協(xié)方差定義為:</p><p><b> ?。?.18)</b></p><p>  對(duì)于同一批樣品來(lái)說(shuō),很明顯有:</p><

54、;p><b>  (2.19)</b></p><p>  如果一批樣品有n個(gè)特征x1,x2,…,xn。求出沒(méi)兩個(gè)特征的協(xié)方差,總共得到n2個(gè)值,將這n2個(gè)值排列成以下的n維方陣,稱為協(xié)方差矩陣:</p><p>  ,協(xié)方差矩陣是對(duì)稱矩陣,而且主對(duì)角線元素sij就是特征xi的方差si2,i=1,2,3,…,n。</p><p>  2.

55、4.2最小錯(cuò)誤分類器進(jìn)行判別分類</p><p>  寫(xiě)體數(shù)字,提取特征后,應(yīng)用Bayes分類器進(jìn)行判別分類。</p><p>  在手寫(xiě)體數(shù)字的識(shí)別屬于多類情況,可以認(rèn)為每類樣品呈正態(tài)分布。</p><p>  1)求出每一類手寫(xiě)體數(shù)字樣品的均值:</p><p><b>  (2.20)</b></p>

56、<p>  公式中,代表類的樣品個(gè)數(shù);n代表特征數(shù)目。</p><p>  求每一類的協(xié)方差矩陣:</p><p><b> ?。?.21)</b></p><p>  公式中,l代表樣品在類中的序號(hào),其中;</p><p><b> ?。?.22)</b></p><

57、;p>  計(jì)算出每一類的協(xié)方差矩陣的逆矩陣以及協(xié)方差矩陣的行列式</p><p>  求出每一類的先驗(yàn)概率</p><p><b> ?。?.23)</b></p><p><b>  其中:</b></p><p>  將各個(gè)數(shù)值代入判別函數(shù): </p><p>&l

58、t;b> ?。?.24)</b></p><p>  判別函數(shù)最大值所對(duì)應(yīng)類別就是手寫(xiě)體數(shù)字的類別</p><p>  第三章 數(shù)字識(shí)別的設(shè)計(jì)流程及功能的實(shí)現(xiàn)</p><p>  3.1 系統(tǒng)整體功能模塊設(shè)計(jì)</p><p><b>  整體模塊如圖所示:</b></p><p&g

59、t;<b>  圖(3.1)</b></p><p>  3.2 手寫(xiě)數(shù)字識(shí)別系統(tǒng)的基本原理</p><p>  下面分別介紹各部分工作的基本原理:</p><p>  3.2.1 圖像的預(yù)處理</p><p>  圖像的預(yù)處理是為了突出手寫(xiě)體數(shù)字的特征。在本次設(shè)計(jì)中主要包括:圖像二值化處理。</p>&l

60、t;p>  圖像的二值化處理就是將圖像上的像素點(diǎn)的灰度值設(shè)置為0或255,也就是將整個(gè)圖像呈現(xiàn)出明顯的黑白效果。二值圖像是指整幅圖像畫(huà)面內(nèi)僅黑、白二值的圖像。進(jìn)行圖像二值變換的關(guān)鍵 是要確定合適的閾值,使得字符與背景能夠分割開(kāi)來(lái),二值變換的結(jié)果圖像必須要具備良好的保形性,不丟掉有用的形狀信息,不會(huì)產(chǎn)生額外的空缺等等。采用二值圖像進(jìn)行處理,能大大地提高處理效率。二值化的關(guān)鍵在于閾值的選取,閾值的選取方法主要有三類:全局閾值法、局部閾

61、值法、動(dòng)態(tài)閾值法。全局閥值二值化方法是根據(jù)圖像的直方圖或灰度的空間分布確定一個(gè)閥值,并根據(jù)該閥值實(shí)現(xiàn)灰度圖像到二值化圖像的轉(zhuǎn)化。全局閥值方法的優(yōu)點(diǎn)在于算法簡(jiǎn)單,對(duì)于目標(biāo)和背景明顯分離、直方圖分布呈雙峰的圖像效果良好,但對(duì)輸入圖像量化噪聲或不均勻光照等情況抵抗能力差,應(yīng)用受到極大限制。局部閥值法則是由像素灰度值和像素周圍點(diǎn)局部灰度特性來(lái)確定像素的閥值的。本文采用全局閾值的方法,實(shí)現(xiàn)將圖像二值化的功能。如果某個(gè)像素的值大于等于閾值,該像素置

62、為白色;否則置為黑色</p><p>  3.2.2 圖像的特征提取</p><p>  若直接把預(yù)處理后的數(shù)據(jù)作為輸入量,進(jìn)行分類計(jì)算時(shí)數(shù)據(jù)時(shí)數(shù)據(jù)量大,同時(shí)由于手寫(xiě)字體的多樣化及圖像本身和預(yù)處理過(guò)程中附帶的某些干擾的影響,對(duì)系統(tǒng)的容錯(cuò)能力要求較高。特征提取的目的就是從分析數(shù)字的拓?fù)浣Y(jié)構(gòu)入手,把它的某些結(jié)構(gòu)特征提取出來(lái),使數(shù)字的位移、大小變化、字形畸形等干擾相對(duì)較小,也就是把那些反映數(shù)字

63、特征的關(guān)鍵信息提供給系統(tǒng),這樣就等于間接地增加了系統(tǒng)的容錯(cuò)能力,而且經(jīng)過(guò)特征提取后數(shù)據(jù)量也大大減少了,這樣就提高了識(shí)別的效率。</p><p>  手寫(xiě)數(shù)字識(shí)別的特征提取極大程度地影響著分類器的設(shè)計(jì)和性能,以及識(shí)別的效果和效率。為了保證所要求的分類識(shí)別的正確率和節(jié)省資源,希望依據(jù)最少的特征達(dá)到所要求的分類識(shí)別的正確率。在進(jìn)行手寫(xiě)數(shù)字識(shí)別的過(guò)程中,特征提取應(yīng)遵循以下原則:</p><p> 

64、 特征應(yīng)能盡量包含字符的有用信息。</p><p>  特征的提取方法應(yīng)簡(jiǎn)單而且提取快速。</p><p>  各個(gè)特征之間的相關(guān)性應(yīng)盡可能小。</p><p><b>  特征數(shù)量盡可能少。</b></p><p>  特征應(yīng)有較好的抗干擾能力。</p><p>  考慮到算法的實(shí)時(shí)性、快速性和

65、準(zhǔn)確性,在此次設(shè)計(jì)中采用的是一種簡(jiǎn)單的模板法對(duì)待測(cè)樣本進(jìn)行特征提取。步驟為:1、搜索數(shù)據(jù)區(qū)域,找出手寫(xiě)體數(shù)字的上下左右邊界。2、將搜索到的數(shù)字區(qū)域平分成8*8共64個(gè)小區(qū)域。3、計(jì)算8*8的每一個(gè)小區(qū)域中白色像素所占比例,即用每一個(gè)小區(qū)域內(nèi)的白色像素個(gè)數(shù)除以該小區(qū)域的面積總數(shù)(總像素?cái)?shù)),即得特征值,第一行的8個(gè)比例值是特征的前8特征值,第二行對(duì)應(yīng)著特征的9~16個(gè),以此類推。</p><p>  3.2.3

66、特征庫(kù)的建立</p><p>  在手寫(xiě)數(shù)字識(shí)別系統(tǒng)中,我們首先要建立一個(gè)特征庫(kù),我們手寫(xiě)一個(gè)數(shù)字,并且取得這個(gè)數(shù)字的特征值,然后再想程序輸入這個(gè)數(shù)字,在程序中將此輸入數(shù)字與所有特征值相對(duì)應(yīng),作為模板庫(kù)的一條記錄,初始化模板庫(kù)之后,就可以對(duì)手寫(xiě)數(shù)字進(jìn)行識(shí)別,在識(shí)別的過(guò)程中我們不斷的豐富模板庫(kù),如果手寫(xiě)數(shù)字識(shí)別成功則不需要將此數(shù)字存儲(chǔ)到模板庫(kù)中,如果識(shí)別失敗就需要將此數(shù)字存儲(chǔ)到模板庫(kù)中,這樣我們的模板庫(kù)將越來(lái)越豐富

67、。</p><p>  3.2.4 圖像數(shù)字的識(shí)別</p><p>  在手寫(xiě)數(shù)字圖像特征提取結(jié)束后,即可進(jìn)行數(shù)字的識(shí)別。這也是手寫(xiě)數(shù)字識(shí)別系統(tǒng)設(shè)計(jì)的最后一個(gè)環(huán)節(jié),在本次設(shè)計(jì)中采用模板匹配法進(jìn)行手寫(xiě)體數(shù)字識(shí)別。</p><p>  模板匹配法是圖像識(shí)別中最具有代表性的方法之一。它是將從待識(shí)別的圖像提取的若干特征量與模板對(duì)應(yīng)的特征量進(jìn)行比較,在識(shí)別之前須首先知道先驗(yàn)

68、概率和類條件概率密度函數(shù),其中先驗(yàn)概率P(Wi)可以由訓(xùn)練樣本集中的各類數(shù)字的個(gè)數(shù)和樣本總數(shù)之比近似計(jì)算;類條件概率密度函數(shù)P(X|Wi)可以按照模板匹配等方法進(jìn)行數(shù)字的區(qū)域劃分再進(jìn)行進(jìn)一步計(jì)算得到。在得到先驗(yàn)概率和類條件概率密度函數(shù)以后,可以運(yùn)用Bayes公式進(jìn)行后驗(yàn)概率P(Wi|X)的計(jì)算;由于手寫(xiě)數(shù)字0~9共有十類,該公式可以表示如下:</p><p><b>  (3.1)</b>&

69、lt;/p><p>  在這是i為總類別數(shù),分別為0、1、?、9等。緊接著就可以進(jìn)行后驗(yàn)概率的比較,其中值最大的所對(duì)應(yīng)的類別即為該手寫(xiě)數(shù)字的所屬的類別,即:則x∈Wi。</p><p><b>  設(shè)計(jì)結(jié)果及分析</b></p><p>  4.1 數(shù)字的特征提取</p><p>  數(shù)字特征的提取是為了更好的實(shí)現(xiàn)數(shù)字的識(shí)別

70、,在此是通過(guò)提取所繪制數(shù)字的像素特征即如前面所介紹的用目標(biāo)像素個(gè)數(shù)除以這個(gè)小區(qū)域內(nèi)總得像素個(gè)數(shù)的結(jié)果作為此區(qū)域的特征值。在此通過(guò)在函數(shù)GetFeature(I)來(lái)實(shí)現(xiàn)數(shù)字特征的提取功能。</p><p><b>  具體實(shí)現(xiàn)代碼為:</b></p><p>  function data=GetFeature(I)</p><p>  [row

71、,col]=find(I==0); %返回?cái)?shù)字的上下左右的邊界</p><p>  I=I(min(row):max(row),min(col):max(col)); %截取手寫(xiě)數(shù)字圖像,使其緊包含數(shù)字邊界,不包含多余的空白</p><p>  imwrite(I,'當(dāng)前手寫(xiě)數(shù)字.bmp','bmp');

72、 %保存截取后的手寫(xiě)數(shù)字圖像</p><p>  [row,col]=size(I);</p><p>  r=fix(row/5);</p><p>  c=fix(col/5);</p><p><b>  sum=0;</b></p><p><b>  k=1;</

73、b></p><p>  feature=[];</p><p>  for i=1:r:5*r %先從行開(kāi)始計(jì)算</p><p>  for j=1:c:5*c %保持行不變,先計(jì)算列</p><p>  for m=i:i+r-1</p><p>  for n=j:j+c-1</p>&l

74、t;p>  if I(m,n)==0</p><p>  sum=sum+1;</p><p><b>  end</b></p><p><b>  end</b></p><p><b>  end</b></p><p>  data(k)=

75、sum/(r*c); %第k個(gè)特征分量</p><p><b>  sum=0;</b></p><p><b>  k=k+1;</b></p><p><b>  end</b></p><p><b>  end</b></p>&l

76、t;p>  data=data'; %將當(dāng)前手寫(xiě)數(shù)字的特征向量由行向量變?yōu)榱邢蛄?lt;/p><p><b>  end</b></p><p><b>  4.2 數(shù)字的識(shí)別</b></p><p>  點(diǎn)擊系統(tǒng)界面上的特征識(shí)別按鈕即可實(shí)現(xiàn)手寫(xiě)數(shù)字的識(shí)別,此系統(tǒng)主要是通過(guò)函數(shù)來(lái)實(shí)現(xiàn)手寫(xiě)數(shù)字的識(shí)別,識(shí)別過(guò)程即把所

77、繪制數(shù)字的特征值與模板庫(kù)里面的每個(gè)特征值進(jìn)行比較,在得到先驗(yàn)概率和類條件概率密度函數(shù)以后,可以運(yùn)用Bayes公式進(jìn)行后驗(yàn)概率P(Wi|X)的計(jì)算;緊接著就可以進(jìn)行后驗(yàn)概率的比較,其中值最大的所對(duì)應(yīng)的類別即為該手寫(xiě)數(shù)字的所屬的類別。</p><p>  Bayes決策的分類代碼如下:</p><p>  function Result=BayesTwoValue(data)</p>

78、;<p><b>  clc;</b></p><p>  load template pattern;</p><p><b>  %求先驗(yàn)概率</b></p><p><b>  sum = 0;</b></p><p>  pw = []; %P(wi)--

79、-先驗(yàn)概率</p><p>  for i = 1:10</p><p>  sum = sum+pattern(1,i).num;</p><p><b>  end</b></p><p>  for i = 1:10</p><p>  pw(i) = pattern(1,i).num/su

80、m;</p><p><b>  end</b></p><p><b>  %求類條件概率</b></p><p><b>  p=[];</b></p><p>  pxw=[]; %P(x|wi)---類條件概率</p><p>  for i =

81、 1:10</p><p>  for j = 1:25</p><p><b>  sum = 0;</b></p><p>  for k = 1:pattern(1,i).num</p><p>  if pattern(1,i).feature(j,k)>0.1 %第i類第k個(gè)樣品的第j個(gè)特征值<

82、;/p><p>  sum = sum+1;</p><p><b>  end</b></p><p><b>  end</b></p><p>  p(j,i) = (sum+1)/(pattern(1,i).num+2);</p><p><b>  end&l

83、t;/b></p><p><b>  end</b></p><p>  for i = 1:10</p><p><b>  sum = 1;</b></p><p>  for j = 1:25</p><p>  if data(j)>0.1</p&

84、gt;<p>  sum = sum*p(j,i);</p><p><b>  else</b></p><p>  sum = sum*(1-p(j,i));</p><p><b>  end</b></p><p><b>  end</b></p&

85、gt;<p>  pxw(i) = sum;</p><p><b>  end</b></p><p><b>  %求后驗(yàn)概率</b></p><p><b>  sum = 0;</b></p><p>  pwx = []; %P(wi|x)---后驗(yàn)

86、概率</p><p>  for i = 1:10</p><p>  sum = sum+pw(i)*pxw(i);</p><p><b>  end</b></p><p>  for i = 1:10</p><p>  pwx(i) = pw(i)*pxw(i)/sum;</p&g

87、t;<p><b>  end</b></p><p>  [maxval,maxpos] = max(pwx);</p><p>  Result= maxpos-1;</p><p><b>  end</b></p><p><b>  總 結(jié)</b>&

88、lt;/p><p>  本文主要介紹了手寫(xiě)體數(shù)字識(shí)別的基本理論和方法,并實(shí)現(xiàn)了用了最小錯(cuò)誤的貝葉斯方法識(shí)別10個(gè)數(shù)字。</p><p>  收集、閱讀和分析有關(guān)模式識(shí)別及手寫(xiě)體數(shù)字識(shí)別的書(shū)籍,從中找到一種合理的設(shè)計(jì)方法。</p><p>  在VC的開(kāi)發(fā)環(huán)境中編寫(xiě)實(shí)現(xiàn)數(shù)字識(shí)別的代碼,讀取庫(kù)信息,特征提取,貝葉斯方</p><p>  法等,并對(duì)各

89、個(gè)部分進(jìn)行了調(diào)試。</p><p>  模式識(shí)別是一門綜合性、交叉性學(xué)科,在理論上它涉及代數(shù)學(xué)、矩陣論、概率論、圖論、模糊數(shù)學(xué)、最優(yōu)化理論等等眾多學(xué)科的知識(shí),在應(yīng)用上又與其他許多領(lǐng)域的工程技術(shù)密切相關(guān),其內(nèi)涵可以概括為信息處理、分析與決策。在模式識(shí)別學(xué)科中,并沒(méi)有一種普遍適應(yīng)的算法,模式識(shí)別的算法要根據(jù)具體的識(shí)別對(duì)象和任務(wù)來(lái)確定,所以模式識(shí)別學(xué)科中還有很多創(chuàng)新性的工作。</p><p>&

90、lt;b>  致 謝</b></p><p>  本設(shè)計(jì)是在趙彤洲老師的親切關(guān)懷與精心指導(dǎo)下完成的,感謝趙彤洲老師,她在我做設(shè)計(jì)的過(guò)程中,給予我很多的幫助和指導(dǎo),她循循善誘的教導(dǎo)和不拘一格的思路給予我無(wú)盡的啟迪。</p><p>  真誠(chéng)感謝我的室友們,他們?cè)谖移匠5膶W(xué)習(xí)與日常生活中,給了我許多關(guān)心與幫助。在此我表示深深的感謝!</p><p>

91、;<b>  參考文獻(xiàn)</b></p><p>  [1]楊淑瑩.圖像模式識(shí)別----VC++技術(shù)實(shí)現(xiàn).北京:清華大學(xué)出版社.2005</p><p>  [2]徐士良.C常用算法程序集.北京:清華大學(xué)出版社.1996</p><p>  [3]黃振華,吳誠(chéng)一.模式識(shí)別原理.杭州:浙江大學(xué)出版社.1991</p><p>

92、;  [4]沈清,湯霖.模式識(shí)別導(dǎo)輪.長(zhǎng)沙:國(guó)防科技大學(xué)出版社.1991</p><p>  [5]邊肇祺,張學(xué)工.模式識(shí)別.北京:清華大學(xué)出版社.2000</p><p>  [6]羅耀光,盛立東.模式識(shí)別.北京:人民郵電出版社.1989</p><p>  [7]譚浩強(qiáng).C程序設(shè)計(jì).北京:清華大學(xué)出版社.2001</p><p>  [8

93、]鄭莉,董淵.C++語(yǔ)言程序設(shè)計(jì).北京:清華大學(xué)出版社.2002</p><p><b>  附錄</b></p><p>  1. BayesLeasterror()</p><p>  /******************************************************************</p>

94、<p>  * 函數(shù)名稱:BayesLeasterror()</p><p>  * 函數(shù)類型:int </p><p>  * 函數(shù)功能:最小錯(cuò)誤概率的Bayes分類器 ,返回手寫(xiě)數(shù)字的類別</p><p>  *****************************************************************

95、*/</p><p>  int CGetFeature::BayesLeasterror()</p><p><b>  {</b></p><p>  double X[25];//待測(cè)樣品</p><p>  double Xmeans[25];//樣品的均值</p><p>  doubl

96、e S[25][25];//協(xié)方差矩陣</p><p>  double S_[25][25];//S的逆矩陣</p><p>  double Pw;//先驗(yàn)概率</p><p>  double hx[10];//判別函數(shù)</p><p>  int i,j,k,n;</p><p>  for(n=0;n<

97、10;n++)//循環(huán)類別0~9</p><p><b>  {</b></p><p>  int num=pattern[n].number;//樣品個(gè)數(shù)</p><p><b>  //求樣品平均值</b></p><p>  for(i=0;i<25;i++)</p>&

98、lt;p>  Xmeans[i]=0.0;</p><p>  for(k=0;k<num;k++)</p><p><b>  {</b></p><p>  for(i=0;i<25;i++)</p><p>  Xmeans[i]+=pattern[n].feature[k][i]>0.10

99、?1.0:0.0;</p><p><b>  }</b></p><p>  for(i=0;i<25;i++)</p><p>  Xmeans[i]/=(double)num;</p><p><b>  //求協(xié)方差矩陣</b></p><p>  double

100、 mode[200][25];</p><p>  for(i=0;i<num;i++)</p><p>  for(j=0;j<25;j++)</p><p>  mode[i][j]=pattern[n].feature[i][j]>0.10?1.0:0.0;</p><p>  for(i=0;i<25;i++)

101、</p><p>  for(j=0;j<25;j++)</p><p><b>  {</b></p><p>  double s=0.0;</p><p>  for(k=0;k<num;k++)</p><p>  s=s+(mode[k][i]-Xmeans[i])*(mod

102、e[k][j]-Xmeans[j]);</p><p>  s=s/(double)(num-1);</p><p>  S[i][j]=s;</p><p><b>  }</b></p><p><b>  //求先驗(yàn)概率</b></p><p>  int total=

103、0;</p><p>  for(i=0;i<10;i++)</p><p>  total+=pattern[i].number;</p><p>  Pw=(double)num/(double)total;</p><p><b>  //求S的逆矩陣</b></p><p>  fo

104、r(i=0;i<25;i++)</p><p>  for(j=0;j<25;j++)</p><p>  S_[i][j]=S[i][j];</p><p>  double(*p)[25]=S_;</p><p>  brinv(*p,25);//S的逆矩陣</p><p><b>  //求

105、S的行列式</b></p><p>  double (*pp)[25]=S;</p><p>  double DetS;</p><p>  DetS=bsdet(*pp,25);//S的行列式</p><p><b>  //求判別函數(shù)</b></p><p>  for(i=0

106、;i<25;i++)</p><p>  X[i]=testsample[i]>0.10?1.0:0.0;</p><p>  for(i=0;i<25;i++)</p><p>  X[i]-=Xmeans[i];</p><p>  double t[25];</p><p>  for(i=0;

107、i<25;i++)</p><p><b>  t[i]=0;</b></p><p>  brmul(X,S_,25,t);//矩陣的乘積</p><p>  double t1=brmul(t,X,25);</p><p>  double t2=log(Pw);</p><p>  d

108、ouble t3=log(DetS+1);</p><p>  hx[n]=-t1/2+t2-t3/2;</p><p><b>  }</b></p><p>  double maxval=hx[0];</p><p>  int number=0;</p><p>  //判別函數(shù)的最大值&

109、lt;/p><p>  for(n=1;n<10;n++)</p><p><b>  {</b></p><p>  if(hx[n]>maxval)</p><p><b>  {</b></p><p>  maxval=hx[n];</p>&l

110、t;p><b>  number=n;</b></p><p><b>  }</b></p><p><b>  }</b></p><p>  return number;</p><p><b>  }</b></p><p

111、>  2.CGetFeature 的一些函數(shù):</p><p>  CGetFeature::CGetFeature()</p><p><b>  {</b></p><p>  CFile TheFile("template.dat",CFile::modeRead);</p><p>  

112、CArchive ar(&TheFile,CArchive::load,40960);</p><p>  TheFile.SeekToBegin();</p><p>  for(int i=0;i<10;i++)</p><p><b>  {</b></p><p>  ar>>patte

113、rn[i].number;</p><p>  for(int n=0;n<pattern[i].number;n++)</p><p>  for(int j=0;j<25;j++)</p><p><b>  {</b></p><p>  ar>>pattern[i].feature[n][

114、j];</p><p><b>  }</b></p><p><b>  }</b></p><p>  ar.Close();</p><p>  TheFile.Close();</p><p><b>  }</b></p><

115、;p>  CGetFeature::~CGetFeature()</p><p><b>  {</b></p><p><b>  }</b></p><p>  /***************************************************************</p>

116、<p>  * 函數(shù)名稱:GetPosition()</p><p>  * 函數(shù)類型:void </p><p>  * 函數(shù)功能:搜索手寫(xiě)數(shù)字的位置,賦值給bottom,down,right,left</p><p>  ************************************************************

117、****/</p><p>  void CGetFeature::GetPosition(BYTE *m_Data)</p><p><b>  {</b></p><p>  width = 240;</p><p>  height = 240;</p><p>  intLineByte

118、s = 240;</p><p><b>  int i,j;</b></p><p>  BOOL flag;</p><p>  for(j=0;j<height;j++)</p><p><b>  {</b></p><p>  flag=FALSE;</

119、p><p>  for(i=0;i<width;i++)</p><p>  if(m_Data[j*LineBytes+i]==0)</p><p><b>  {</b></p><p>  flag=TRUE;</p><p><b>  break;</b><

120、/p><p><b>  }</b></p><p><b>  if(flag)</b></p><p><b>  break;</b></p><p><b>  }</b></p><p><b>  bottom=j

121、;</b></p><p>  for(j=height-1;j>0;j--)</p><p><b>  {</b></p><p>  flag=FALSE;</p><p>  for(i=0;i<width;i++)</p><p>  if(m_Data[j*Li

122、neBytes+i]==0)</p><p><b>  {</b></p><p>  flag=TRUE;</p><p><b>  break;</b></p><p><b>  }</b></p><p><b>  if(flag

123、)</b></p><p><b>  break;</b></p><p><b>  }</b></p><p><b>  top=j;</b></p><p>  for(i=0;i<width;i++)</p><p><

124、;b>  {</b></p><p>  flag=FALSE;</p><p>  for(j=0;j<height;j++)</p><p>  if(m_Data[j*LineBytes+i]==0)</p><p><b>  {</b></p><p>  fla

125、g=TRUE;</p><p><b>  break;</b></p><p><b>  }</b></p><p><b>  if(flag)</b></p><p><b>  break;</b></p><p><

126、;b>  }</b></p><p><b>  left=i;</b></p><p>  for(i=width-1;i>0;i--)</p><p><b>  {</b></p><p>  flag=FALSE;</p><p>  for(

127、j=0;j<height;j++)</p><p>  if(m_Data[j*LineBytes+i]==0)</p><p><b>  {</b></p><p>  flag=TRUE;</p><p><b>  break;</b></p><p><

128、b>  }</b></p><p><b>  if(flag)</b></p><p><b>  break;</b></p><p><b>  }</b></p><p><b>  right=i;</b></p>

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論