版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、<p> 本科畢業(yè)設(shè)計(論文)</p><p><b> ?。ǘ?屆)</b></p><p> 基于內(nèi)容的圖像檢索系統(tǒng)的設(shè)計與實現(xiàn)</p><p> 所在學(xué)院 </p><p> 專業(yè)班級 計算機科學(xué)與技術(shù) </p
2、><p> 學(xué)生姓名 學(xué)號 </p><p> 指導(dǎo)教師 職稱 </p><p> 完成日期 年 月 </p><p> 摘要:隨著計算機軟硬件、國際互聯(lián)網(wǎng)技術(shù)的進步,多媒體技術(shù)迅速發(fā)展,每天都會產(chǎn)生海量的圖像
3、信息,于是基于內(nèi)容的圖像檢索(content—based image retrieval,CBIR)技術(shù)應(yīng)運而生,并成為研究熱點。本文結(jié)合CBIR的關(guān)鍵技術(shù)做了如下工作:</p><p> l.討論了CBIR的背景、存在的問題、研究現(xiàn)狀;</p><p> 2.對基于內(nèi)容的圖像檢索系統(tǒng)框架及原理進行了分析研究;</p><p> 3.研究了基于內(nèi)容圖像檢索的關(guān)
4、鍵技術(shù):基于顏色檢索的空間模型、顏色直方圖、顏色集、顏色矩及顏色相關(guān)圖的特征提取算法;基于紋理檢索的統(tǒng)計、頻譜、結(jié)構(gòu)分析等的紋理特征提取方法;基于形狀檢索的傅里葉描述、不變矩等方法;基于空間關(guān)系的檢索。</p><p> 4.結(jié)合CBIR的研究,實現(xiàn)了一個基于顏色和形狀特征的位圖圖像檢索系統(tǒng),并對系統(tǒng)做了總結(jié)和展望。</p><p> 關(guān)鍵詞:基于內(nèi)容的圖像檢索;位圖;顏色特征;形狀特
5、征 </p><p> The Design and Implementation of content—based image retrieval system </p><p> Abstract:With the development of the computer software and hardware and internet techniques, the multi
6、media technologies rapid development, there comes out a mass of digital images, the content —based image retrieval(Content—Based Image Retrieval, CBIR) technology came into being, and become a research hotspot.In this pa
7、per, lots of work has been done around some key technologies of CBIR.The main work of this paper is summarized as follows:</p><p> 1. The technical background of CBIR, some key questions and the present of
8、CBIR are discussed;</p><p> 2.To analyses the framework and principles of content—based image retrieval system;</p><p> 3.Research on the key technologies of CBIR: ①Color—based image retrieval
9、: The extraction algorithms of color feature by color histogram, color set, color moments and color correlogram.; ②Texture—based image retrieval: To study the texture features extraction methods by statistical analy
10、sis, spectrum analysis and structural analysis; ③shape—based image retrieval: Research on Fourier—based shape description methods, Invariant moments and other methods; ④Image retrieval by spatial relationships;</p>
11、<p> 4.Combination of the research of content—based image retrieval, this paper has implemented a bitmap image retrieval system that integration of color and shape features and has done a summary and prospect abo
12、ut image retrieval system.</p><p> Key words: Content—Based Image Retrieval; bitmap; Color features; Texture features目錄</p><p><b> 1 引言1</b></p><p> 1.1 課題背景和意義1&
13、lt;/p><p> 1.2 基于內(nèi)容的圖像檢索技術(shù)在國內(nèi)外的發(fā)展及現(xiàn)狀1</p><p> 1.2.1 商業(yè)CBIR系統(tǒng)2</p><p> 1.2.2 研究應(yīng)用系統(tǒng)2</p><p> 1.3 當前基于內(nèi)容的圖像檢索技術(shù)存在的問題4</p><p> 1.4 開發(fā)平臺簡介4</p&g
14、t;<p> 2 基于內(nèi)容的圖像檢索技術(shù)6</p><p> 2.1 CBIR系統(tǒng)簡介6</p><p> 2.2 顏色特征6</p><p> 2.2.1 顏色空間模型6</p><p> 2.2.2 顏色特征的提取7</p><p> 2.2.3 局部顏色特征11&
15、lt;/p><p> 2.3 紋理特征12</p><p> 2.4 形狀特征13</p><p> 2.5 空間特征14</p><p> 2.6 評價標準15</p><p> 3 24位真彩色位圖16</p><p> 3.1 位圖簡介16</p>
16、;<p> 3.2 BMP圖像文件結(jié)構(gòu)16</p><p> 3.3 24位真彩色位圖簡介18</p><p> 3.4 24位真彩色位圖文件結(jié)構(gòu)18</p><p> 3.4.1 位圖文件頭18</p><p> 3.4.2 位圖信息頭18</p><p> 3.4.3
17、 位圖陣列19</p><p> 4 基于顏色和形狀的圖像檢索算法20</p><p> 4.1 基于顏色和形狀的圖像檢索結(jié)構(gòu)20</p><p> 4.2 基于顏色和形狀檢索系統(tǒng)的核心算法20</p><p> 4.2.1 RGB和HIS顏色空間的轉(zhuǎn)換20</p><p> 4.2.2
18、直方圖算法21</p><p> 4.2.3 邊緣特征提取算法23</p><p> 5 系統(tǒng)測試25</p><p> 5.1 運行界面25</p><p> 5.2 測試圖像檢索25</p><p> 6 結(jié)論與展望29</p><p> 6.1 總結(jié)2
19、9</p><p> 6.2 展望29</p><p><b> 參考文獻30</b></p><p> 致謝錯誤!未定義書簽。</p><p><b> 1 引言</b></p><p> 1.1 課題背景和意義</p><p>
20、; 隨著多媒體技術(shù)和Internet網(wǎng)絡(luò)的迅速的發(fā)展,數(shù)字圖像的容量正以驚人的速度增長。無論是軍用還是民用,靜態(tài)的還是動態(tài)的,每天都會產(chǎn)生海量的圖像信息。近年來大規(guī)模圖像庫的出現(xiàn),管理、組織和利用圖像成為一個亟待解決的技術(shù)難題。于是圖像檢索技術(shù)這種能夠快速而且準確查找訪問圖像的技術(shù)應(yīng)運而生。</p><p> 圖像檢索技術(shù)發(fā)展到現(xiàn)在經(jīng)歷了兩個階段:基于文本的檢索和基于內(nèi)容的檢索。早期70年代的圖像檢索是基于文
21、本注釋的(Text-Based Image Retrieval),該方法的實質(zhì)是把圖像檢索轉(zhuǎn)換為與該圖像對應(yīng)的文本檢索。基于內(nèi)容的圖像檢索(Content-Based Image Retrieval,簡寫為CBIR)[1]是20世紀90年代興起的新技術(shù),其實質(zhì)是圖像特征相似性匹配檢索。因其直觀(示例描述)、高效(相似性匹配檢索)、通用(與領(lǐng)域知識無關(guān))等特點,近年來在國際國內(nèi)均是一個熱門研究課題。</p><p>
22、; 隨著多媒體信息處理、數(shù)據(jù)庫及計算機互聯(lián)網(wǎng)等技術(shù)相互融合與發(fā)展,特別是隨著基于內(nèi)容檢索技術(shù)在Internet中應(yīng)用不斷深入,遠程教育系統(tǒng)開發(fā)需求的不斷擴大,以及我國以科技競爭焦點的新時代所面臨的機遇和挑戰(zhàn),在Internet環(huán)境下基于內(nèi)容的圖像檢索系統(tǒng)的設(shè)計和應(yīng)用,是一個頗具生命力的研究方向,針對這一方向深入研究,將具有重大的理論價值和廣泛的應(yīng)用前景,其成果對我國此類信息產(chǎn)業(yè)的形成與發(fā)展將起到積極的促進作用。</p>
23、<p> 1.2 基于內(nèi)容的圖像檢索技術(shù)在國內(nèi)外的發(fā)展及現(xiàn)狀</p><p> 基于內(nèi)容的圖像檢索自從十幾年前被提出以來,得到國內(nèi)外信息領(lǐng)域科技人員的廣泛重視和研究,迅速成為多媒體,特別是圖像和數(shù)據(jù)庫技術(shù)中的研究熱點之一和中國圖像工程的新類別之一[2]。</p><p> 經(jīng)過國內(nèi)外信息領(lǐng)域科技人員多年的研究,基于內(nèi)容的圖像檢索研究和應(yīng)用已經(jīng)取得了相當大的進展。不僅有大量
24、相關(guān)理論研究和技術(shù)應(yīng)用的論文發(fā)表[3],而且也出現(xiàn)了不少較成熟的應(yīng)用系統(tǒng)模型。其中,具有商用價值的著名軟件包系統(tǒng)包括IBM公司的QBIC系統(tǒng)和Virage公司開發(fā)的Virage系統(tǒng);試驗原型系統(tǒng)包括由哥倫比亞大學(xué)開發(fā)的VisualSEEK,MIT媒體實驗室開發(fā)的PhotoBook系統(tǒng),美國UCSB大學(xué)的Alexandria數(shù)字化圖書館項目中用于圖像檢索的Netra系統(tǒng)以及UIUC的MARS系統(tǒng)等等,這些系統(tǒng)在一定的領(lǐng)域得到了應(yīng)用。<
25、;/p><p> 1.2.1 商業(yè)CBIR系統(tǒng)</p><p> QBIC系統(tǒng)是是IBM開發(fā)的第一個商業(yè)化的基于內(nèi)容的圖像檢索系統(tǒng)[4],也被公認是基于圖像檢索的范例。該系統(tǒng)的框架和采用的技術(shù)對后來的圖像檢索系統(tǒng)產(chǎn)生了深刻的影響。QBIC系統(tǒng)的圖像庫中存有幾千幅圖像,同時支持基于文本方式和基于內(nèi)容的圖像檢索?;趦?nèi)容的檢索可以采用顏色、紋理和形狀特征。顏色特征采用RGB直方圖法;用粗細度
26、,對比度和方向性作為紋理特征;用圓度,偏心率,主軸方向和代數(shù)矩作為形狀特征。此外,系統(tǒng)還可以根據(jù)用戶提供的圖像草圖進行檢索,系統(tǒng)檢索的相似性采用加權(quán)的歐氏距離作為度量。后來,系統(tǒng)又添加了Query- by-painting,F(xiàn)loodfill,Edge-based等輔助工具,用戶可以利用這些工具畫出大概的查詢圖像,然后進行檢索。QBIC系統(tǒng)既可對整幅圖也可對圖像中的目標進行檢索。B.Holt和L.Hartwick就是利用QBIC系統(tǒng),成
27、功地對加州大學(xué)藝術(shù)系1000幅的圖像進行了檢索。</p><p> Virage公司開發(fā)的Virage系統(tǒng)是一種基于內(nèi)容的圖像搜索引擎。與QBIC相似,支持基于顏色、顏色布局、紋理和結(jié)構(gòu)(對象邊界信息)的可視化查詢。但Virage比QBIC更進一步,它也支持由上述四個原子查詢的任意組合。Virage技術(shù)的核心是Virage Engine以及在圖像對象層上的操作。Virage Engine主要有3方面的功能:圖像
28、分析、圖像比較和圖像管理。它將查詢引擎作為一個插件,既可用于通用的圖像查詢,也對其進行擴展并應(yīng)用到特定的領(lǐng)域。</p><p> 1.2.2 研究應(yīng)用系統(tǒng)</p><p> VisualSEEK是一種視覺特性搜索工具,其姊妹系統(tǒng)WebSEEK是面向WWW的文本/圖像搜索工具,兩者都是由哥倫比亞大學(xué)開發(fā)的。其主要的研究是圖像區(qū)域的空間關(guān)系查詢和從壓縮域中抽取視覺特性。系統(tǒng)所采用的視覺特
29、性是顏色集(Color Set)和基于小波變換(Wavelet)的紋理特性。為了加速檢索過程,他們采用了基于二叉樹的索引算法。VisuaiSEEK支持基于視覺特征和它們之間空間關(guān)系的查詢。WebSEEK是面向Web的搜索工具,包括三個主要模塊:圖像視頻收集模塊、主題分類和索引模塊、搜索瀏覽和檢索模塊,并支持基于關(guān)鍵字和視覺內(nèi)容的查詢。</p><p> Photobook系統(tǒng)著重解決預(yù)先決定的檢索準則,通過對每
30、一幅圖像存儲足夠多的信息以減少系統(tǒng)運行時的實時計算開銷。圖像在裝入時,按人臉、形狀或紋理特征分類,并且可以實現(xiàn)這些過程的自動化。一旦分類,圖像根據(jù)類別通過顯著語義特征壓縮編碼。這些較小的編碼版本采用在查詢時重構(gòu)圖像和計算附加的檢索準則,如顏色直方圖,用來匹配人臉和識別手工工具。</p><p> Netra系統(tǒng)使用顏色、紋理、形狀和空間位置信息來進行基于圖像局部屬性的區(qū)域檢索。Netra系統(tǒng)的主要研究特性是它的
31、基于Gabor過濾器的紋理分析,基于神經(jīng)網(wǎng)絡(luò)的圖像分類構(gòu)造和基于邊流的區(qū)域分塊。</p><p> MARS系統(tǒng)是由UIUC開發(fā)的支持圖像底層特征的復(fù)合檢索的圖像檢索系統(tǒng)。其特點是使用比較全面的圖像底層特征,提供基于樹結(jié)構(gòu)的多特征的組合檢索。在圖像特征方面:使用HSV空間的HS上的色彩直方圖來描述圖像的顏色;抽取圖像紋理的粗糙度和方向性以及對比度等特征描述紋理;采用圖像的規(guī)則分割(5*5)的方法對圖像特征的空間
32、分布進行描述(顏色直方圖和小波變換系數(shù));根據(jù)紋理對圖像進行分割來實現(xiàn)圖像中的對象描述,并對分割后的對象區(qū)域按照敏感性進行分組;使用Fourier描述子對圖像中對象的形狀進行描述。檢索時對上述特征分別采用相應(yīng)的相似性度量方法,最終給出綜合排名。由于采用多方面的圖像特征描述與相似性度量方法,該系統(tǒng)提供較復(fù)雜的檢索功能,如可以通過布爾表達式進行組合檢索。MARS是較早進行用戶相關(guān)反饋研究的圖像檢索系統(tǒng).</p><p&g
33、t; 國內(nèi)從1994年開始關(guān)注這方面的研究,清華大學(xué)圖形圖像研究所、中科院計算所、微軟亞洲研究院多媒體技術(shù)組、國防科技大學(xué)多媒體中心等科研機構(gòu)在這方面都取得了一定的成果[5]。</p><p> 清華大學(xué)計算機系結(jié)合國家863高技術(shù)研究發(fā)展項日“Web上基于內(nèi)容的圖像檢索”的研究,于1997年研制了一個Internet上基于內(nèi)容檢索的原型系統(tǒng)。該項目的研究目標是開發(fā)能在Internet/Intranet環(huán)境下
34、,通過友好的人機界面,以顏色、紋理等圖像特征或樣本圖像來檢索圖像的方法和工具。</p><p> 由中國科學(xué)院聲學(xué)研究所開發(fā)的圖像檢索系統(tǒng)ImageHunter主要是基于紋理和顏色特征來對圖像進行檢索的,并且實現(xiàn)了對這兩種圖像特征的綜合檢索。此外,系統(tǒng)還加入用戶反饋,通過反饋信息對參數(shù)進行不斷調(diào)整以得到更佳的效果。</p><p> iFind系統(tǒng)是微軟亞洲研究院多媒體組開發(fā)的基于內(nèi)容
35、圖像檢索的原型系統(tǒng),它提供了關(guān)鍵詞檢索、示例檢索、分類瀏覽、相關(guān)反饋和半自動標引等功能。其主要技術(shù)在于物理特征和語義信息相結(jié)合的檢索技術(shù),其特色在于基于語義傳遞的相關(guān)反饋技術(shù)。</p><p> 國防科大多媒體開發(fā)中心設(shè)計開發(fā)了一個基于內(nèi)容的視頻新聞節(jié)目瀏覽檢索系統(tǒng)-LNcwsVideoCAR(News Video Content Analysis & Representation)。該系統(tǒng)能對新聞視頻
36、的內(nèi)容進行自動分析、分類和管理,用戶在該系統(tǒng)的幫助下可以快速定位感興趣的新聞片斷,也可以快速掌握一段新聞的大意。</p><p> 1.3 當前基于內(nèi)容的圖像檢索技術(shù)存在的問題</p><p> 就目前研究現(xiàn)狀而言,CBIR技術(shù)己經(jīng)研究了十多年,有了很大發(fā)展,也有了不少成形的算法,不過其中很多關(guān)鍵問題還是遠遠沒有得到解決,總體效果不能令人滿意。目前基于內(nèi)容的圖像檢索技術(shù)仍然主要集中在
37、顏色、紋理、形狀、輪廓等底層視覺特征提取的基礎(chǔ)上,但是由于圖像特征描述和特征提取及相似性度量的復(fù)雜性,其技術(shù)仍不是很成熟,理論上有許多問題還有待解決。而且,由于計算機視覺以及人工智能發(fā)展的不成熟,及目前的關(guān)系型數(shù)據(jù)庫不同于理論上的圖像數(shù)據(jù)庫,故還有許多問題需要進行研究。主要如下[6]:</p><p> (1)查準率低。目前幾乎所有的圖像搜索引擎在查準率方面都不能達到令人滿意的程度。查詢圖像時,用戶經(jīng)常需要在返
38、回的幾百幅甚至上千幅圖像中篩選出查詢的那一幅,這是很費時和令人難以忍受的,而且有時你所用的搜索引擎根本檢不出你想要的東西。</p><p> (2)圖像的特征信息提取不夠準確。目前,基于內(nèi)容的圖像檢索技術(shù)中所普遍使用的圖像特征基本上是圖像的低層視覺特征,它們與圖像的實際語義是脫離的,低層視覺特征目前尚無能力辨別出圖像中所包含的物體。因此當用戶提交一張圖像作為查詢時,系統(tǒng)很難找到用戶真正想要尋找的圖像。</
39、p><p> (3)用戶查詢接口不理想。理想的圖像檢索系統(tǒng)中,人是主動的,用戶的查詢接口能提供豐富的交互能力,且直觀易用。而目前的圖像搜索引擎的用戶查詢接口比較單一,交互能力不強,而且有的搜索引擎只提供描述查詢接口,即關(guān)鍵詞提問框。</p><p> (4)低層視覺特征與高層語義特征間的“語義鴻溝"是目前最大的困難,具體為:</p><p> 如何從視覺
40、特征中提取出語義特征;</p><p> 如何判斷不同注釋的圖像之間是否有相似的語義;</p><p> 如何更加準確高效地進行圖像內(nèi)容的語義分類。</p><p> 基于低級特征檢索圖像被證明是不能令人滿意的,因而需要開發(fā)新的技術(shù)來支持高級查詢。真正的基于內(nèi)容的圖像檢索系統(tǒng)需要高抽象級的圖像特征。但當前的狀態(tài)是除了少數(shù)狹窄的定義明確的應(yīng)用領(lǐng)域外,大多數(shù)可用的
41、特征處于低到中級的抽象級,因此檢索結(jié)果往往很難令人滿意。</p><p> 1.4 開發(fā)平臺簡介</p><p> 本程序的開發(fā)平臺是Visual C++。面向過程C程序語言,因為它具有貼近底層、代碼運行速度快、便于優(yōu)化等優(yōu)點而廣泛應(yīng)用。而與之對應(yīng)的語言C++是應(yīng)用最廣泛的面向?qū)ο蟮某绦蛘Z言之一,它全面兼容了C,同時提供了比C更嚴格、更安全的語法 。而面向?qū)ο蟮某绦蛟O(shè)計方法,更符合人
42、的思維習(xí)慣,設(shè)計過程中合理的利用對象、類、消息、繼承、多態(tài)性、動態(tài)連接和信息封裝等,設(shè)計好類、子類運算符重載、靜態(tài)成員和友元、模板類等,可以使得程序具有很高的可重用性,使得軟件的開發(fā)和維護都更為方便[7]。</p><p> 2 基于內(nèi)容的圖像檢索技術(shù)</p><p> 2.1 CBIR系統(tǒng)簡介</p><p> 基于內(nèi)容的圖像檢索技術(shù),通過自動提取每幅圖
43、像的視覺特征如色彩、紋理、形狀等作為索引,查詢將根據(jù)圖像視覺特征的相似度進行,查詢結(jié)果按相似度大小排列并反饋給用戶,用戶通過可視化界面與系統(tǒng)進行頻繁交互,在交互過程中用戶可以根據(jù)系統(tǒng)反饋的圖像信息結(jié)合自己的目標對檢索條件不斷進行調(diào)整,及時對結(jié)果進行評估和改進,最終就可完成查詢最相似圖像的檢索。如圖2-1所示為CBIR的檢索過程[3]:</p><p> 圖2-1:CBIR的檢索過程</p><
44、;p><b> 2.2 顏色特征</b></p><p> 顏色是圖像最基本,最直觀的視覺特征。它穩(wěn)定性好,且對圖像本身的尺寸、方向和視角的依賴性較小,具有較強的魯棒性,因此顏色是CBIR系統(tǒng)中應(yīng)用最廣泛的視覺特征[8]。在現(xiàn)有的CBIR系統(tǒng)中,無一例外地將顏色特征作為圖像的首選特征[9]。顏色特征的提取首先要建立在一定的顏色空間模型上,然后利用各種特征表示方法提取圖像顏色。下面
45、將分別介紹顏色空間和提取算法。</p><p> 2.2.1 顏色空間模型</p><p> 顏色特征的提取不僅取決與圖像本身,還依賴于觀察者的視覺系統(tǒng)和個人經(jīng)驗。因此,為了準確提取表達原始圖像的顏色信息,提取算法必須在符合人類視覺系統(tǒng)的生理特征和人類觀察經(jīng)驗的視覺感知特征的特定的顏色空間內(nèi)進行。顏色空間模型的選擇直接將影響到檢索效果。目前常用的顏色空間模型有RGB顏色空間,CIE顏
46、色空間,HSV顏色空間,YUV顏色空間等。</p><p> (1)RGB顏色空間</p><p> 根據(jù)三色假說原理,任何色彩均可由紅、綠、藍三種不同的基本顏色按不同的比例混合而成。由于人眼對顏色的感知也是三維的,因此,紅、綠、藍三種顏色被稱為人類視覺的三基色。RGB顏色空間是彩色圖像最基本的顏色空間。如圖2.2所示,RGB空間基于迪卡爾坐標系,其三個軸分別代表R、G、B三個分量。所
47、有顏色都包含在第一象限內(nèi)的經(jīng)過歸一化的單位立方體中。每種顏色對應(yīng)空間中的一個點,可以由三個分量表示。原點處對應(yīng)黑色,其R、G、B分量都是0;和原點距離最遠的定點對應(yīng)白色,其R、G、B分量都是l;黑色點和白色點之間的連線上R、G、B三者等值,代表由黑色到白色的灰度值。</p><p> (2)CIE顏色空間</p><p> 為了獲得一致性的顏色空間,CIE(國際照明委員會)于1976年
48、引入Luv和Lab兩種顏色體系。其中,L代表亮度,uv和ab分別表示兩種非線性色差描述量。CIE空間可由RGB空間先進行線性變化到XYZ空間,再經(jīng)過非線性變化得到Luv和Lab[10]。</p><p> CIE顏色空間對顏色的表達比較一致,三個顏色分量較好地刻畫了顏色的色調(diào)、亮度和飽和度,但是它需要從RGB空間進行復(fù)雜的非線性變化,計算量較大,具體應(yīng)用時也不大方便。</p><p>
49、 (3)HSV顏色空間</p><p> HSV顏色空間是一種非線性色彩表示系統(tǒng)。其中H、S、V正好對應(yīng)人類感知色彩的三要素:色調(diào)、飽和度和亮度。因此,從人類心理感知的角度來說,HSV顏色空間比RGB空間更直接反映了人觀察彩色的方式,也更容易被人們接受。</p><p> 色調(diào)是指從一個物體反射過來的或透過物體的光的波長,即光的顏色。飽和度是指某種顏色的深淺或濃淡程度,與一定色調(diào)的純度
50、有關(guān)。色調(diào)和飽和度統(tǒng)稱色度。亮度是人眼感覺到的光明暗程度,對彩色來說,顏色中加入白色越多就越明亮,加入黑色越多則亮度越小。</p><p> 由于HSV顏色空間更適合人的視覺感知系統(tǒng),在彩色圖像的處理中,一般采用HSV顏色空間以適應(yīng)圖像檢索的環(huán)境。</p><p> (4)YUV顏色空間</p><p> ?、觫纛伾臻g較為簡單,其基本思想是通過損失色度信息來節(jié)
51、省存儲空間。在YUV表示方法中,Y分量的物理含義就是亮度,它包含灰度圖像的所有信息,而U、V代表色差信號。YUV顏色空間在圖像顏色信息壓縮和存儲上有很重要,的作用,但是在需要體現(xiàn)顏色的視覺聚類特征上過于粗糙,一般不適合用于顏色檢索。</p><p> 2.2.2 顏色特征的提取</p><p> 顏色特征是最直觀的視覺特征,它包含的信息量豐富,因此許多圖像檢索和圖像情感識別都是基于顏
52、色特征的。顏色特征提取往往要結(jié)合多種圖像處理技術(shù),例如圖像濾波、圖像</p><p> 平滑、銳化等。下面重點介紹顏色特征提取技術(shù)的幾種方法。</p><p><b> (1)顏色直方圖</b></p><p> 顏色直方圖是最簡單最常使用的顏色特征,主色調(diào)可以從直方圖中提取。顏色直方圖是計算高效的,并且通常對鏡頭位置的小的改變不敏感,可
53、應(yīng)用于大范圍的圖像。直接直方圖比較方法由于其緊湊表示和低復(fù)雜度成為顏色相似性測量中普遍使用的技術(shù)。對于基于直方圖的圖像內(nèi)容描述,最簡單的相似性匹配方法是直接直方圖比較。通常使用的距離函數(shù)是Minkovski范數(shù):</p><p><b> (2.1)</b></p><p> 其中、為查詢圖像和目標圖像的宣方圖,N為直方圖柄數(shù)。另一種距離為直方圖交叉方法(hist
54、ogram intersection):</p><p><b> (2.2)</b></p><p> 傳統(tǒng)直方圖方法的一個明顯缺陷是特征表示需要大量的數(shù)據(jù),增加了索引的計算復(fù)雜度。如何更緊湊地表示顏色特征并進而以較低的計算復(fù)雜度獲得與人類視覺系統(tǒng)一致的距離測度一直是一個令人感興趣的研究方向。</p><p> 考慮到人眼只能識別有限的
55、顏色,并且不能很好地區(qū)分附近的顏色,許多研究將圖像從RGB空間變換到與感覺一致的顏色空間后,通過聚類等方法,將顏色特征用一個能最好地表示圖像的小顏色子集及該顏色子集中各顏色成分;出現(xiàn)的面積等分比;構(gòu)成的二元組表示:</p><p><b> (2.3)</b></p><p> 從而提供了一個非常緊湊的特征表示。此時,每一幅圖像的顏色集并不一致,故在測量圖像之間的
56、相似性距離時,應(yīng)考慮到顏色集中各顏色之間的相似性。一般采用如下方法計算兩圖像闖的相似性距離:</p><p><b> (2.4)</b></p><p> 其中 ,而表示查詢圖像顏色特征子集各成分與目標圖像顏色特征子集各成分之間的相似性距離,該距離可通過該顏色的HSV成分距離計算得到。</p><p> 傳統(tǒng)的直方圖方法由于只能記錄圖像
57、的總體顏色組成,不包含圖像像素的空間關(guān)系的信息,將影響檢索的精度和正確性。所以具有相同直方圖的圖像可能從語義上非常不同。這個問題在大型數(shù)據(jù)庫中尤其關(guān)鍵,其中許多圖像有相似的直方圖,使它在檢索大型圖像數(shù)據(jù)庫時缺乏辨別能力并且不能很好地匹配人的視覺。而且顏色直方圖高度依賴顏色碼本的設(shè)計,因為顏色相近的顏色可能由于量化原因被劃分為不同的柄,并對量化邊界敏感,從而影響相似性距離的測量。</p><p> 在傳統(tǒng)直方圖中
58、包括空間信息的最直接的方法是計算局部直方圖,將圖像分成若干個固定交迭塊并提取每一塊的前三個顏色矩,形成圖像的特征矢量。但局部直方圖計算量大,存儲花費大,并且對平移和旋轉(zhuǎn)非常敏感。因此,人們提出了各種直方圖改進技術(shù),如考慮局部顏色空間相關(guān)以及空間相關(guān)的全局分布的相關(guān)圖、模糊直方圖、顏色一致矢量、空間—色度直方圖、聯(lián)合直方圖等。</p><p> Swain和Ballad率先用顏色直方圖來表示圖像特征,并作為圖像檢
59、索的索引[11]。顏色直方圖的主要優(yōu)點是不隨事物平移、旋轉(zhuǎn)、視點的變化而變化,和圖像的大小無關(guān),尤其特征提取相對簡單。但顏色直方圖也存在很多不足:顏色對光照非常敏感,反映在直方圖上,使得同一物體在不同光照條件下得到的顏色直方圖完全不同;顏色直方圖失去了顏色的空間信息,從而兩幅直方圖非常相近的圖像可能毫無相似之處。針對這些問題,F(xiàn)unt將顏色常量引入直方圖的統(tǒng)計,采用比值直方圖代替顏色直方圖,取得較好結(jié)果。Gevers對光照問題做了進一步
60、的研究,導(dǎo)出一些與視點、光照等條件無關(guān)的不變量。而為了描述顏色的空間特征,swain提出了后向投影方法,將顏色直方圖看成對彩色圖像中已知位置的未知對象的色彩進行標識,從而保留了色彩的部分空間信息。</p><p> 從某種意義上說,圖像的視覺特征是由各種局部特征組合而成的,因此提取圖像的局部顏色信息的區(qū)域劃分法成為顏色分析的主要研究方向。區(qū)域劃分法在一定程度上克服了直方圖的不足,但它的缺點也是明顯的:由于劃分為
61、不同區(qū)域,使得顏色特征對物體的平移、旋轉(zhuǎn)等變換敏感。因此應(yīng)用范圍受到一定的限制。</p><p><b> (2)顏色集</b></p><p> 顏色直方圖法是一種全局顏色特征提取與匹配方法,無法區(qū)分局部顏色信息。采用累加直方圖和局部累加直方圖等方法,雖然有一些改善,但效果仍然有限。有必要研究新的方法來提取空間局部顏色信息,以便在大規(guī)模圖像庫中進行更精細的顏色特
62、征匹配與索引。</p><p> 顏色集是對顏色直方圖的一種近似[12]。在該方法中,首先將圖像從RGB顏色空間轉(zhuǎn)化成視覺均衡的顏色空間(如HSV空間),并將顏色空間量化成若干個柄。然后,用色彩自動分割技術(shù)將圖像分為若干區(qū)域,每個區(qū)域用量化顏色空間的某個顏色分量來索引,從而將圖像表達為一個二進制的顏色索引集。在圖像匹配中,比較不同圖像顏色集之間的距離和色彩區(qū)域的空間關(guān)系(包括區(qū)域的分離、包含和交等操作,每種對應(yīng)
63、于不同的評分)。因為顏色集表達為二進制的特征向量,可經(jīng)構(gòu)造二分查找樹來加快檢索速度,這對于大規(guī)模的圖像集合十分有利。</p><p><b> (3)顏色矩</b></p><p> 顏色矩(color moments)是Stricker和Orengo等人[13]所提出的,認為顏色信息集中在圖像顏色的低階矩中,他們主要對每種顏色分量的一階、二階和三階矩進行統(tǒng)計。對
64、于圖像檢索來說,顏色矩是一種簡單有效的顏色特征表示方法。一階(均值),二階(方差)和三階(斜度)等顏色矩被證明可以很有效地表示圖像中的顏色分布。這三個顏色矩的數(shù)學(xué)定義如下:</p><p><b> (2.5)</b></p><p><b> (2.6)</b></p><p><b> (2.7)<
65、;/b></p><p> 其中表示像素的顏色值為的概率,N為圖像中像素點的個數(shù)。若用Q,I表示兩幅圖像,則它們矩的距離公式為:</p><p><b> (2.8)</b></p><p> 其中,是用戶指定的加權(quán)系數(shù),表示顏色通道。</p><p> 距離公式中的加權(quán)系數(shù)值可以根據(jù)具體的應(yīng)用調(diào)整。例如:
66、在圖像的光照條件相同的條件下,可設(shè)置,,這樣就提高了平均顏色的比重;但圖像的光照條件不同時,圖像的平均顏色是不可靠的,因此應(yīng)該給一個較小的值。在常用的HSV顏色空間中,希望日通道比s和懼有更嚴格的匹配,可以給H通道的矩賦予較大的權(quán)值。</p><p> 顏色矩己經(jīng)成功地應(yīng)用于許多基于內(nèi)容的圖像檢索系統(tǒng)(如QBIC),特別是對于圖像中只包括一個目標的時候非常有效,由于采用9個數(shù)值(三個顏色坐標軸,每個坐標軸包括三
67、個顏色矩),所以相對于其它顏色特征而言,采用顏色矩表示顏色特征是一個非常緊湊的表示方法。也是因為這種簡單性,使得采用顏色矩的檢索效果不是很好。通常采用顏色矩來進行第一次過濾,去掉那些在顏色上不相似的圖像,從而縮小范圍。</p><p><b> (4)顏色相關(guān)圖</b></p><p> 顏色相關(guān)圖是顏色直方圖在空間中的一種延伸[14]。這種特征不但刻畫了某一顏色
68、的像素數(shù)量占整個圖像的比例,還反映了不同顏色對之間的空間相關(guān)性。顏色相關(guān)圖是指對于顏色值為的像素點,與其相距距離為k的另一個像素點的顏色為的概率的大小。其數(shù)學(xué)定義為:設(shè)一個距離,,并且,定義圖像I的顏色相關(guān)圖為:</p><p><b> (2.9)</b></p><p> 由于顏色相關(guān)圖的計算量很大,為了減小計算量,一般只考慮相同顏色之間的相關(guān)性,即顏色自相關(guān)
69、圖為:</p><p><b> (2.10)</b></p><p> 相對于顏色直方圖和顏色聚合矢量,顏色相關(guān)圖大大提高了檢索效率,但是由于高維數(shù)而使得計算量同樣很大。</p><p> 2.2.3 局部顏色特征</p><p> 以上顏色特征是基于全局顏色特征索引捕獲了整幅圖像顏色分布的信息,但是丟失了顏
70、色的空間信息。Fuh等[15]試圖結(jié)合圖像的顏色信息和顏色的空間分布信息檢索圖像,其主要思想是從圖像中選擇一些代表顏色,然后將圖像劃分成一定的矩形區(qū)域,每個區(qū)域中以一種主要的單一顏色作為代表,兩個圖像之間的相似性是兩個圖像之間具有相似顏色區(qū)域的重疊程度。Smith和Chang采用顏色的自動分割方法,形成一個二進制顏色索引集,在圖像匹配中,比較這些圖像顏色集之間的距離。</p><p> 此外還有很多提取顏色特征
71、的方法,顏色特征抓住了圖像的主要視覺內(nèi)容,特征提取簡單方便,檢索效果也不錯,但僅用顏色不能充分表達圖像的視覺內(nèi)容,而且檢索方法的精度仍有待進一步提高。</p><p><b> 2.3 紋理特征</b></p><p> 紋理特征是一種不依賴于顏色或亮度的反映圖像中同質(zhì)現(xiàn)象的視覺特征。它是所有物體表面公有的內(nèi)在特性,包含了物體表面結(jié)構(gòu)組織排列的重要信息以及它們與
72、周圍環(huán)境的聯(lián)系。傳統(tǒng)上有三種紋理分析方法,分別是(1)統(tǒng)計分析方法,(2)頻譜分析方法,(3)結(jié)構(gòu)分析方法。本節(jié)僅對三種紋理分析方法進行簡要闡述。</p><p> (1)紋理的統(tǒng)計分析方法</p><p> 最簡單的統(tǒng)計法是利用灰度直方圖的矩來描述紋理,由物體的灰度直方圖的矩可以計算出灰度級變化統(tǒng)計指標,指標包括標準偏差、方差、傾斜度和峰度[16]。計算的公式為:</p>
73、<p><b> (2.11)</b></p><p> 公式中M是物體內(nèi)部的像素個數(shù),N灰度標度內(nèi)灰度級的個數(shù)。研究表明入眼對于二階以上的紋理區(qū)別不敏感。因此用它們作為紋理特征對訓(xùn)練集進行視覺分類不充分,但對于微紋理圖像能很好的反應(yīng)灰度的分散程度、起伏分布和反差。</p><p> ?。?)紋理的頻譜分析方法</p><p>
74、; 頻譜是圖像的重要特征,反映圖像的灰度分布。頻譜法借助于傅里葉頻譜的頻率特性來描述周期的或近乎周期的二維圖像模式的方向性。在實際的頻譜特征檢測中,為簡便起見可把頻譜轉(zhuǎn)化到極坐標系中,此時頻譜可用函數(shù)表示。和構(gòu)成整個圖像或圖像區(qū)域紋理頻譜能量的描述。對于形狀不規(guī)則的物體可以對一個或多個完全包含在物體內(nèi)的正方形進行變換,取它們頻譜的平均。</p><p> ?。?)紋理的結(jié)構(gòu)分析方法</p><
75、;p> 結(jié)構(gòu)分析方法的基本思想是認為復(fù)雜的紋理可由一些簡單的紋理基元以一定的有規(guī)律的形式重復(fù)排列組合而成。給定紋理基元h(x,y)和排列規(guī)則r(x,y),可定義紋理t(x,y )為:</p><p><b> (2.12)</b></p><p> 其中。,是脈沖函數(shù)的坐標。紋理基元描述了局部紋理特征,對整幅圖像中不同紋理基元的分布統(tǒng)計可獲得圖像的全面紋理
76、信息。</p><p><b> 2.4 形狀特征</b></p><p> 形狀特征是描述圖像內(nèi)容的又一個重要特征。 形狀常與目標聯(lián)系在一起,有一定的語義含義,因而形狀特征可以看作是比顏色或紋理要高層一些的特征。另外,對形狀的表達比對顏色和紋理的表達從本質(zhì)上要復(fù)雜的多,要獲得目標的形狀參數(shù),首先要進行圖像分割,所以形狀特征的提取會受到圖像分割效果的影響,在沒有
77、相關(guān)領(lǐng)域的知識下,自動的分割方法很難將相應(yīng)的目標區(qū)域準確的提取出來。其次,描述目標的形狀也是一個非常復(fù)雜的問題,人對形狀的感覺是視網(wǎng)膜感受和現(xiàn)實世界的知識相結(jié)合的結(jié)果。事實上,目前還沒有找到與人的主觀感覺相一致的形狀模型定義。從不同視角獲得的圖像中的目標形狀可能會有很大差別,為了準確進行形狀匹配,需要保證所提取的形狀特征不受圖像平移、縮放、旋轉(zhuǎn)等變換的影響,這在許多基于形狀的圖像檢索應(yīng)用中起著關(guān)鍵作用。</p><p
78、> 常用的形狀特征的提取方法主要有兩種:①基于邊緣的形狀特征提??;②基于區(qū)域的形狀特征提取?;谶吘壍男螤蠲枋?,如傅立葉描述符[17],曲率尺度空間、形狀信號等等,最典型的是傅立葉描述符。傅立葉描述子具有很好的平移、旋轉(zhuǎn)、伸縮等幾何不變性,適合用于對形狀的輪廓特征進行索引和檢索。其基本思想如下:把封閉輪廓上的每個點表示成復(fù)數(shù)的形式,這樣將輪廓由XY空間轉(zhuǎn)換到UV空間,則一個點k繞輪廓一周可以得到一個復(fù)數(shù)序列:</p>
79、<p><b> (2.13)</b></p><p> c(k)的離散傅立葉變換是:</p><p><b> (2.14)</b></p><p> C(w)稱為輪廓的傅立葉描述,它能夠以一定的精度描述輪廓的特性,并可以進行定量比較。設(shè)a(n)和b(n)分別代表兩個輪廓和的特征符號,則它們之間的相
80、似度可以表示為:</p><p><b> (2.15)</b></p><p> 由于基于邊緣的形狀特征提取的方法僅僅利用了形狀的邊界信息,因此不能充分表達形狀的內(nèi)部信息,此外,由于基于邊界的方法通常都假定物體有一個單一的閉合邊緣,所以不適用于那些邊界不相連的復(fù)雜圖像。</p><p> 基于區(qū)域的形狀特征提取中最典型的是形狀不變矩法。
81、利用目標所占區(qū)域的矩作為形狀描述參數(shù)是常用的形狀描述方法。在基于區(qū)域的物體形狀表示的矩描述方法中,一種有效的矩描述方法是由Hu提出的形狀不變矩(moment invariant)[18]。矩是對圖像的一種統(tǒng)計形式,它的計算要用到圖像或區(qū)域中所有相關(guān)的像素點,對一個數(shù)字圖像函數(shù),如果它分段連續(xù)且只在XY平面上的有限個點不為零,則可證明他的各階矩存在。在不變矩計算中,定義圖像的階矩為:</p><p><b&g
82、t; (2.16)</b></p><p> f(x,y)的p+q階中心矩定義為:</p><p><b> (2.17)</b></p><p> 其中,,即為區(qū)域重心坐標。</p><p> 的歸一化的中心矩為:</p><p><b> (2.18)<
83、/b></p><p> 其中,利用歸一化的二階和三階中心矩進行組合可得到7個對平移、旋轉(zhuǎn)和尺度變化不變的矩。</p><p> 基于形狀的檢索多用于當用戶粗略地畫出一個輪廓進行檢索的情況,它主要是要尋找對平移、縮放、旋轉(zhuǎn)都不變的幾何特征。除了上述幾種主流方法之外,還有很多方法可以表示形狀特征,如有限元法、小波描述符等。</p><p><b>
84、 2.5 空間特征</b></p><p> 顏色、紋理和形狀等多種特征反映的都是圖像的整體特征,而無法體現(xiàn)圖像中所包含的對象或目標。事實上,圖像中對象所在的位置和對象之間的空間關(guān)系同樣是圖像檢索中非常重要的特征。例如,藍色的天空和蔚藍的海洋的顏色在顏色直方圖上是非常接近而難以辨別的。但是,如果在檢索需求中指明是處于圖像上半部分的藍色區(qū)域,則返回的檢索結(jié)果就應(yīng)該是天空,而不是海洋。由此可見,包含
85、空間關(guān)系的圖像特征可以彌補其他圖像特征不能確定物體空間關(guān)系的不足。</p><p> 提取圖像空間關(guān)系特征可以有兩種方法:一種方法是首先對圖像進行自動分割,劃分出圖像中所包含的對象或顏色區(qū)域,然后根據(jù)這些區(qū)域提取圖像特征,并建立索引;另一種方法則簡單地將圖像均勻地劃分為若干規(guī)則子塊,然后對每個圖像子塊提取特征,并建立索引。如同形狀特征的提取與匹配,圖像中對象特征的提取與匹配涉及到圖像分割和圖像理解。尤其對自動圖
86、像分割而言,若想提取合適的對象特征,會遇到比提取合適的形狀特征更多的問題,有些問題需要借助領(lǐng)域知識或人工輔助才能解決[19]。</p><p><b> 2.6 評價標準</b></p><p> 由于檢索算法的多樣性,需要對各種算法的檢索結(jié)果進行評判,以比較其優(yōu)劣。檢索的評價方法能夠在相同的條件下找出最佳算法,能更好地改進和提高檢索方法?,F(xiàn)階段對檢索效果的評價
87、主要使用查準率和查全率兩個指標,查全率和查準率越高,說明該檢索算法的效果越好。</p><p> 查全率= (2.19)</p><p> 查準率= (2.20)</p><p> 由于這兩個指標達不到評價系統(tǒng)性能的要求,故目前又有
88、研究者提出了有效性、檢索效率、檢索率、匹配百分數(shù)等概念。但由于人對圖像內(nèi)容認知上的主觀性,使得在定義一個客觀的評價標準上存在很大困難[20]。</p><p> 3 24位真彩色位圖</p><p> 3.1 位圖簡介 </p><p> 位圖亦稱為點陣圖像或繪制圖像,是由稱作像素(圖片元素)的單個點組成的。這些點可以進行不同的排列和染色以構(gòu)成圖樣。當放大
89、位圖時,可以看見賴以構(gòu)成整個圖像的無數(shù)單個方塊。擴大位圖尺寸的效果是增多單個像素,從而使線條和形狀顯得參差不齊。然而,如果從稍遠的位置觀看它,位圖圖像的顏色和形狀又顯得是連續(xù)的。在體檢時,工作人員會給你一個本子,在這個本子上有一些圖像,而圖像都是由一個個的點組成的,這和位圖圖像其實是差不多的。由于每一個像素都是單獨染色的,您可以通過以每次一個像素的頻率操作選擇區(qū)域而產(chǎn)生近似相片的逼真效果,諸如加深陰影和加重顏色。縮小位圖尺寸也會使原圖變
90、形,因為此舉是通過減少像素來使整個圖像變小的。同樣,由于位圖圖像是以排列的像素集合體形式創(chuàng)建的,所以不能單獨操作(如移動)局部位圖。</p><p> 3.2 BMP圖像文件結(jié)構(gòu) </p><p> BMP文件由文件頭、位圖信息頭、顏色信息和圖像數(shù)據(jù)4部分組成[21]。文件頭主要包含文件的大小、文件類型、圖像數(shù)據(jù)偏離文件頭的長度等信息;位圖信息頭包含圖像的尺寸信息、圖像用幾個比特數(shù)值
91、來表示一個像素、圖像是否壓縮、圖像所用的顏色等信息。顏色信息包含圖像所用到的顏色表,顯示圖像時所需用到這個顏色來生成調(diào)色板,但如果圖像為真彩色,文件中便沒有這一塊信息,也就不需要操作調(diào)色板。文件中的數(shù)據(jù)塊表示圖像的相應(yīng)的像素值。</p><p> (1)第一部分為位圖文件頭BITMAPFILEHEADER,是一個結(jié)構(gòu)。其定義如下:</p><p> typedef struct tag
92、BITMAPFILEHEADER</p><p><b> {</b></p><p> WORD bfType; //位圖文件類型,必須為BM </p><p> DWORD bfSize; //表示位圖文件的大小,字節(jié)單位</p><p> WORD bfReserved1; //位
93、圖文件保留字,必須為0</p><p> WORD bfReserved2; //位圖文件保留字,必須為0</p><p> DWORD bfOffBits; //位圖文件到數(shù)據(jù)的偏移 </p><p> }BITMAPFILEHEADER;</p><p> ?。?)第二部分為信息頭BITMAPINFOHEADE,結(jié)構(gòu)定義如
94、下:</p><p> typedef struct tagBITMAPINFOHEADER</p><p><b> {</b></p><p> DWORD biSize; // 本結(jié)構(gòu)所占用字節(jié)數(shù)(14-17字節(jié)) </p><p> LONG biWidth; // 位圖的寬度,以像素為單位(18-21字
95、節(jié)) </p><p> LONG biHeight; // 位圖的高度,以像素為單位(22-25字節(jié)) </p><p> WORD biPlanes; // 目標設(shè)備的級別,必須為1(26-27字節(jié)) </p><p> WORD biBitCount;// 每個像素所需的位數(shù),必須是1(雙色),(28-29字節(jié)) </p><p>
96、; // 4(16色),8(256色)或24(真彩色)之一 </p><p> DWORD biCompression; // 位圖壓縮類型,必須是 0(不壓縮),(30-33字節(jié)) </p><p> // 1(BI_RLE8壓縮類型)或2(BI_RLE4壓縮類型)之一 </p><p> DWORD biSizeImage; // 位圖的大小,以字節(jié)為單
97、位(34-37字節(jié)) </p><p> LONG biXPelsPerMeter; // 位圖水平分辨率,每米像素數(shù)(38-41字節(jié)) </p><p> LONG biYPelsPerMeter; // 位圖垂直分辨率,每米像素數(shù)(42-45字節(jié)) </p><p> DWORD biClrUsed;// 位圖實際使用的顏色表中的顏色數(shù)(46-49字節(jié))
98、</p><p> DWORD biClrImportant;// 位圖顯示過程中重要的顏色數(shù)(50-53字節(jié))</p><p> (3)顏色表用于說明位圖中的顏色,它有若干個表項,每一個表項是一個RGBQUAD類型的結(jié)構(gòu),定義一種顏色。RGBQUAD結(jié)構(gòu)的定義如下: </p><p> typedef struct tagRGBQUAD { </p&g
99、t;<p> BYTE rgbBlue;// 藍色的亮度(值范圍為0-255) </p><p> BYTE rgbGreen; // 綠色的亮度(值范圍為0-255) </p><p> BYTE rgbRed; // 紅色的亮度(值范圍為0-255) </p><p> BYTE rgbReserved;// 保留,必須為0 </p&
100、gt;<p> } RGBQUAD; </p><p> 顏色表中RGBQUAD結(jié)構(gòu)數(shù)據(jù)的個數(shù)有biBitCount來確定: 當biBitCount=1,4,8時,分別有2,16,256個表項; 當biBitCount=24時,沒有顏色表項。 </p><p> 位圖信息頭和顏色表組成位圖信息,BITMAPINFO結(jié)構(gòu)定義如下: </p><p>
101、; typedef struct tagBITMAPINFO { </p><p> BITMAPINFOHEADER bmiHeader; // 位圖信息頭 </p><p> RGBQUAD bmiColors[1]; // 顏色表 </p><p> } BITMAPINFO;</p><p> ?。?)位圖數(shù)據(jù)記錄了位圖的每一
102、個像素值,記錄順序是在掃描行內(nèi)是從左到右,掃描行之間是從下到上。位圖的一個像素值所占的字節(jié)數(shù): </p><p> 當biBitCount=1時,8個像素占1個字節(jié); </p><p> 當biBitCount=4時,2個像素占1個字節(jié); </p><p> 當biBitCount=8時,1個像素占1個字節(jié); </p><p> 當b
103、iBitCount=24時,1個像素占3個字節(jié); </p><p> Windows規(guī)定一個掃描行所占的字節(jié)數(shù)必須是 4的倍數(shù)(即以long為單位),不足的以0填充, biSizeImage = ((((bi.biWidth * bi.biBitCount) + 31) & ~31) / 8) * bi.biHeight;雖然有BI_TRLE8及BI_RLE4兩種壓縮格式,但一般都采用不壓縮存儲。<
104、;/p><p> 3.3 24位真彩色位圖簡介</p><p> 24位真彩色位圖,是一種比較特殊的位圖,它的圖像文件結(jié)構(gòu)特點為:①每個文件只能非壓縮地存放一幅彩色圖像;②文件頭由54個字節(jié)的數(shù)據(jù)段組成,其中包含有該位圖文件的類型、大小、圖像尺寸及打印格式等;③從第55個字節(jié)開始,是該文件的圖像數(shù)據(jù)部分,數(shù)據(jù)的排列順序以圖像的左下角為起點,從左到右、從下到上,其每個像素由3個字節(jié)數(shù)據(jù)構(gòu)成
105、,由它們描述圖像一個像素點的顏色信息,這三個字節(jié)分別代表藍、綠、紅三基色在此像素中的亮度,若某連續(xù)三個字節(jié)為:00H,00H,F(xiàn)FH,則表示該像素的顏色為純紅色。</p><p> 3.4 24位真彩色位圖文件結(jié)構(gòu)</p><p> 24 位真彩色的BMP圖文件是由三個部分組成的:位圖文件頭、位圖信息頭、位圖陣列三個部分組成的。</p><p> 3.4.1
106、 位圖文件頭</p><p> 位圖文件頭就是用來標志這個位圖文件一些信息比如:大小、類型等等。共有14個字節(jié)的信息。下面我們就分別對這14個字節(jié)的信息分別說明一下它們所代表的意義。424D為位圖的標志。如果轉(zhuǎn)換成ASCII碼的話就是BM。1E 2B 06 00 這個雙字信息代表著位圖文件的總字節(jié)數(shù),如果把它轉(zhuǎn)換化十進制的話就是(00062B1E)H=(404254)D,也就是這位圖文件的大小是401167個
107、字節(jié)。00 00 00 00 為保留字。36 00 00 00 表示位圖陣列的起始位置,(00000036)H=(54)D,也就是從第54個字節(jié)起就是這幅圖的位圖陣列了。</p><p> 3.4.2 位圖信息頭</p><p> 位圖信息頭記錄著一些關(guān)于這幅圖的一些基本信息,比如:高度、寬度、分辨率等信息。28 00 00 00 表示著位圖信息頭的長度,(00000028)H=(4
108、0)D,即位圖信息頭的長度占40個字節(jié)。39 01 00 00 表示位圖的寬度,(00000139)H=(313)D表示位圖的寬度為313個像素。C8 00 00 00 表示位圖的高度,(000000C8)H=(200)D表示位圖的高度為200個像素。01 00 表示位圖設(shè)備級別。18 00 位圖的色彩級別(0018)H=(24)D,即表示24位真彩色。00 00 00 00 表示壓縮類型,零表示不壓縮。00 00 00 00 位圖陣列
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于內(nèi)容的圖像檢索系統(tǒng)的設(shè)計與實現(xiàn)【文獻綜述】
- 基于內(nèi)容的圖像檢索系統(tǒng)的設(shè)計與實現(xiàn)【畢業(yè)設(shè)計】
- 基于內(nèi)容的圖像檢索系統(tǒng)的設(shè)計與實現(xiàn)【開題報告】
- 基于內(nèi)容圖像檢索系統(tǒng)設(shè)計與實現(xiàn).pdf
- 基于內(nèi)容的服裝圖像檢索系統(tǒng)設(shè)計與實現(xiàn).pdf
- 基于內(nèi)容的文檔圖像檢索系統(tǒng)設(shè)計與實現(xiàn).pdf
- 基于內(nèi)容的真菌圖像檢索系統(tǒng)設(shè)計與實現(xiàn).pdf
- 基于情感圖像檢索系統(tǒng)的設(shè)計與實現(xiàn)
- 基于情感圖像檢索系統(tǒng)的設(shè)計與實現(xiàn)
- 基于內(nèi)容與情感語義圖像檢索系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 基于內(nèi)容特征的圖像檢索系統(tǒng)設(shè)計.pdf
- 基于情感圖像檢索系統(tǒng)的設(shè)計與實現(xiàn)
- 基于內(nèi)容的圖像檢索系統(tǒng)的設(shè)計與研究.pdf
- 基于內(nèi)容的漢語文獻信息檢索系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 基于內(nèi)容的服裝檢索系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 一種基于內(nèi)容的圖像檢索系統(tǒng)平臺的設(shè)計與實現(xiàn).pdf
- 云計算平臺下基于內(nèi)容的圖像檢索系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 基于.net人才招聘系統(tǒng)的設(shè)計與實現(xiàn)【畢業(yè)設(shè)計+開題報告+文獻綜述】
- 基于網(wǎng)絡(luò)的圖像檢索系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 基于內(nèi)容的圖像檢索系統(tǒng).pdf
評論
0/150
提交評論