版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、<p> 基于人眼視覺特性的圖像增強算法研究</p><p> 摘 要:利用圖像增強技術(shù),可以使圖像獲得更佳的視覺效果,提高人眼對信息的辨別能力,另一方面,圖像增強作為一種預處理技術(shù),能使處理后的圖像比原圖像更適合于參數(shù)估計、圖像分割和目標識別等后續(xù)圖像分析工作。因此,圖像增強技術(shù)的研究一直是圖像處理的一項重要內(nèi)容。但傳統(tǒng)的基于直方圖的圖像增強方法存在以下幾個問題:1)傳統(tǒng)直方圖灰度級統(tǒng)計量與信息量
2、存在不一致問題;2)傳統(tǒng)直方圖均衡方法在灰度級調(diào)整過程中,沒有充分利用視覺敏感區(qū)段;3)沒有針對圖像內(nèi)容多變特點,自適應地獲取灰度級調(diào)整的優(yōu)化配置參數(shù)。針對上述問題本文展開以下幾個方面研究:</p><p> 首先,針對傳統(tǒng)直方圖對圖像信息的描述存在不足,本文提出了一種新的基于視覺注意機制的灰度級信息量直方圖構(gòu)造方法。這種新的直方圖在灰度級統(tǒng)計過程中同時考慮各灰度級數(shù)量和空間分布情況,采用視覺注意機制計算模型測
3、算出不同位置灰度級的重要性(或顯著性),并依據(jù)各像素灰度級的重要性進行加權(quán)統(tǒng)計,使得統(tǒng)計結(jié)果可以客觀反映各灰度級對圖像信息刻畫所起的作用。</p><p> 其次,在灰度級調(diào)整過程中考慮人眼視覺感知的非線性特性,并針對其特點提出了將不同比例的灰度級信息量分配至不同的視覺敏感度區(qū)段。其分配原則遵循敏感度大的區(qū)段分配較多的信息量,同時為避免主導灰度級在直方圖拉伸處理中占用較大范圍的灰度級空間,本文利用人眼感知能力曲
4、線約束主導灰度級動態(tài)范圍。</p><p> 最后,由于圖像內(nèi)容存在多變的特點,為了獲取更好的圖像增強效果,有必要對各視覺敏感度區(qū)段的信息量分配比例做一定的調(diào)節(jié),為此本文提出了依據(jù)圖像增強質(zhì)量客觀評估算法的分析結(jié)果,自適應地獲取最佳調(diào)節(jié)參數(shù)。圖像增強質(zhì)量客觀評估算法是依據(jù)視覺感知模型設(shè)計的,大量測試結(jié)果表明,客觀評估算法的分析結(jié)果與主觀評估結(jié)果基本吻合。</p><p> 關(guān)鍵詞:圖像
5、增強;視覺注意機制;人眼調(diào)制傳遞函數(shù);臨界可見偏差;圖像質(zhì)量評價</p><p><b> 引言</b></p><p> 1.1研究背景及意義</p><p> 在一個圖像系統(tǒng)中,從圖像的獲取,到圖像的發(fā)送、傳輸、接收、輸出(顯示)、復制等等,每一個環(huán)節(jié)都會產(chǎn)生干擾,都會使圖像質(zhì)量降低,不能很好的貼合人眼直接觀察到的圖像。例如,攝像時,
6、由于光學系統(tǒng)失真、相對運動、大氣湍流等都會使圖像模糊;醫(yī)學上,由于受到人體的器官、組織、光照等各個方面的影響,拍到的照片總是不盡人意,很難識別病變組織與正常組織,做出早期診斷。因此,如何對這些“降質(zhì)”圖像或受到噪聲污染的質(zhì)量不太滿意的圖像進行處理,以符合人們的要求,例如盡可能恢復原貌,改善圖像的視覺效果,突出有用的目標等,具有廣泛的應用前景和工程價值。這也是圖像處理的一般要求。圖像增強是一種常用的圖像處理方法,其目的是將圖像中感興趣的部
7、分盡可能突現(xiàn)出來。例如一幅偵察圖像甚至有可能是經(jīng)過各種欺騙和偽裝后的偵察圖像,在這類圖像中,目標和背景可能混淆不清,很難區(qū)別。如何從中識別出人們感興趣的目標,如機場、跑道、飛機、建筑物等,就需要進行增強處理。</p><p> 圖像增強處理的應用已經(jīng)滲透到醫(yī)學診斷、航天航空、軍事偵察、指紋識別、無損探傷等領(lǐng)域。例如:</p><p> ?。?)在醫(yī)學應用當中的血管造影技術(shù),由于心臟的劇烈
8、運動,并且是非剛體運動,造成影像圖與原始血管圖的匹配非常困難。如果能夠先對造影圖像進行增強濾波處理,可以去除非感興趣器官(如肌肉、骨骼等)對X射線吸收形成的背影圖像,則有利于提高醫(yī)生臨床診斷的準確性。對X射線圖像、CT圖像、內(nèi)窺鏡圖像等進行增強,使醫(yī)生更容易從中確定病變區(qū)域。</p><p> ?。?)紅外技術(shù)在軍事及人們?nèi)粘I钪杏兄絹碓綇V泛的應用。由于紅外探照燈以及紅外探測器件的限制,紅外成像系統(tǒng)的成像效果
9、不夠理想。在民用監(jiān)測應用中,主要表現(xiàn)在夜視距離近,圖像特征信息不明確等方面。為使夜視距離達到監(jiān)測要求并使圖像更適合于人眼觀測、適用于圖像后續(xù)目標識別及跟蹤處理,有必要對紅外圖像低照度采集來增長主動式紅外夜視系統(tǒng)的夜視距離,對圖像進行增強及目標分割處理來增強紅外圖像視覺效果。</p><p> ?。?)在航天遙感和航空遙感應用中,由于遙感圖像的獲取平臺高,很容易受到自然因素的影響,尤其是可見光波段,如天氣、云霧等都
10、能使圖像質(zhì)量下降,因此獲得的圖像有的會出現(xiàn)對比度低、圖像模糊等現(xiàn)象;有的圖像總體視覺效果較好,但是對所需信息,如邊緣部分或線狀物不夠突出;還有的圖像波段數(shù)據(jù)量大,例如TM圖像,而且各波段之間存在一定的相關(guān)性,為進一步處理造成困難。所以,可通過圖像增強技術(shù),改善圖像質(zhì)量,提高圖像目標視覺效果,突出所需要的信息,壓縮圖像數(shù)據(jù)量,為進一步的圖像分析判讀做好預處理工作。</p><p> ?。?)在煤礦工業(yè)電視系統(tǒng)中采用
11、增強處理來提高工業(yè)電視圖像的清晰度,克服光線不足、灰塵等原因帶來的圖像模糊、偏差等現(xiàn)象,減少電視系統(tǒng)維護量。</p><p> 總之,圖像增強技術(shù)的快速發(fā)展同它廣泛的應用是分不開的,發(fā)展的動力來自不斷涌現(xiàn)的新的應用,可以預料,在未來社會中,圖像增強技術(shù)將會發(fā)揮更大的作用。</p><p> 1.2 圖像增強的研究現(xiàn)狀</p><p> 圖像增強的主要目的是改善
12、圖像的視覺質(zhì)量。對于一幅給定的圖像,圖像增強可以根據(jù)圖像的模糊情況和應用場合,采用某種特殊的技術(shù)來突出圖像中的某些信息,削弱或消除某些無用的信息,從而有目的的強調(diào)圖像的整體或局部特征 。經(jīng)過多年研究,圖像增強技術(shù)已經(jīng)取得了長足的進步,到目前為止,已經(jīng)形成了多種理論算法。</p><p> 目前常用的增強技術(shù)根據(jù)其處理所進行的空間不同,可分為基于空間域(圖像域)的方法和基于頻率域(變換域)的方法兩種。其中空間域增
13、強方法包括點處理和模板處理兩種,點處理增強常用的方法有:直接灰度變換、直方圖處理、圖像間運算等等,模板處理增強常用的方法有:線性平滑濾波、非線性平滑濾波、線性銳化濾波和非線性銳化濾波等;頻域增強方法有低通濾波、高通濾波、帶阻濾波、同態(tài)濾波等。低通濾波能夠平滑圖像,將像素灰度值突變的細節(jié)濾掉;而高通濾波能夠增強圖像,保留像素突變的細節(jié)。</p><p> 經(jīng)典的空間域和變換域增強方法都可以在絕大多數(shù)“數(shù)字圖像處理
14、”教材中找到,為此不再贅述。以下將介紹空間域和變換域一些較新的研究進展。</p><p> 1.2.1 基于直方圖處理的圖像增強算法</p><p> 由于直方圖數(shù)據(jù)描述簡單,操作簡便,且易于編程實現(xiàn),因此在圖像處理、模式分析與識別等多個領(lǐng)域得到了廣泛的應用。以直方圖為基礎(chǔ)的增強算法研究是空間域算法的主流研究方向。研究人員在直方圖基礎(chǔ)上,結(jié)合不同的應用對象和分析要求,提出了多種增強算法
15、,這些算法主要分為兩大類:全局直方圖算法和局部(自適應)直方圖算法。全局直方圖均衡(Global Histogram Equalization, GHE)是全局算法中的代表性成果,其基本思想是依據(jù)直方圖的統(tǒng)計結(jié)果,相應地分配灰度級的動態(tài)范圍。雖然這種算法的增強效果并不是最優(yōu)的,但這種直方圖均衡的增強思想?yún)s被其它算法廣泛采用。</p><p> 當圖像的灰度級級數(shù)較多,且分布較均勻時,GHE算法的增強效果不明顯,
16、針對以上問題,Pizer等人將GHE算法推廣應用于圖像的局部分析,提出了局部自適應直方圖增強算法(Adaptive Histogram Equalization,AHE)。AHE算法是依據(jù)像素局部鄰域的直方圖統(tǒng)計結(jié)果,確定該像素灰度級映射值,使局部對比度明顯拉伸,然而該算法計算復雜度太大、對噪聲敏感、平滑區(qū)過增強等問題較為突出。針對這些問題,很多學者提出了多種改進的方案。</p><p> 自適應算法主要是依據(jù)
17、圖像的局部信息進行調(diào)整,這使得某些所占空間區(qū)域較大的物體表面形態(tài)發(fā)生了較大的變化。為了克服以上問題,Caselles等人提出了保形對比度增強方法(Shape Preserving Contrast Enhancement,SPCE)。算法采用局部直方圖均衡算法來增強對比度,同時保持圖像的水平集(Level-sets)不變,從而使增強后圖像中的物體區(qū)域形狀保持不變。</p><p> 以上算法都是在不改變直方圖統(tǒng)
18、計方式上做出的,但由于傳統(tǒng)直方圖存在明顯缺陷,即完全丟失了像素的位置信息,使得這些算法的性能受到了一定程度的影響。后面將對傳統(tǒng)直方圖數(shù)據(jù)描述方式的局限性進行深入地分析。</p><p> 1.2.2基于多尺度分析的圖像增強方法</p><p> 近年來在變換域算法研究方面也取得了一些可喜的進展,其中較為突出的是基于多尺度分析的增強算法。多尺度分析又稱為多分辨率分析,它是由Mallat首
19、先提出來的。近幾年來,以小波變換為代表的多尺度分析方法備受科學技術(shù)界的重視,它不僅在數(shù)學上已經(jīng)形成一個新的分支,而且在應用上,如信號處理和圖像處理,被認為是近年來分析工具及方法上的重大突破。原則上講,凡傳統(tǒng)使用傅里葉分析的方法都可以用小波分析來代替。小波分析在時域和頻域上都具有很好的局部特性,而且由于對高頻信號采取逐漸精細的時域或空域步長,從而可以聚焦到分析對象的任意細節(jié)。在圖像處理和計算機視覺中,通常要進行分析和識別的圖像結(jié)構(gòu)有著不同
20、的大小,一般情況下不能事先定義一個分析圖像的最優(yōu)分辨率,因此采用多分辨率分析將原始圖像分為不同分辨率上的幾個信號,然后選擇合適的分辨率或同時在各級分辨率上處理這個信號,從而達到多尺度分析的目的,利用這些不同分辨率上的信號,重構(gòu)的信號就能夠在一些方面表現(xiàn)出比原始信號更好的性能。近幾年來使用多尺度分析思想來增強這些圖像已經(jīng)引起眾多研究者的關(guān)注,并且在理論和應用上取得了一些有價值的結(jié)果。</p><p> 最近,一種
21、自適應的圖像去噪、保留并增強邊緣信息的方法已經(jīng)被Jung等人提出。這種方法使用冗余的小波變換將圖像進行多分辨率分解,在每一級分辨率上,把對應噪聲和邊緣的小波系數(shù)用Gaussian函數(shù)建模,然后采用一種軟閾值的方法,即小波收縮(Wavelet Shrinkage),處理這些系數(shù),在考慮了保留邊緣的幾何約束后,用這些處理過的小波系數(shù)進行重構(gòu)就可以獲得具有很好增強效果的圖像。為了驗證這種方法的有效性,Jung對具有嚴重噪聲污染的Lena圖像、
22、監(jiān)控圖像和自然場景圖像進行了增強處理,結(jié)果表明這種方法是有效的。</p><p> 基于多尺度分析思想的圖像增強方法主要應用的場合通常是一些特殊圖像,如醫(yī)學圖像、衛(wèi)星遙感圖像、紋理圖像和嚴重噪聲污染的圖像等。這些方法的基本思想都是將圖像先進行分解,然后對分解后的圖像進行處理,最后重構(gòu)圖像,從而達到某種處理效果。但以上算法面臨的主要問題是很難確定合適的分析尺度及不同尺度下的最優(yōu)調(diào)節(jié)參數(shù)。</p>&
23、lt;p> 目前尚無統(tǒng)一的衡量圖像增強質(zhì)量的通用標準。在圖像增強的方法使用上,可以使用一種增強方法,也可以使用多種方法混合使用,只要達到需要的效果即</p><p><b> 可。</b></p><p> 1.3 研究內(nèi)容和目的</p><p> 直方圖均衡化依據(jù)各灰度級的統(tǒng)計量相應地調(diào)整圖像的灰度值動態(tài)范圍,即拉大統(tǒng)計量較大的
24、灰度級級差,達到圖像增強的目的。但這類方法存在三個主要的缺陷:1)傳統(tǒng)直方圖灰度級統(tǒng)計量與信息量存在不一致問題;2)傳統(tǒng)直方圖均衡方法在灰度級調(diào)整過程中,沒有充分利用視覺敏感區(qū)段;3)沒有針對圖像內(nèi)容多變特點,自適應地獲取灰度級調(diào)整的優(yōu)化配置參數(shù)。</p><p> 首先,在直方圖均衡化處理過程中,灰度級直方圖只是簡單地數(shù)量上的統(tǒng)計,而丟失了灰度級的位置信息,使得統(tǒng)計結(jié)果無法客觀反映各灰度級對刻畫圖像信息所起的
25、作用,即出現(xiàn)灰度級統(tǒng)計量與信息量不一致問題。比如,在圖像的平滑區(qū)或背景區(qū)內(nèi)某些灰度級的統(tǒng)計值雖然很大,但這些灰度級所刻畫的信息卻很少(或很簡單)。因此本文提出一種新的基于視覺注意機制的灰度級信息量直方圖構(gòu)造方法。該直方圖綜合考慮灰度級的個數(shù)和空間分布,并在灰度級統(tǒng)計過程中注重保留重要信息區(qū)的灰度級統(tǒng)計量,同時削弱平滑區(qū)或背景區(qū)的統(tǒng)計量,使得統(tǒng)計結(jié)果可較好地反映各灰度級對刻畫信息所起的作用。</p><p> 另
26、外,傳統(tǒng)的直方圖均衡化方法是在假定不同的灰度級的視覺敏感度一樣的基礎(chǔ)上進行的,但研究發(fā)現(xiàn),人眼視覺系統(tǒng)的感知特性是非線性的,即在不同的灰度級范圍內(nèi),視覺敏感度是不同的,在暗區(qū),敏感度低,在亮區(qū),敏感度高,因此傳統(tǒng)的直方圖均衡化方法在分配信息時沒有充分利用視覺敏感度。為解決這個問題,本文把灰度級按照視覺感知特性分為三個部分:最弱感知區(qū)、最強感知區(qū)及次強感知區(qū),同時把圖像中大量信息區(qū)的灰度級分配在最強感知區(qū),把含有少量信息的區(qū)域的灰度級分配
27、在最弱感知區(qū)及次強感知區(qū),但次強感知區(qū)分配到的信息量要比最弱感知區(qū)多,這樣可以拉伸圖像的灰度層次,提高圖像的對比度,使增強后的圖像獲得滿意的視覺效果。</p><p> 由上一段得知,需要把直方圖劃分為三個區(qū)域,即大量信息區(qū)與兩個少量信息區(qū),信息區(qū)的劃分,尤其是最大信息區(qū)與最小信息區(qū)的劃分,不能總是依靠人眼,這樣算法移植性不高,而且由于圖像信息分布的多樣性,也不能固定閾值,比如,有的圖像灰度級較多且分布較均勻,
28、則閾值不能太小,因為如果分配到最強感知區(qū)的信息量太多,則會有大量的信息分享有限的灰度級空間,導致小于人眼感知能力曲線的信息量增加,反而不利于感知圖像;有的圖像灰度級較少,這時閾值不能太大,因為本文期望能把大量信息盡可能的分配在最強敏感區(qū)及次強敏感區(qū),也就是在不損害且充分利用最強感知區(qū)信息的情況下,把盡可能少的信息分配給最弱感知區(qū)。為了自適應的獲取使圖像增強效果最佳的閾值,本文根據(jù)視覺感知模型設(shè)計了一個簡單有效的圖像增強質(zhì)量客觀評價算法,
29、該算法除了能對增強效果進行評價,也可以對參數(shù)進行自適應調(diào)節(jié),從而獲得最佳調(diào)節(jié)參數(shù)。</p><p><b> 人眼視覺系統(tǒng)概述</b></p><p> 圖像信息是通過人的視覺來接收的。在實際應用中,許多圖像處理與分析的目的就是改善圖像的視覺效果或處理后以便于人們對圖像的分析,所以了解人的視覺系統(tǒng)特性及視覺信息處理特性在觀察圖像或判讀圖像時的某些現(xiàn)象和特性是有必要
30、的。視覺是人類的主要感覺來源,人類認識外界信息中80%來自視覺。視覺器官“眼睛”接受外界的刺激信息,而大腦對這些信息通過復雜的機理進行處理和解釋,使這些刺激具有明確的物理意義。視覺系統(tǒng)是一個復雜的完善的信息獲取和分析系統(tǒng),它涉及許多學科,但目前尚有許多感知機理仍不清楚,這也是阻礙圖像處理發(fā)展的重要原因。因為現(xiàn)有的大多圖像處理算法都或多或少地引入了人眼視覺系統(tǒng),為便于理解,本章首先就人眼構(gòu)造及光學特性、人眼視覺感知系統(tǒng)作簡單介紹。<
31、/p><p> 人眼構(gòu)造及其光學感知特性</p><p> 人眼的結(jié)構(gòu)和照相機相似,如圖2.1所示。眼睛的前部為一圓球,其平均直</p><p> 圖 2.1 人眼的構(gòu)造</p><p> 徑為20mm左右,它由三層薄膜包著,即角膜和鞏膜外殼、脈絡(luò)膜和視網(wǎng)膜。它的正前方六分之一是透明的角膜,角膜是一種硬而透明的組織,它蓋著眼睛的前表面,鞏
32、膜與角膜連在一起,鞏膜是一層包圍著眼球剩余部分的不透明的膜。脈絡(luò)膜位于鞏膜的里邊,這層膜包含有血管網(wǎng),它是眼睛的重要滋養(yǎng)源,脈絡(luò)膜外殼著色很重,因此有助于減少進入眼內(nèi)的外來光和眼球內(nèi)的回射。在脈絡(luò)膜的最前面角膜的后面被分為睫狀體和虹膜。虹膜中間有一小圓孔稱為瞳孔。在虹膜環(huán)狀肌的作用下,瞳孔的直徑可在2~8mm間調(diào)節(jié),從而控制進入人眼的光通量,起到照相機光圈調(diào)節(jié)的作用。瞳孔后面是一扁球形的彈性透明體,稱為晶狀體,相當于照相機鏡頭的作用。它
33、在睫狀肌的作用下,可以調(diào)節(jié)曲率改變焦距,使不同距離的景物可以在視網(wǎng)膜上成像。當晶狀體的折射能力由最小變到最大時,晶狀體的聚集中心與視網(wǎng)膜之間的距離約由17mm縮小到14mm。當眼睛聚集到遠于3m的物體時,晶狀體的折射能力最弱,當聚集到非常近的物體時,其折射能力最強。</p><p> 眼睛最里層的膜是視網(wǎng)膜,它布滿在整個眼球后部的內(nèi)壁上,當眼球適當聚集時,從眼睛的外部物體來的光就在視網(wǎng)膜上成像。整個視網(wǎng)膜表面上
34、分布的分離的光接收器造成了圖案。這種光接收器可分為兩類:錐狀體和桿狀體。</p><p> 錐狀細胞的直徑為2~6μ m,長約40 μm,有500萬個。它們主要位于視網(wǎng)膜的中間部分,叫做中央凹,即黃斑區(qū),它們主要是在強光下檢測亮度和顏色信息。每個錐狀細胞連接著一個視神經(jīng)末梢,因此黃斑區(qū)的分辨率極高,從而使人所感興趣物體的像落在視網(wǎng)膜的中央凹上,這樣人們利用這些錐體細胞就能充分地識別圖像的細節(jié),形成人眼的明視。在
35、視網(wǎng)膜的其他部分分布著桿狀細胞,直徑約2~~7004μ m,長約60 μm,共有7500~15000萬個。由于分布面積較大且多個桿狀細胞與一個視覺神經(jīng)末梢相連,使接收器能夠識別細節(jié)的量減少了,即對細分辨率較低,只能給出視野中一般的輪廓,形成人眼的暗視。它們能在弱光下檢測亮度信息,但沒有色彩的感覺。例如,在白天呈現(xiàn)鮮明顏色的物體,在月光下卻沒有顏色,這是因為只有桿狀細胞受到了刺激,而桿狀沒有色彩的感覺。</p><p&
36、gt; 視錐細胞和視桿細胞統(tǒng)稱視細胞。圖2.2表示視細胞在視網(wǎng)膜上的分布情況。以眼球水平方向上的圓周角作為水平距離的度量,黃斑中心在鼻側(cè)的地方是視神經(jīng)的匯聚點,沒有視細胞就形成“盲點”。對于落入盲點的圖像人眼無法看到。</p><p> 圖 2.2 視細胞在視網(wǎng)膜上的應用</p><p> 從生理學角度看視覺有以下顯著特性:</p><p> ?。?)分辨率人
37、眼對于不同空間細節(jié)的分辨能力是變化的,視覺空間頻率響應具有帶通濾波器的性質(zhì),高頻端的靈敏度要低于低頻端的靈敏度,對高頻區(qū)域的噪聲或失真也不太敏感。</p><p> ?。?)同時對比度由于人眼對亮度有很強的適應性,因此很難精確判斷刺激的絕對亮度。即使有相同的亮度,由于其背景亮度不同,人眼所感受的主觀亮度是不一樣的。</p><p> ?。?)對比靈敏度實驗表明,人眼辨別亮度差的能力是同周圍
38、環(huán)境以及照度本身的大小有關(guān),即視覺對亮度偏差的敏感程度隨背景亮度變化呈非線性變化,總的來說在高亮度背景區(qū)人眼對亮度偏差的辨別力相比在低亮度區(qū)要強。把主觀上可識別的最小亮度差稱為亮度的可辨別閾值。</p><p> ?。?)視覺掩蔽效應當存在多個刺激量時,它們之間會相互干擾,導致視覺閾值的變化,它有多種表現(xiàn)形式,人眼對損傷的敏感度在非常亮或者非常暗的區(qū)域會下降,在圖像空間域變化大的區(qū)域會比變化小的區(qū)域低。</
39、p><p> 2.2 人眼視覺感知系統(tǒng)</p><p> 2.2.1 視覺信息傳遞過程</p><p> 視覺是一個根據(jù)圖像發(fā)現(xiàn)周圍景物中有什么物體和物體在什么地方的過程,也就是從圖像獲得對觀察者有用的符號描述的過程。因此視覺是一個有明確輸入和輸出的信息處理問題。</p><p> 人類視覺信息處理系統(tǒng)是由視覺器官、視覺通路和多級視覺中樞
40、組成,實現(xiàn)著視覺信息的產(chǎn)生、傳遞和處理??紤]到其中的視覺信息處理過程的復雜性,研究學者又將其劃分為視感覺處理和視知覺處理兩個階段。這樣,人眼視覺信息的處理則如圖2.3所示。</p><p> 圖 2.3 人眼視覺的信息傳遞過程</p><p><b> 2.2.2 感受野</b></p><p> 研究發(fā)現(xiàn),視覺通路上各個層次的神經(jīng)元感受
41、野尺寸是不同的,神經(jīng)元的層次越深入,其感受野的尺寸就越大,比如,視網(wǎng)膜中心(Fovea)具有較小的感受野,外周(Periphery)的則較大,這種層次體系被稱為感受野等級結(jié)構(gòu)。視網(wǎng)膜神經(jīng)節(jié)細胞和外側(cè)膝狀體神經(jīng)元的感受野呈同心圓中心-外周頡頏形式,即在感受野的中心與外圍,刺激對細胞響應的影響正好相反。</p><p> 視皮層神經(jīng)元的感受野對光點刺激沒有反應,而是對具有一定形狀的刺激敏感,它們通常被形象的稱為特征
42、檢測器。當具有一定朝向和寬度的條形刺激出現(xiàn)在其感受野內(nèi)某個特定位置上時,細胞的響應最強,而當刺激偏離該朝向時則反應急劇降低,甚至消失,這些細胞被稱為朝向選擇性細胞(又稱做簡單細胞)。</p><p> 感受野機制所反映出來的多尺度表示方法和中央外周(Center-Surround)計算策略是一種十分重要的視覺計算模型。</p><p> 2.2.3 人類視覺系統(tǒng)的注意機制</p&
43、gt;<p> 視覺注意(Visual Attention)是人類視覺的一項重要的心理調(diào)節(jié)機制。根據(jù)上文所述,視感受的信息處理方式是并行(Parallel Process)的,視知覺的信息處理方式是串行(Serial Process)的。這樣,視感覺過程所提供的信息量就會遠遠大于視知覺過程所能處理的信息量。將這嚴重失調(diào)的兩個過程聯(lián)系起來的橋梁正是視覺注意機制,它是視覺感知過程的引導者,是其高效性和可靠性的保障。</
44、p><p><b> 認識視覺注意</b></p><p> 圖2.4是幾個視覺注意示例圖,從中可以非常明顯地感受到視覺注意的存</p><p> 在。這三幅圖像中,(a)中的圓環(huán),(b)中的圓盤和(c)中的135度線段會迅速引起人們的注意。之所以會出現(xiàn)這樣的反應,正是由于視覺注意機制在發(fā)生作用。</p><p>
45、圖 2.4 視覺注意的示例圖</p><p><b> 2.選擇性視覺注意</b></p><p> 從視覺注意與視覺感知的關(guān)系中可以看到,選擇性是視覺注意眾多功能中最根本的一條,它表現(xiàn)為舍棄一部分信息,以便有效地處理重要信息的控制和調(diào)節(jié)能力。具體地說,人們在觀察一個場景時,總是有選擇地將注意力集中在場景中的某些最具吸引力的內(nèi)容上。從人的角度來看,這是一個從場景中
46、選擇內(nèi)容進行觀察的過程,可以稱之為視覺選擇性(Visual Selection);從場景的角度來看,場景中的某些內(nèi)容比其他內(nèi)容更能引起觀察者的注意,可以稱之為視覺顯著性(Visual Saliency)。兩者其實都是從不同的角度對選擇性視覺注意(Selective Attention)過程的描述。而在該過程中,引起注意的場景內(nèi)容則被稱為注意焦點(Focus ofAttention,簡稱FOA)。</p><p>
47、 選擇性視覺注意也是各個領(lǐng)域的研究者共同關(guān)心的一個焦點,目前大家對于視覺注意機制的研究幾乎全部集中在這一方面。人類視覺之所以能夠通過極為有限的信息處理資源完成極為復雜的信息處理任務(wù),選擇性視覺注意的控制和調(diào)節(jié)能力在其中發(fā)揮著決定性的作用。</p><p><b> 2.3 小結(jié)</b></p><p> 本章首先介紹了人眼的生理結(jié)構(gòu),初步了解了視覺的生理特性,然
48、后從心理學角度介紹了視覺信息的傳遞過程及其主要特性,并簡要介紹了感受野,同時論知的關(guān)系、選擇性視覺注意。本章的這些研究為將人眼視覺特性引入到圖像增強算法中打下了堅實的理論基礎(chǔ)。</p><p> 人類視覺是非常復雜的,它是心理學領(lǐng)域長期以來一直致力解決的主要問題之一,目前形成的許多理論仍然存在不少局限,這主要表現(xiàn)在:大多數(shù)觀點還停留在假說層次;許多理論還不夠完善;不同理論之間還有一些矛盾;有些方面仍然存在研究空
49、白。目前正在進行的探索正在朝著統(tǒng)一的完整的理論方向前進。</p><p> 基于視覺注意機制的灰度級信息量直方圖構(gòu)造</p><p> 3.1傳統(tǒng)直方圖的缺陷</p><p> 傳統(tǒng)直方圖由于數(shù)據(jù)描述簡單、便于計算機編程實現(xiàn)等優(yōu)點,被廣泛應用于各類圖像分析算法,是圖像的一種重要的表達方式。但這種表達也存在嚴重缺陷:在灰度級統(tǒng)計時,完全丟失了灰度級的位置信息,使
50、得直方圖的統(tǒng)計結(jié)果并不能反映各灰度級對刻畫信息所起的作用,即出現(xiàn)灰度級統(tǒng)計量與信息量不一致問題。為了使以上分析更直觀,本文特別找了一幅圖像,如圖3.1(a)所示,圖中背景和刻畫信息灰度級區(qū)分較為明顯。從該圖像的直方圖統(tǒng)計結(jié)果可以看出,最大統(tǒng)計值僅是由背景提供,但圖中的主要細節(jié)信息卻是由直方圖中統(tǒng)計值較小的灰度級刻畫的,在直方圖增強處理中,刻畫背景的灰度級由于統(tǒng)計值較大,被分配了較大的灰度級空間,而真正刻畫主要信息的灰度級因統(tǒng)計值較少,很
51、難得到有效的拉伸,使得處理后的圖像質(zhì)量還不如原圖像的效果,見圖3.1(b)。因此,僅僅依據(jù)數(shù)量上的統(tǒng)計結(jié)果,調(diào)整灰度級的動態(tài)范圍,難以保證對主要刻畫信息的灰度級進行有限拉伸,極大地影響基于直方圖的圖像增強算法的性能和魯棒性。</p><p> 圖 3.1 rose原圖和采用GHE算法的增強圖像及相應的直方圖</p><p> 3.2常用的區(qū)域顯著性度量方法</p><
52、;p> 根據(jù)顯著性度量方法的不同,可將目前的顯著區(qū)域檢測算法分為兩大類。第1類是基于局部特征的算法,即從候選區(qū)域內(nèi)部提取顯著性特征。這類方法認為視覺顯著性的產(chǎn)生是由于視覺對象本身具有某種能夠引起觀察者注意的特殊屬性。比如:Bourque比較候選區(qū)域與整幅圖像的邊緣密度差異;Kadir將像素鄰域的復雜性(complexity)作為其顯著性特征,并通過該鄰域的灰度直方圖的熵描述其復雜性;Gesu通過離散對稱性變換(DST)和離散矩變
53、換(DMT)的結(jié)合描述像素鄰域的顯著性。該方法往往是針對某些特定的目標或圖像提出來的,通用性較差。第2類是基于視覺反差的算法,即利用候選區(qū)域與外界比較產(chǎn)生的差異值或差異矢量來描述顯著性。這類方法認為視覺顯著性的產(chǎn)生是由于視覺對象與外界通過某種對比形成的能夠引起觀察者注意的新異刺激。在這些研究者中,有人利用候選區(qū)域與周邊區(qū)域比較產(chǎn)生的差異值或差異矢量來描述顯著性。比如:Wai通過DOG算子比較候選區(qū)域與周邊區(qū)域的灰度差異Itti通過中央-
54、周邊(Center-surround)算子比較候選區(qū)域與周邊區(qū)域在亮度、顏色和朝向這些早期視覺特征上的差異等。有人用候選區(qū)域與整幅圖像比</p><p> 3.3基于數(shù)據(jù)驅(qū)動的視覺注意機制的顯著性度量方法</p><p> 視覺注意包括兩種類型:自底向上注意和自頂向下注意。從而導致視覺注意模型包括兩種:(1)采用bottom-up控制策略的數(shù)據(jù)驅(qū)動注意機制,由作為底層數(shù)據(jù)的視覺刺激驅(qū)動
55、,與作為高層知識的觀察任務(wù)無關(guān)。(2)采用top-down控制策略的任務(wù)驅(qū)動注意機制,它引入外部命令,以適應外界命令的要求,從而達到將注意力集中于特定目標的目的。按照大腦中存在兩個視覺通路(what通路和where通路)的理論,數(shù)據(jù)驅(qū)動的注意模型可以用來提供what信息,而任務(wù)驅(qū)動的注意模型可以用來解決where通路的問題。目前對數(shù)據(jù)驅(qū)動的注意模型研究較多,提出了許多計算模型,而對任務(wù)驅(qū)動的注意模型研究較少,其原因主要在于研究外界命令如
56、何參與注意的計算方面存在較大的困難,目前大多數(shù)的工作限于生物實驗取證和理論研究。本文的研究也主要應用的是數(shù)據(jù)驅(qū)動的注意機制。</p><p> 3.3.1 多尺度采樣</p><p> 多尺度采樣模擬人類在掃視采集時對集采尺度的選擇過程。這一機制最早由Zeevi等在研究人類視網(wǎng)膜中心錐狀細胞的分布時發(fā)現(xiàn),隨后在模擬生物視覺的模型中被頻繁采用。圖3-3所示為視網(wǎng)膜細胞對視覺信息的采樣模式
57、。Itti提出了高斯金字塔模型,非均勻采樣體現(xiàn)在不同的采樣層次上。為了抽取圖像中的多尺度信息,對輸入圖像逐級進行子采樣和Gauss濾波,得到同一幅圖像的不同分辨率表示。在多尺度采樣中,原始圖像在最底層,由下而上,各層圖像分別是通過對其相鄰下層圖像濾波再采樣獲得的,圖像分辨率在水平和垂直方向分別以2為因子遞減。</p><p> 3.3.2 初級特征提取</p><p> 輸入圖像的三個
58、顏色信道:紅色、綠色、藍色,分別用r、g 、b符號來表示則圖像的灰度特征可以通過下面公式得到: I =(r +g +b)/3。為了從強度中分離出色度信號,使用I來歸一化信道。因為亮度非常低的色度變化是察覺不到的,因此也是不顯著的,故歸一化僅在灰度大于全圖最大的1/10位置上進行,而其他位置的值則被賦為0。根據(jù)歸一化后的r,建立4個寬調(diào)諧的顏色通道:紅色R =r -(g +b)/2,綠色G =g -(r +b )/2,藍色B =b -(r
59、 +g)/2和黃色Y =(r+g )/2-|r –g|/2-b,負值則置為0。</p><p> 3.3.3 中央周邊差</p><p> 中央周邊操作是指典型的視覺神經(jīng)元對位于其中央的小區(qū)域最敏感,而其中央?yún)^(qū)周圍的更廣、更弱區(qū)域內(nèi)的刺激將抑制該神經(jīng)元的響應。顯然,這樣的對局部空間不連續(xù)性的敏感結(jié)構(gòu)特別適用于檢測相對于其局部周圍突出的區(qū)域。模型中的中央周邊差是通過計算不同尺度下圖像特征
60、圖的差值來實現(xiàn)的。具體做法是將粗尺度下的特征圖插值變細尺度下的特征圖,然后再進行點對點減法。細尺度能發(fā)現(xiàn)高頻部分,檢測的是小的圖像區(qū)域,粗尺度能發(fā)現(xiàn)低頻部分,檢測的是大的圖像區(qū)域。所以細尺度特征圖代表中央?yún)^(qū)域,粗尺度特征圖代表周邊區(qū)域。計算公式如下:</p><p> 其中,S↑(.)為二進插值算子, Is to c為將s尺度的亮度特征圖像插值為c尺度的特征圖像,c、s分別為中心層及外周層,在本文中特征金字塔的
61、{0}層為中心層c,外周層為s=c+δ,δ=[1,2]。計算結(jié)果稱為對比映射圖。</p><p> 3.3.4 多特征圖合并策略</p><p> 初級視覺特征提取階段提取的各種不同維的特征對比度,形成了不同維上的特征顯著性描述。這些特征顯著性描述需要按照一定的策略合并為一張全局顯著圖,因為最終供注意機制選擇的是全局顯著圖中的多個目標。該過程通過兩步合并操作完成:1)合并不同尺度下同一
62、類特征對比映射圖,獲取特征顯著性描述;2)融合不同種類特征顯著性描述,得到全局顯著圖。組合特征圖的困難在于它們表達的特征是不可比的,各自具有不同的動態(tài)范圍和提取機制,而且由于所有特征圖都被組合在一起,僅僅在某些圖中出現(xiàn)的顯著目標,可能被圖中大量的噪聲或不太顯著的目標所淹沒。</p><p> 3.4 灰度級信息量直方圖構(gòu)造算法</p><p> 本文采用上節(jié)提到的基于視覺注意機制的顯著
63、性計算方法來構(gòu)造新型直方圖。大量實驗表明,該算法的測算結(jié)果與視覺主觀分析結(jié)果基本吻合。</p><p><b> 具體過程如下:</b></p><p> 1.將原始圖像進行多尺度采樣,分解為高斯金字塔形式。</p><p> 2.對金字塔的每一層分別提取多個初級視覺特征。由于本文的圖像增強算</p><p>
64、法專門針對灰度圖像進行設(shè)計,因此初級特征中只選用亮度和朝向特征。</p><p> 3.按公式分別進行亮度與朝向特征的中央周邊差計算。</p><p> 4.最后利用全局加強法將多特征對比映射圖進行合并處理,得到全局顯著圖。</p><p> 5.全局顯著圖進行歸一化得到各像素的復雜度加權(quán)系數(shù)saliency (i ,j)。</p><p&
65、gt; 6.依據(jù)各像素的復雜度系數(shù)加權(quán)統(tǒng)計待增強圖像的灰度級像素數(shù),即找到原圖像中灰度級為r的像素位置(m ,n),然后統(tǒng)計這些位置的復雜度加權(quán)系數(shù),得到待處理圖像的灰度級信息量直方圖,及所有灰度級信息量統(tǒng)計值之和。</p><p> 4 基于人眼視覺特性的圖像增強方法</p><p> 針對上文提到的傳統(tǒng)直方圖均衡方法描述的缺陷:在灰度級調(diào)整過程中沒有充分利用視覺敏感區(qū)段,本文研究
66、了人眼視覺系統(tǒng),視覺特性參數(shù)表明,人眼對不同亮度背景下灰度偏差的感知能力存在差異,在暗背景下辨別能力較弱。因此,本章根據(jù)人眼視覺感知特性將灰度級信息量分為三部分,分別對每部分進行灰度級動態(tài)范圍的調(diào)整。另外在圖像灰度級統(tǒng)計時,往往會出現(xiàn)一些比重過大的灰度級,稱為主導灰度級,這些灰度級在直方圖拉伸處理中將占用較大范圍的灰度級空間,而灰度級整個動態(tài)空間資源只有256級,這無疑會影響其它灰度級的表現(xiàn)。為解決這個問題,本文采用人眼感知能力曲線對主
67、導灰度級進行限幅處理。最后在灰度級信息量直方圖基礎(chǔ)上,結(jié)合人眼視覺特性,提出了一種新的圖像增強方法,該方法使增強圖像保留了更多的細節(jié)信息,獲得滿意的視覺效果。</p><p> 另外,由于圖像內(nèi)容存在多變的特點,為了獲取更好的圖像增強效果,有必要對各視覺敏感度區(qū)段的信息量分配比例做一定的調(diào)節(jié),而傳統(tǒng)的基于直方圖的圖像增強方法并不能自適應地獲取灰度級調(diào)整的優(yōu)化配置參數(shù),由于評價算法除了能對增強效果進行評價,也可以
68、對參數(shù)進行自適應調(diào)節(jié),為此本文依據(jù)視覺感知模型設(shè)計了一個圖像增強質(zhì)量客觀評價算法,并依據(jù)該評價算法的分析結(jié)果,自適應地獲取最佳調(diào)節(jié)參數(shù)。</p><p> 4.1 灰度級動態(tài)范圍的優(yōu)化配置</p><p> 所謂動態(tài)范圍是指待處理圖像的灰度級經(jīng)過調(diào)整后所占據(jù)的空間范圍。在</p><p> 章中,灰度級動態(tài)范圍的調(diào)整優(yōu)化包括兩方面:灰度級動態(tài)范圍的調(diào)整及主&l
69、t;/p><p> 灰度級限幅處理。下面將從這兩方面展開研究。</p><p> 4.1.1傳統(tǒng)的灰度級動態(tài)范圍優(yōu)化配置方法</p><p> 傳統(tǒng)的灰度級動態(tài)范圍調(diào)整方法主要包括線性動態(tài)范圍調(diào)整及非線性動態(tài)范圍調(diào)整。線性動態(tài)范圍調(diào)整是最簡單的灰度級動態(tài)范圍調(diào)整方法,觀察者可以改變?nèi)魏位叶燃壏秶鷥?nèi)的對比度。然而,這種簡單的方法很難同時提高所有區(qū)域的對比度。直方圖均
70、衡化是非線性動態(tài)范圍調(diào)整中最常用的一種方法,其實質(zhì)是有選擇地增強圖像中的某些信息(占有較多像素的灰度)而抑制另一些信息(占有較少像素的灰度)。雖然直方圖均衡化在一定程度上使得處理后的圖像灰度得以較均勻的分布,改善了圖像的視覺效果,但如第一章所述,直方圖均衡化方法并沒有考慮到人眼感知的非線性特性,即它是在假定不同的灰度級的視覺敏感度一樣的基礎(chǔ)上進行動態(tài)范圍調(diào)整的,并不能充分利用視覺敏感區(qū)段。</p><p> 由
71、于在圖像灰度級統(tǒng)計時,往往會出現(xiàn)部分主導灰度級統(tǒng)計值過大的情況,使得圖像處理后出現(xiàn)振鈴現(xiàn)象、噪聲過增強等問題,并且這些灰度級因為占據(jù)了較大灰度級空間,進而影響其它灰度級的表現(xiàn)。因此有必要對這些灰度級分配的動態(tài)范圍進行限幅處理。</p><p> 4.1.2 基于視覺特性的灰度級動態(tài)范圍調(diào)整優(yōu)化</p><p> 圖像增強的目的之一是為了改善圖像的視覺效果,以增強人眼對圖中信息的辨別能力
72、。對人眼視覺系統(tǒng)的研究,一方面為算法的改進提供新的線索,另一方面為設(shè)計圖像增強的量化評估算法提供依據(jù)。臨界可見偏差(Just Noticeable Difference,JND)是現(xiàn)已提出的能反映人眼視覺辨別力的重要參數(shù),它揭示了人眼在不同亮度背景下對亮度偏差的感知規(guī)律。下面簡要介紹JND相關(guān)背景。</p><p> 臨界可見偏差這一概念最早是由Jayant提出,在圖像壓縮編碼設(shè)計和評估中被普遍采用,但JND與
73、圖像增強也有著密切的關(guān)系,它反映了人眼在不同亮度背景條件下能分辨的最小亮度偏差,這也是細節(jié)信息被有效增強的最低門限要求。</p><p> 已有的視覺研究成果表明,人眼所能感覺到的最小亮度差與觀察對象的背景有關(guān)[52],即視覺對亮度偏差的敏感程度隨背景亮度變化呈非線性變化,總的來說在高亮度背景區(qū)人眼對亮度偏差的辨別力比在低亮度區(qū)要強。圖4.1所示直觀顯示了視覺在不同背景條件下的感知差異,圖4.1(b)是將圖4.
74、1(a)中的所有灰度級值加上50得到的,這等效于將原圖像整體亮度提升了50個灰度級。從這兩圖對比可以看出,原圖像中暗區(qū)不可見信息或難以分辨的信息(如人物衣服區(qū)域和墻上的部分文字)在亮背景下變得可見或更易辨別。但圖像整體亮度的提升并沒有改變原圖像暗區(qū)灰度之間的偏差。</p><p> 圖 4.1 視覺在不同亮度背景下的視覺差異</p><p> 本文利用臨界可見偏差對主導灰度級進行限幅,
75、其基本思路如下:首先判斷分配給每個灰度級的動態(tài)范圍是否超出了JND相應灰度級的值,如果超過了,則被認定為是主導灰度級,將其灰度值限幅為相應的JND值,否則則為非主導灰度級,保留原有的值。此即為對主導灰度級動態(tài)范圍進行限幅處理。但應當注意的是,這種限幅處理主要是用于圖像灰度級較多的情況,當圖像的灰度級級數(shù)較少時,可采用簡單的固定值限幅處理。對主導灰度級進行限幅處理后,會節(jié)省一些灰度空間,可以把這些灰度空間按照統(tǒng)計值大小分配給除主導灰度級以
76、外的其它灰度級。</p><p> 4.2 圖像增強質(zhì)量客觀評估算法</p><p> 近年來,關(guān)于圖像增強算法的研究報道很多,各種算法也都有其各自的特點和優(yōu)勢,在實際應用過程中就需要對各種圖像增強算法進行評價和分析。此外,由于圖像內(nèi)容的多樣性,很多算法為了獲得更佳的性能,設(shè)置了一些可供調(diào)節(jié)的參數(shù),如果沒有通用的圖像增強效果評價指標,這些參數(shù)的調(diào)節(jié)大多只能依靠操作人員憑借經(jīng)驗累試完成,
77、使得增強算法普遍存在魯棒性和推廣性較差的問題。因此,設(shè)計性能可靠的圖像增強質(zhì)量客觀評價算法顯得尤為重要,它不僅可用于評價各種的圖像增強算法的性能,還可以為各種增強算法的最優(yōu)參數(shù)自動設(shè)定提供量化的依據(jù),以提升增強算法的自適應能力。</p><p> 在本文中,評價的對象是增強后的自然圖像,即非壓縮、非紅外等不可見光所形成的圖像。而且目前人們關(guān)注的圖像質(zhì)量評價主要側(cè)重于與人的視覺感知一致,也就是說自動評價的結(jié)果應該
78、盡量符合人們對圖像質(zhì)量的真實感受,因而在本文中引入人眼視覺感知特性,以符合人眼觀察圖像的效果。</p><p> 4.2.1 人眼視覺調(diào)制傳遞函數(shù)</p><p> 在實際應用中,許多圖像處理與分析的目的是改善圖像視覺質(zhì)量以便于人們對圖像的分析。因此了解人的視覺系統(tǒng)特性及視覺信息處理特性對于圖像質(zhì)量評價是很有必要的。視覺系統(tǒng)是一個復雜完善的信息獲取和分析系統(tǒng),它涉及許多學科,目前尚有許
79、多感知機理仍不清楚,這也是阻礙圖像質(zhì)量評價發(fā)展的重要原因。</p><p> 一般把人眼看成一個精密的光學系統(tǒng),可以用分析光學系統(tǒng)的方法來研究人眼的視覺特性。傳遞函數(shù)已被證明是評價光學/光電成像系統(tǒng)的有效工具,但僅適用于線性平移不變系統(tǒng)。人眼視覺由于視網(wǎng)膜的結(jié)構(gòu)和功能不均勻,通常只有在中央凹附近且工作在閾值附近時,才能近似作為線性平移不變系統(tǒng)。人眼視覺系統(tǒng)的傳遞特性用調(diào)制傳遞函數(shù)MTF (f)來表示。以往較多地
80、使用高斯或指數(shù)型的低通濾波器模型,但這兩種視覺模型均忽略了頻率在以下的MTF分布,使理論的正確性及完整性存在不完善之處。實際上,在考慮人眼與視網(wǎng)膜條件下,人眼傳遞函數(shù)更接近于帶通濾波器。</p><p> 4.2.2 基于視覺感知特性及人眼調(diào)制傳遞函數(shù)的圖像增強評估算法</p><p> 在上節(jié)已對人眼視覺感知特性進行了研究,研究表明,人眼在不同亮度背景下對灰度偏差的感知能力存在較大差
81、異,人眼視覺調(diào)制傳遞函數(shù)表明,人眼傳遞函數(shù)具有帶通濾波特性,但目前常用的經(jīng)典評價算法如MSE和PSNR等卻無法客觀反映這兩種特性。此外,在圖像增強處理過程中,平滑區(qū)也會有不同程度的增強,有時增強力度甚至超過了細節(jié)區(qū),這時圖像的整體視覺效果很差,但MSE和PSNR的測算結(jié)果卻較好,因為這兩項指標是依據(jù)全局灰度變化的分析指標,這與人眼的視覺判定結(jié)果出現(xiàn)了較大的偏差。研究發(fā)現(xiàn),圖像中細節(jié)區(qū)(感興趣區(qū)域)的增強效果在人的視覺評判中起決定性作用。
82、因此常用的經(jīng)典評價算法用于圖像增強評估存在一定的局限性:1)沒有考慮人眼視覺的感知特點;2)未區(qū)分圖像細節(jié)區(qū)(信息區(qū))和平滑區(qū)。</p><p> 基于以上分析,本章采用基于視覺感知特性的圖像增強評估算法。視覺研究表明,圖像增強質(zhì)量的好壞與圖像內(nèi)有效感知灰度級躍變數(shù)量的大小直接相關(guān),即圖像的有效感知躍變數(shù)量越大,圖像細節(jié)就顯得越豐富、越清晰,圖像增強效果也越好。因此,可通過測定圖像內(nèi)的有效感知像素點個數(shù),來判斷
83、圖像的增強情況。單個像素點是否被感知可以通過該像素點灰度級與局部鄰域像素的灰度級偏差來確定,當與某一鄰近像素灰度偏差大于給定閾值時,該點可作為有效感知像素點。為了克服圖像整體視覺效果較差,而此時圖像全局的有效感知躍變數(shù)量卻較大的偏差問題,本文將圖像劃分為細節(jié)區(qū)和平滑區(qū),然后考察細節(jié)區(qū)的信息增強情況。區(qū)域的劃分是依據(jù)視覺注意機制得到的全局顯著圖的結(jié)果,閾值設(shè)為0.1。</p><p><b> 其具體過
84、程如下:</b></p><p> 1.根據(jù)公式以M ×M的模板計算圖像灰度的變化頻率,并根據(jù)公式轉(zhuǎn)化為人眼的空間頻率;</p><p> 2.根據(jù)公式計算出圖像中各個像素對應的MTF值及頻率值,并對MTF進行歸一化;</p><p> 3.以像素(x,y)位置為中心,計算出該像素周圍的背景平均亮度 (x,y);</p>&
85、lt;p> 4.在局部平均亮度基礎(chǔ)上,計算出亮度閾值,即局部區(qū)域的JND(x,y)參數(shù)值;</p><p> 5.對MTF進行分段考慮,即當MTF位于0.8~1時,臨界可見偏差為JND曲線;隨著MTF的衰減,MTF衰減多少倍,JND就增加多少倍,但為了使圖像符合人眼感知效果,可適當?shù)恼{(diào)整JND值;</p><p> 6.計算中心像素相對背景平均亮度的躍變強度;</p>
86、;<p> 7.當躍變強度ΔI(x,y)≥JND(x,y)時,可判斷該位置存在一有效的感知躍變,并將該像素位置的標記設(shè)為1,否則置0;</p><p> 8.重復步驟1到7,對增強圖像所有像素位置的躍變情況進行分析,得到二值化表示的有效感知躍變分布圖;</p><p> 9.利用全局顯著圖將待分析的圖像分為細節(jié)區(qū)和平滑區(qū);</p><p> 1
87、0.統(tǒng)計細節(jié)區(qū)內(nèi)有效感知躍變數(shù),并與細節(jié)區(qū)總的像素點數(shù)相除,得到該區(qū)域有效感知躍變百分數(shù)P,作為細節(jié)區(qū)增強效果的評判指標,P值越大表明細節(jié)區(qū)增強效果好。</p><p> 4.3 圖像增強算法描述</p><p> 算法首先按照上一章所給出的基于視覺注意機制的灰度級信息量直方圖構(gòu)造方法得到灰度級信息量直方圖;然后采用類似直方圖均衡思想,計算分配給各灰度級的動態(tài)范圍,并對其中動態(tài)范圍較大
88、(或統(tǒng)計量較大)的主導灰度級(動態(tài)范圍>JND(r)),進行限幅處理;最后將限幅處理后節(jié)省的灰度級空間按照信息量大小分配給其它非主導灰度級,以實現(xiàn)整個灰度級空間的優(yōu)化配置,使圖像獲得了滿意的增強效果。</p><p> 如果把JND曲線按照視覺感知特性分為三個部分:最弱感知區(qū)、最強感知區(qū)及次強感知區(qū),同時把圖像中位于大量信息區(qū)的灰度級分配在最強感知區(qū),把少量信息區(qū)的灰度級分配在最弱感知區(qū)及次強感知區(qū),這樣
89、可以拉伸圖像的灰度層次,提高圖像的對比度,使增強后的圖像獲得滿意的視覺效果。因此本文將圖像的整個灰度范圍分為三個區(qū)域,各區(qū)域依據(jù)直方圖中灰度信息量大小分配灰度級的動態(tài)范圍W(r),其計算公式如下:</p><p> 其中,為灰度級r的信息量統(tǒng)計值,N為所有灰度級信息量統(tǒng)計值之和,GL為所在區(qū)域的灰度級范圍,本文設(shè)定第一個區(qū)域的灰度級范圍為75,第二個區(qū)域的灰度級范圍為125,第三個區(qū)域的灰度級范圍為56。<
90、;/p><p> 由于新型直方圖很好地改善了傳統(tǒng)直方圖中灰度級統(tǒng)計量與刻畫信息量不相關(guān)問題,使得算法能對刻畫信息的主要灰度級進行有效地拉伸。此外,算法充分利用視覺感知特點,優(yōu)化配置灰度級的動態(tài)范圍,使圖像不僅保留了更多的細節(jié)信息,并且獲得了滿意的視覺效果。</p><p> 4.4 實驗結(jié)果與分析</p><p> 4.4.1 圖像質(zhì)量評價算法實驗結(jié)果</p
91、><p> 在本節(jié)中,對上面所提出的圖像質(zhì)量評價方法給予實驗分析。結(jié)果如下:</p><p> 圖 4.2 圖像質(zhì)量評價算法結(jié)果</p><p> 4.4.2圖像增強算法實驗結(jié)果</p><p> 本節(jié)選用幾組典型的圖像,對本章提出的增強算法與兩種經(jīng)典的算法做了對比實驗,這兩種算法是全局算法的代表GHE算法和局部算法的代表AHE算法。&l
92、t;/p><p> 圖 4.3 對圖像分布不均的圖像增強效果比較</p><p> 圖 4.4 處理噪聲強度較大的圖像增強效果比較</p><p><b> 5 總結(jié)與展望</b></p><p> 本文將視覺注意機制引入到灰度級信息量直方圖構(gòu)造過程中,在此基礎(chǔ)上,結(jié)合視覺特性約束,提出了一種基于灰度級信息量直方圖的
93、圖像增強新算法,至此本文主要完成了以下工作:</p><p> 1.首先分析了傳統(tǒng)直方圖數(shù)據(jù)描述形式的局限性,即灰度級統(tǒng)計量與其承載信息量不相關(guān)討論了這種不一致關(guān)系對圖像增強處理產(chǎn)生的不利影響:難以保證對主要刻畫信息的灰度級進行有限拉伸,極大地影響基于直方圖的圖像增強算法的性能和魯棒性。</p><p> 2.為了克服傳統(tǒng)直方圖構(gòu)造的缺陷,本文提出了一種新的基于視覺注意機制的灰度級信息
94、量直方圖構(gòu)造方法,該直方圖利用視覺注意機制衡量了圖像中任意位置的灰度級的重要性,從而保證增強算法能對主要刻畫信息的灰度級進行有效的拉伸。</p><p> 3.傳統(tǒng)直方圖均衡方法效果難以保證的另一個原因是在灰度級調(diào)整過程中,沒有充分利用視覺敏感區(qū)段。為此,本文對人眼視覺感知能力進行了研究針對其特點將JND曲線分為不同的視覺敏感度區(qū)段,提出了將不同比例的灰度級信息量分配至不同的視覺敏感度區(qū)段。</p>
95、<p> 4.針對圖像信息分布的多樣性,為了獲得更好的圖像增強效果,有必要對分配到各敏感度區(qū)段的信息量比例做一定的調(diào)節(jié),為此本文提出了一種新的依</p><p> 據(jù)視覺感知特性的圖像增強質(zhì)量客觀評估算法。</p><p> 5.基于新型的直方圖及視覺特性參數(shù)約束,提出了一種新的增強算法,并經(jīng)過實驗驗證,該算法整體性能較優(yōu),處理后的圖像具有滿意的視覺效果。</p&
96、gt;<p> 6.圖像增強質(zhì)量客觀評估算法充分考慮了人眼頻率的帶通特性及視覺對比敏感性,從而定量地評價增強算法對細節(jié)的增強能力。</p><p> 本文考慮了人眼視覺的生理及心理特性,因此有一定的先進性,但由于目</p><p> 前對人眼的心理特性和生理特性研究的不徹底,因此還有一定的缺陷。</p><p> 結(jié)合當前圖像增強算法的研究方向
97、和本文的研究工作,作者認為本文的研</p><p> 究工作可以從以下幾方面進行完善:</p><p> 1.采用信息融合技術(shù)的圖像增強算法研究</p><p> 不同增強算法或同一算法不同參數(shù)設(shè)置,增強后的圖像局部域效果都存在一定的差異。那么如何充分利用這種差異,綜合各種不同處理方法的增強圖像及原始圖像在不同局部域的優(yōu)點,使得最終的圖像獲得更好的增強效果,是
98、一個值得深入研究的問題。目前還未見這方面類似的報道。該問題包括了多個子問題的研究:融合算法的對比研究;不同算法的增強圖像的融合研究;同一算法不同參數(shù)設(shè)置獲取的多幅增強圖像的融合研究等。</p><p> 2.結(jié)合圖像評估算法,優(yōu)化配置灰度級動態(tài)空間</p><p> 本文提出的圖像評估算法不僅可用于評估圖像整體的增強效果,同時也可用于測試每一個灰度級的有效感知點數(shù)。實驗測試發(fā)現(xiàn),適當?shù)?/p>
99、調(diào)整圖像的主導灰度級動態(tài)范圍,還可以進一步提高有效感知點數(shù),因此,可以將現(xiàn)有的各灰度級動態(tài)范圍作進一步優(yōu)化調(diào)整,使最終的圖像滿足評測結(jié)果最優(yōu)。但如何優(yōu)化調(diào)整?所有的灰度級是否都參與調(diào)整?還是只是調(diào)整部分灰度級(如主導灰度級)?這些問題還需進一步研究。</p><p><b> 3.參數(shù)的自動調(diào)節(jié)</b></p><p> 本文的一些參數(shù),如在評估算法中,不同的頻率
100、段對JND閾值的要求也不同,本文是根據(jù)圖像自身像素灰度級的變化劇烈程度人為設(shè)定的JND閾值,算法的可移植性差。因此希望可以通過評估算法選擇一個最有利的JND參數(shù),或總結(jié)各種圖像的頻率分布特點,依據(jù)這些特點可以能夠自動確定最優(yōu)參數(shù)值。</p><p> 4.圖像增強技術(shù)與人眼視覺特性的結(jié)合</p><p> 圖像增強的目的是改善圖像視覺質(zhì)量以便于人們對圖像的分析,但雖然圖像增強技術(shù)快速發(fā)
101、展,經(jīng)常有新算法出現(xiàn),可是這些算法所得結(jié)果總是不能達到人眼所見效果,其中主要原因是現(xiàn)在尚有許多人眼感知機理仍不清楚,這也是阻礙圖像處理技術(shù)發(fā)展的重要原因。圖像處理技術(shù)與人眼視覺特性相結(jié)合是今后研究工作的方向性問題,必須要解決。</p><p><b> 參考文獻</b></p><p> [1]高彥平,圖像增強方法的研究與實現(xiàn):[碩士學位論文],河北;河北科技大學
102、,</p><p><b> 2005</b></p><p> [2]阮秋琦,數(shù)字圖像處理學,北京:電子工業(yè)出版,2001.192~199</p><p> [3]K.R.Castleman著,朱志剛等譯,數(shù)字圖像處理,北京:電子工業(yè)出版社,1998</p><p> [4]夏良正,數(shù)字圖像處理,南京:東南大學
103、出版社,2001,6:138~148</p><p> [5]朱秀昌,劉峰,胡棟,數(shù)字圖像處理與圖像通信,北京:北京郵電大學出版</p><p> 社,2002.67~70</p><p> [6]周新倫,數(shù)字圖像處理,北京:國防工業(yè)出版社,1986.106~110</p><p> [7]Pizer S M,Zimmerman J
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于人眼視覺特性的圖像增強算法研究.pdf
- 基于人眼視覺特性的紅外圖像增強算法研究.pdf
- 基于人眼視覺特性的低照度圖像增強算法研究.pdf
- 基于人眼視覺特性的數(shù)字彩色圖像增強算法研究.pdf
- 畢業(yè)設(shè)計---基于人眼視覺特性彩色圖像數(shù)字水印算法(含外文翻譯)
- 基于人眼視覺特性的多尺度dr圖像增強方法
- 基于人眼視覺特性的自適應圖像水印算法研究.pdf
- 基于人眼視覺系統(tǒng)特性的圖像(視頻)感知對比度增強算法研究.pdf
- 針對人眼視覺特性的紅外圖像增強技術(shù)研究.pdf
- 基于人類視覺特性的圖像增強算法研究.pdf
- 基于人眼視覺特性和小波表征的彩色圖象增強算法研究.pdf
- 畢業(yè)設(shè)計(論文)基于頻域的圖像增強算法研究
- 基于人眼視覺特性的圖像水印技術(shù)研究.pdf
- 基于人眼視覺特性的圖像修補評價準則的研究.pdf
- 基于人眼視覺特性的圖像質(zhì)量客觀評價方法研究.pdf
- 基于顯著圖和人眼視覺系統(tǒng)的圖像增強.pdf
- 基于人眼視覺特性的視頻質(zhì)量評價算法.pdf
- 基于人眼感知的圖像對比度增強算法研究.pdf
- 基于人眼視覺特性的圖像密寫技術(shù)研究.pdf
- 基于人眼視覺特性的無參考圖像質(zhì)量評價.pdf
評論
0/150
提交評論