2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、<p>  畢業(yè)設(shè)計(論文)任務(wù)書</p><p>  圖像壓縮算法在視頻測井系統(tǒng)中的應(yīng)用研究</p><p>  摘 要:在視頻測井系統(tǒng)中,測每一口井都要尋取成百上千的圖片,這些圖像數(shù)據(jù)要保存幾年供單位索取轉(zhuǎn)錄。為了減少實時傳輸?shù)膱D像信息量,需要對圖像進行壓縮,本文的主要工作是研究將基于JPEG圖像壓縮算法應(yīng)用到視頻測井系統(tǒng)中。文中主要分析了JPEG算法的基本原理和分類,重點

2、介紹了JPEG壓縮編碼的具體過程和方法,詳細介紹了編碼中DCT變換、量化、熵編碼和霍夫曼編碼等模塊的原理和數(shù)學(xué)推導(dǎo)以及各模塊的功能分析,并利用DCT算法進行變換和壓縮,達到了較高的壓縮比,并采用Matlab軟件對JPEG算法進行了仿真,將不同量化等級下得到的結(jié)果進行了比較分析。實驗結(jié)果表明,基于JPEG的圖像壓縮法可以對視頻測井系統(tǒng)中所獲取的圖像進行壓縮,且不影響其視覺效果。</p><p>  關(guān)鍵詞:JPEG

3、;圖像壓縮;DCT </p><p>  Application Research of Video Logging System based on Image compression algorithm</p><p>  Abstract: In the video logging system, test every well should research hundreds of

4、pictures, these image data to be saved a few years for unit to transcription. In order to reduce real-time transmission image information, it’s need to do image compression, this article mainly studies the work JPEG imag

5、e compression algorithm and used it to video logging system. This paper mainly analyzes the basic principle of JPEG arithmetic and classification, mainly introduces the detailed process and the met</p><p>  

6、Keywords:JPEG;Compression;DCT</p><p><b>  目 錄</b></p><p><b>  1 緒論1</b></p><p>  1.1 選題背景1</p><p>  1.2 國內(nèi)外研究現(xiàn)狀2</p><p>  1.

7、3 本課題的意義4</p><p>  1.4 本設(shè)計的研究方法4</p><p>  1.5 圖像壓縮的理論依據(jù)和具備的條件4</p><p>  1.6本文的各章內(nèi)容安排5</p><p>  2 視頻測井系統(tǒng)數(shù)字圖像壓縮原理6</p><p>  2.1 JPEG算法綜述6</p>

8、;<p>  2.1.1 無損壓縮編碼7</p><p>  2.1.2 基于DCT變換有損JPEG編碼7</p><p>  2.1.3 壓縮編碼器的主要算法及編碼方法8</p><p>  2.2 視頻測井系統(tǒng)中應(yīng)用的 JPEG編碼系統(tǒng)編碼流程8</p><p>  2.3 各模塊分析9</p>

9、;<p>  2.3.1 DCT變換9</p><p>  2.3.2 量化11</p><p>  2.3.3 差值預(yù)測編碼13</p><p>  2.3.4熵編碼和解碼13</p><p>  2.4 圖像壓縮效果和質(zhì)量16</p><p>  2.5 組成JPEG壓縮后比特

10、流格式16</p><p>  2.6 JPEG2000壓縮算法17</p><p>  2.6.1 JPEG2000壓縮原理18</p><p>  2.6.2 視頻測井系統(tǒng)中應(yīng)用的 JPEG2000編碼系統(tǒng)編碼流程19</p><p>  2.6.3 DCT電平位移20</p><p>  2.6

11、.4 分量變換20</p><p>  2.6.5 小波變換20</p><p>  2.6.6 量化21</p><p>  2.6.7 熵編碼21</p><p>  2.7 JPEG和JPEG2000壓縮算法的比較21</p><p>  3 JPEG和JPEG2000圖像壓縮編碼算法在視頻

12、測井系統(tǒng)中的的實現(xiàn)與應(yīng)用23</p><p>  3.1 用MATLAB實現(xiàn)視頻測井圖像的JPEG壓縮23</p><p>  3.2.1 MATLAB中圖像處理的相關(guān)函數(shù)23</p><p>  3.2.2 JPEG圖像壓縮法的設(shè)計24</p><p>  3.2.3 JPEG2000圖像壓縮法的設(shè)計26</p>

13、<p><b>  4結(jié)論29</b></p><p><b>  畢業(yè)設(shè)計小結(jié)30</b></p><p><b>  參考文獻31</b></p><p><b>  致 謝32</b></p><p><b>  附

14、錄 A33</b></p><p><b>  附錄 B35</b></p><p><b>  附錄 C38</b></p><p><b>  附錄 D41</b></p><p><b>  1 緒論</b></p>

15、<p><b>  1.1 選題背景</b></p><p>  隨著現(xiàn)代信息社會對通信業(yè)務(wù)要求的不斷增長,圖像通信與通信網(wǎng)容量的矛盾日益突出。特別是具有龐大數(shù)據(jù)量的數(shù)字圖像通信,更難以傳輸與存儲,極大地制約了圖像通信的發(fā)展,已成為圖像通信發(fā)展中的“瓶頸”問題。圖像壓縮編碼的目的就是要以盡量少的比特數(shù)表征圖像,同時保持復(fù)原圖像的質(zhì)量,使它符合特定應(yīng)用場合的要求。</p&

16、gt;<p>  視頻測井系統(tǒng)則是采用視頻的手段獲取井下的信息,為了減少實時傳輸?shù)膱D像信息量,需要對圖像進行壓縮。而圖像壓縮算法就是在一定的逼真度的要求下盡可能使用最少的代碼比特數(shù)來表達圖像,以壓縮圖像的儲存量,擴大傳輸容量,提高傳輸速度,從圖像處理的研究中可以看到圖像的象點之間有很大的相關(guān)性,因此它有很大的冗余性可以進行壓縮。為此進行圖像的編碼與壓縮具有很大的潛力。數(shù)字圖像壓縮不但在傳輸上有其重要性,而且在圖像數(shù)據(jù)的儲存

17、方面也越來越顯出其重要性。尤其是在視頻測井中,它獲取的信息量非常大,測每一口井都要尋取成百上千的圖片,每張圖片為1024*1024個像素,每個像素6到8 bit,這些圖像數(shù)據(jù)要保存幾年供單位索取轉(zhuǎn)錄。如果能壓縮一半,就可以少造一棟樓房,少用一半磁帶,具有很大的經(jīng)濟價值。當(dāng)然信息量盡可能少丟失。</p><p>  圖像信息壓縮的可能性存在于圖像本身之中,其中,明顯可以利用的一點是圖像各像素點之間的相關(guān)性。由于圖像

18、總是對一些物體的再現(xiàn),而物體上的各像素的灰度值之間有著極大的相關(guān)性。如果把這些像素之間的關(guān)系信息提取出來,以一定的方法加以清除,那就可以壓縮總的信息量。從統(tǒng)計的觀點來說各像素之間的灰度分布遠非獨立的,圖像的這種壓縮的潛力是很大的,當(dāng)前所采用的各種壓縮方法離壓縮的極限還很遠。挖掘這種潛力將會給圖像的傳輸和儲存帶來極大的方便。而挖掘這種潛力最常用的方法是JPEG2000和JPEG,JPEG2000和JPEG相比優(yōu)勢明顯,且向下兼容,因此可取

19、代傳統(tǒng)的JPEG格式因而可以被更廣泛的應(yīng)用于互聯(lián)網(wǎng)、彩色拷貝、打印、掃描、數(shù)字攝影、遙感、醫(yī)學(xué)圖像、數(shù)字圖書館、數(shù)字存檔以及移動圖像通信等領(lǐng)域。</p><p>  1991年,國際標(biāo)準化組織(ISO)和國際電信聯(lián)盟(ITU)制定了第一套靜態(tài)圖像壓縮標(biāo)準JPEG(Joint Photographic Experts Group聯(lián)合圖像專家組)[1]。該標(biāo)準是基于離散余弦變換(Discrete Cosine Tra

20、nsform,DCT)的方法,在中高碼率(碼率大于0.25比特/像素)對于連續(xù)色調(diào)的靜態(tài)灰度或彩色圖像取得了較好的壓縮性能。在目前多媒體通信采用的技術(shù)中,JPEG標(biāo)準以其顯著的壓縮效率和較低的圖像質(zhì)量損失而獲得了廣泛應(yīng)用,成為國際通用的標(biāo)準。JPEG使用有損壓縮時,在壓縮比25:1的情況下,壓縮后得到的圖像與原始圖像相比較,非圖像專家難以找出它們之間的差別。JPEG能夠適用于任何種類的連續(xù)色調(diào)的圖像,且長寬比不受限制,同時也不受限于景物

21、內(nèi)容,圖像得復(fù)雜度和統(tǒng)計特性等。</p><p>  鑒于JPEG其優(yōu)良的品質(zhì),在標(biāo)準提出后短短的幾年間就獲得了巨大的成功,目前網(wǎng)站上百分之80%的圖像都是采用JPEG的壓縮標(biāo)準。雖然最近更高壓縮率以及更多新功能的新一代圖像壓縮技術(shù)JPEG2000己經(jīng)誕生[2]。其目標(biāo)是進一步改進目前壓縮算法的性能,以適應(yīng)低帶寬,高噪聲的環(huán)境,及醫(yī)療圖像,電子圖書館,傳真,Internet網(wǎng)上服務(wù)和保安等方面的應(yīng)用。對于有較好的

22、圖像質(zhì)量,較低的比特率或者是一些特殊功能的要求(比如漸進傳輸和感興趣區(qū)域編碼等)時,JPEG2000將是較好的選擇。但是事實表明,隨著JPEG系統(tǒng)產(chǎn)品的不斷優(yōu)化,在大多數(shù)場合下,JPEGyasuo就可以滿足要求了。而且,JPEG 的低復(fù)雜度,低成本的優(yōu)點也是別的標(biāo)準所無法取代的。因此,JPEG2000不可能完全替代JPEG。在未來很長一段時間內(nèi),JPEG仍然將是主流的靜止圖像壓縮標(biāo)準。</p><p>  可以這

23、樣認為,沒有編碼壓縮技術(shù)的發(fā)展,大容量圖像信息的存儲與傳輸是難以實現(xiàn)的,多媒體等新技術(shù)在實際中的應(yīng)用也會碰到困難。因此,研究圖像的編碼壓縮技術(shù)成為當(dāng)前熱門的課題之一。由于圖像編碼壓縮技術(shù)存在著巨大的應(yīng)用市場和經(jīng)濟利益,我們有必要掌握JPEG這種主流編碼技術(shù)的核心算法,也是對后續(xù)的圖像處理研究做一個基礎(chǔ)工作。</p><p>  1.2 國內(nèi)外研究現(xiàn)狀 </p><p><b>

24、  圖像壓縮的發(fā)展史</b></p><p>  1948年提出電視信號數(shù)字化后,圖像壓縮編碼的研究工作就宣告開始了。在這項技術(shù)發(fā)展的早期,限于客觀條件,僅對幀內(nèi)預(yù)測法和亞取樣內(nèi)查復(fù)原法進行研究,對視覺特性也做了一些極為有限但可貴的研究工作。1966年J.B.O Neal對比分析了DPCM和PCM并提出了用于電視的實驗數(shù)據(jù)。1969年進行了線性預(yù)測編碼的實際實驗。1969年舉行首屆圖像編碼會議。70年

25、代開始進行了幀間預(yù)測編碼的研究。80年代開始對運動估值和模型編碼進行研究。進入90年代,ITU-T和ISO制定了一系列圖像編碼國際建議,如H.261、JPEG、MPEG-1、H.262、H.263、MPEG-4等。變換編碼是1968年H.C.Andrews等人提出的,采用的是二維離散傅立葉變換,此后相繼出現(xiàn)用其他變換方法的變換編碼,其中包括二維離散余弦變換。雖然jpeg有很多優(yōu)點,但是其他的數(shù)據(jù)格式也有他們各自的優(yōu)點。比如說如果要打印圖

26、像,特別是打印高質(zhì)量的圖像,TIFF格式是更為合適的選擇。</p><p>  JPEG壓縮技術(shù)可以說是所有圖像壓縮技術(shù)的基礎(chǔ)。如MJPEG(Motion JPEG)就是在JPEG基礎(chǔ)發(fā)展起來的動態(tài)圖像壓縮技術(shù),它只單獨的對某一幀進行壓縮,而基本不考慮視頻流中不同幀之間的變化。使得可獲取清晰度很高的視頻圖像,而且可靈活設(shè)置每路的視頻清晰度和壓縮幀數(shù)。其壓縮后的畫面還可任意剪接。但它的缺陷也非常明顯,其一,丟幀現(xiàn)象

27、嚴重、實時性差,在保證每路都必 須是高清晰的前提下,很難完成實時壓縮;其二,壓縮效率低,存儲占用空間較大。后來又出現(xiàn)了多層式JPEG(ML-JPEG)壓縮技術(shù),它采取漸層式技術(shù),先傳輸?shù)徒馕龅膱D檔,然后再補送更細節(jié)的壓縮資料,使畫面品質(zhì)改善。這種方式所需的時間雖然與原先的方式一樣。但由于可以先看到畫面,所以使用者會覺得這種方式較好。</p><p>  而在靜止圖像壓縮中,還有其他不少的標(biāo)準正在發(fā)展。如微軟今年3

28、月份透露,該公司不久將向國際標(biāo)準組織提交一個新的圖片格式,并表示其新格式可以提供更高的圖像質(zhì)量和更好的壓縮能力,即HD Photo格式[3]。微軟希望能用它的格式來取代現(xiàn)在通用的JPEG格式。微軟稱,HD Photo簡潔的運算法則可以減少圖像在壓縮過程中受到的損失,即便圖片大小僅有JPEG的一半,也將具有更高的質(zhì)量。這種格式此外還能夠同時支持“無損”和“有損”兩種圖片數(shù)據(jù)壓縮方法,這兩種方法可以對圖像質(zhì)量的產(chǎn)生不同的效果。微軟稱,HD

29、Photo可以對色平衡和曝光設(shè)置進行調(diào)節(jié),且不會像發(fā)生其它位圖格式經(jīng)常遇到的數(shù)據(jù)丟失或減少現(xiàn)象。無論HD是否可以取代JPEG,而JPEG在數(shù)字圖像壓縮發(fā)展中所做出的貢獻是舉足重輕的 </p><p>  經(jīng)過幾十年的發(fā)展,圖像編碼技術(shù)業(yè)已成熟,一些國際建議的制定極大地推動了圖像編碼技術(shù)的實現(xiàn)和產(chǎn)業(yè)化,從而推動圖像編碼技術(shù)以更快的速度發(fā)展,目前的研究方向有兩個: 1.更好地實現(xiàn)現(xiàn)有的圖像編碼國際建議研制出集成度更高

30、、性能更好的圖像編碼專用芯片,使編碼系統(tǒng)成本更低、可靠性更高。解決好現(xiàn)有的圖像編碼系統(tǒng)開發(fā)中的技術(shù)問題。例如:提高圖像質(zhì)量、提高抗碼能力等。 2.對圖像編碼理論和其他圖像編碼方法的研究目前已經(jīng)提出和正在進行研究的圖像編碼方法有:多分辨率編碼、基于表面描述的編碼、模型編碼、利用人工神經(jīng)網(wǎng)絡(luò)的編碼、利用分形幾何的編碼、利用數(shù)學(xué)形態(tài)學(xué)的編碼等等。目前靜止圖像的壓縮算法以JPEG(Joint Photographic Experts Group

31、)和JPEG2000為主。</p><p>  JPEG是第一個被廣泛接受的單色和彩色靜止圖像壓縮標(biāo)準,它的名字源于“Joint Photographic Experts Group(聯(lián)合圖像專家組)”,它是由ISO/和CCITT協(xié)同工作的機構(gòu),這個機構(gòu)的工作成果是ISO的國際標(biāo)準ISO/IEC10918-1(連續(xù)色調(diào)靜止圖像的數(shù)字壓縮和編碼,digital compression and coding of c

32、ontinuous tone still images)和ITU-T的建議T.81。JPEG標(biāo)準草案于1991年公布,1992年正式批準為國際標(biāo)準,以后這個工作組的進一步增強和擴展形成了ISO 10918-3和ITU-T建議T.81。</p><p>  JPEG的核心算法是DCT變換編碼,其壓縮性能基本反映了20世紀80年代末圖像壓縮的技術(shù)水平。但自從JPEG制定后的近10年,許多更有效的圖像壓縮技術(shù)已經(jīng)得到發(fā)

33、展,如小波變換方法、分形方法、區(qū)域劃分方法等。其中,發(fā)展最成熟和性能及通用性最好的靜止圖像壓縮方法是小波變換方法[4]。正因如此,制定了第二代靜止圖像壓縮標(biāo)準,即JPEG2000,它的核心技術(shù)正是小波變換編碼。其核心編解碼器采用小波變換、算術(shù)編碼及嵌入式分層組織,較以往的靜止圖像壓縮標(biāo)準復(fù)雜,它在同一個碼流中實現(xiàn)了無損和有損壓縮、分辨率和信噪比的累進性以及隨機訪問等優(yōu)良特性。JPEG2000作為JPEG的升級版,其壓縮率比JPEG高約3

34、0%左右,同時支持有損和無損壓縮。JPEG2000格式有一個極其重要的特征在于它能實現(xiàn)漸進傳輸,即先傳輸圖像的輪廓,然后逐步傳輸數(shù)據(jù),不斷提高圖像質(zhì)量,讓圖像由朦朧到清晰顯示。此外,JPEG2000還支持所謂的“感興趣區(qū)域”特性,可以任意指定影像上感興趣區(qū)域的壓縮質(zhì)量,還可以選擇指定的部分先解壓縮。</p><p>  1.3 本課題的意義</p><p>  在視頻測井系統(tǒng)中獲取的圖像

35、數(shù)據(jù)的特點之一就是信息量較大。計算機圖像處理中的數(shù)字圖像其灰度多數(shù)用8bit來量化并用普通PCM編碼,而在視頻測井系統(tǒng)中獲取的圖像和其他科研應(yīng)用的圖像的灰度量化可用到12bit以上,因而所需要的數(shù)據(jù)量太大。以1024*1024的圖像為例,用8bit量化的圖像需要1MB以上的存儲空間。這對圖像的存儲、處理、傳送帶來很大的困難。若使量化比特減少,又必然帶來圖像量化噪聲增大的缺點,且丟失灰度細節(jié)的信息。而且處理圖像的龐大數(shù)據(jù)量必然對計算機的處

36、理速度、存儲容量都有很高的要求,因此壓縮圖像是圖像處理的一項重要內(nèi)容。</p><p>  若從圖像傳送的角度來看則更要求數(shù)據(jù)量壓縮。首先,某些視頻測井系統(tǒng)中的圖像采集具有時間性,例如在視頻測井系統(tǒng)中獲取的圖像傳回地面有一定限制時間,測井儀經(jīng)過某地層就無法再得到其數(shù)據(jù),否則就要增加測井的次數(shù),圖像存儲體的存儲時間也有限制,它取決于存儲器件的最短存儲時間,若單位時間內(nèi)大量圖像數(shù)據(jù)則來不及存儲,就會丟失信息。視頻的傳

37、送能體現(xiàn)數(shù)據(jù)壓縮的重要性,我國的PAL制彩色電視傳送用3倍副載波取樣。若用8bit量化約需要100MB,若數(shù)字話路為64kbit,傳送彩色電視需要1600個數(shù)字話路,即使黑白電視用數(shù)字微波接力通信也占用近900個話路,這些數(shù)據(jù)明顯說明傳送數(shù)字圖像若能壓縮數(shù)據(jù)則可節(jié)約通信話路。圖像數(shù)據(jù)壓縮實時傳輸是必須解決的技術(shù)關(guān)鍵,而在視頻測井系統(tǒng)中獲取的圖像數(shù)據(jù)的特點之一就是信息量較大,因此在視頻測井系統(tǒng)中圖像數(shù)據(jù)壓縮實時傳輸更是必須解決的技術(shù)關(guān)鍵。

38、</p><p>  1.4 本設(shè)計的研究方法</p><p>  本設(shè)計是在matlab軟件上,利用matlab軟件的圖像處理工具和數(shù)字圖像壓縮的知識相結(jié)合,實現(xiàn)對視頻測井圖片的壓縮。</p><p>  1.5 圖像壓縮的理論依據(jù)和具備的條件</p><p>  視頻測井系統(tǒng)中圖像壓縮的出發(fā)點就是其圖像信息存在著很大的冗余度,數(shù)據(jù)之間

39、存在著相關(guān)性,如相鄰像素之間色彩的相關(guān)性等。常見的冗余信息主要有以下幾種形式:</p><p> ?。?)空間冗余:空間冗余是指圖像中相鄰像素、相鄰行之間存在較強的空間域的相關(guān)性(幀內(nèi)相關(guān)性)。通常在一幅圖像中總有大小不等的均勻著色區(qū)域,除邊界點以外,相鄰像素點間的灰度差異不大,而且變化有規(guī)律可循。</p><p> ?。?)時間冗余:時間冗余是指視頻序列中相鄰幀圖像之間存在較強時間域的相

40、關(guān)特性。因為視頻圖像每秒25幀,相鄰圖像時間間隔很小,加之圖像背景多為靜止的,所以相鄰圖像之間差別極小。</p><p> ?。?)結(jié)構(gòu)冗余:在有些圖像的部分區(qū)域內(nèi)存在著非常強的紋理結(jié)構(gòu),或是圖像的各個部分之間存在某種關(guān)系,如自相似性等,稱為結(jié)構(gòu)冗余。</p><p> ?。?)知識冗余:在某些圖像中包含的信息與某些先驗知識有關(guān),如特定的背景環(huán)境、所壓縮圖像的結(jié)構(gòu)等信息是事先已知的,故稱之

41、為知識冗余。</p><p>  (5)信息熵冗余(編碼冗余):通常,圖像各像素點灰度值并不是等概率分布的,即各灰度值數(shù)據(jù)的信息熵是不同的。由信息論有關(guān)原理可知,為表示圖像數(shù)據(jù)的一個像素點,只要按其信息熵的大小分配相應(yīng)的比特數(shù)即可。但是對于實際圖像數(shù)據(jù)的每個像素,很難得到它的信息熵,所以在數(shù)字化一幅圖像時,對每個像素都用相同的比特數(shù)表示,這樣必然導(dǎo)致冗余存在。</p><p> ?。?)視

42、覺冗余:人類的視覺系統(tǒng)對圖像的處理是非均勻和非線性的,人眼對一般像中的許多信息并不敏感,特別是人類的視覺系統(tǒng)并不是對圖像中的任何變化都能感知,這些人眼不敏感的和不能感知的信息就是視覺冗余信息。因此,在處理圖像時我們就可以去掉或減弱這些視覺冗余信息,從而達到壓縮的目的。</p><p>  圖像壓縮編碼的可能性就在于圖像信息的基本特性、圖像信息理論(信源)</p><p>  和人眼視覺特性

43、(信宿)。圖像壓縮的目的就是要除去這些冗余信息,在有些場</p><p>  合,一定限度的失真是允許的,因此可以對圖像信源作一定程度有時甚至是很大</p><p><b>  程度的壓縮。</b></p><p>  1.6本文的各章內(nèi)容安排</p><p>  第1章閾述了本課題的選題背景、國內(nèi)外研究狀況和相關(guān)領(lǐng)域中

44、已有的研究成果、本課題的意義、研究方法、理論依據(jù)和具備的條件、本畢業(yè)設(shè)計(論文)構(gòu)成及主要研究內(nèi)容等。</p><p>  第2章對JPEG和JPEG2000壓縮算法的原理及相關(guān)技術(shù)進行分析,重點分析了各類編碼的數(shù)學(xué)原理,并通過實驗仿真對比了JPEG和JPEG2000兩種編碼方法。</p><p>  第3章主要是對JPEG和JPEG2000圖像壓縮算法的程序設(shè)計和實現(xiàn)。</p>

45、;<p>  第4章對全文的工作做了總結(jié)。</p><p>  2 視頻測井系統(tǒng)數(shù)字圖像壓縮原理</p><p>  2.1 JPEG算法綜述</p><p>  JPEG是以實現(xiàn)圖像數(shù)據(jù)庫、彩色傳真、印刷等方面的彩色靜止圖像編碼的標(biāo)準方式為目標(biāo)而制定的,JPEG標(biāo)準是一個適用范圍廣泛的通用標(biāo)準。該壓縮標(biāo)準適用于彩色和單色、多灰度連續(xù)色調(diào)的靜態(tài)圖像

46、的數(shù)字圖像壓縮和編碼,和相同圖像質(zhì)量的其它常用文件格式(如GIF,TIFF,PCX)相比,JPEG是目前靜態(tài)圖像壓縮算方法中中壓縮比最高的。例圖采用Windows95目錄下的Clouds.bmp,原圖大小為640*480,256色。用工具ACDSee將其分別轉(zhuǎn)成24位色BMP,24位色JPEG,GIF(只能轉(zhuǎn)成256色)壓縮格式,24位色TIFF壓縮格式,24位色TGA壓縮格式,得到的文件大小(以字節(jié)為單位)分別為:921.654;17

47、.707;177.153;923.044;768.137。可見JPEG比其它幾種壓縮比要高得多,而圖像質(zhì)量都差不多(JPEG處理的顏色只有真彩和灰度圖)。正是由于其高壓縮比,使得JPEG被廣泛地應(yīng)用于多媒體和網(wǎng)絡(luò)程序中,例如HTML語法中選用的圖像格式之一就是JPEG(另一種是GIF),因為網(wǎng)絡(luò)的帶寬是非常寶貴的,選用一種高壓縮比的文件格式是必要的。</p><p>  JPEG是假想為適用范圍非常廣泛,通用性很

48、強的技術(shù),所以把算法的功能分為四種運行方式[5],用戶只要從中選擇需要的功能即可。這四種運行方式是:</p><p>  (1)基本DCT順序:由8*8像素組成的像塊,按照從左到右、從上到下對圖像進行掃描和編碼,順序運行需要的緩沖條件最小,因而實現(xiàn)的費用最低。</p><p>  (2)基于DCT的擴展:處理的順序及編碼處理的基本構(gòu)成是與基本DCT順序相同的,但有多次處理掃描。對圖像按照由

49、粗到細進行編碼,圖像重現(xiàn)時由粗糙到清晰。適用于傳輸時間長,低速率通訊頻道上的人機交互。</p><p> ?。?)無失真:不使用DCT變換,使用二維差分脈沖編碼調(diào)制技術(shù),對接近像素間的差別進行編碼,可處理較大范圍的輸入像素精度,可以保證重建圖像與原始圖像完全相同,沒有失真。</p><p>  (4)分層:以多種分辨率對圖像進行編碼,按照不同的要求,可以獲得不同分辨率和質(zhì)量的圖像。<

50、/p><p>  JPEG定義了兩種基本的算法[6]:一種是基于DCT的有失真的壓縮算法,包括基本(Baseline)系統(tǒng)(順序方式)和擴展系統(tǒng)(遞增模式、分層編碼);另一種是基于DPCM的無失真壓縮算法,又稱Spatial方式。DCT型算法可以實現(xiàn)較高的壓縮,但較為復(fù)雜;空間預(yù)測算法可實現(xiàn)低到中等程度的壓縮。選擇使用哪種過程取決于特定的應(yīng)用要求和價格性能考慮。在JPEG標(biāo)準(ISO-10918)中包括三個部分:編碼

51、器、譯碼器和交換格式。編碼器是將輸入圖像信源變成圖像壓縮數(shù)據(jù),譯碼器是將圖像壓縮數(shù)據(jù)還原成重建圖像。圖像壓縮數(shù)據(jù)組成一定的比特流(Bitstream)格式,格式中包括編碼過程中采用的碼表等。這四種運行模式中,最常用的是基本系統(tǒng),即基本DCT順序型方式。以下針對這種格式進行討論和研究的。首先介紹Spatial方式無失真JPEG壓縮編碼算法。</p><p>  2.1.1 無損壓縮編碼</p>&l

52、t;p>  圖2-1是無失真編碼的原理圖,由無失真編碼器實現(xiàn)數(shù)據(jù)壓縮,它由預(yù)測器和熵編碼器組成。預(yù)測器采用的是基于DPCM預(yù)測編碼[7]方法,像素點Y的預(yù)測值Y’,由之前的像素點的值通過確定的算法得出。熵編碼器是對(Y-Y’)的差進行無失真的熵編碼,比如算術(shù)編碼或哈夫曼編碼。其壓縮比可達2:1。這種方法由于壓縮比并不是很高,所以應(yīng)用的也不是十分廣泛,只是作一下大概介紹,下面將詳細介紹JPEG有失真的壓縮過程。</p>

53、<p>  圖2-1 Spatial方式的JPEG編碼器的構(gòu)成</p><p>  2.1.2 基于DCT變換有損JPEG編碼</p><p>  基于DCT的有失真編碼處理過程如圖2-2所示,JPEG基線系統(tǒng)是一種順序DCT算法[8],這類算法在量化過程中引入誤差,壓縮是失真的。利用人的視覺系統(tǒng)的生理特性,使用量化和無損壓縮編碼去掉視覺的冗余信息和數(shù)據(jù)本身的冗余信息。圖2

54、-2可以看出JPEG編碼的處理過程,總的來說是這樣的:對于一幅圖像首先將其分成許多個8*8的小塊,也就是每個小塊有8*8=64個像素;分成多少個小塊要看圖像的分辨率,分辨率高,分的塊就越多,分辨率小,分的塊就越少。然后對每一個8*8的塊進行二維DCT變換,經(jīng)過DCT變換后就得到頻域的64個離散余弦變換系數(shù),然后要對這64個系數(shù)進行量化,DCT系數(shù)量化中所必需的量化表及熵編碼中所必需的表的具體值,根據(jù)進行編碼的圖像不同而不同,一般取JPE

55、G標(biāo)準推薦的量化表,量化是根據(jù)量化表進行的,量化表是JPEG組織根據(jù)人的眼睛視覺的特性規(guī)定好的,直接用量化表去除得到的64個系數(shù)就是量化,量化后得到的仍是一個(8*8)64的系數(shù),而這一系數(shù)己是低頻集中在左上角的一個8*8的系數(shù)了。最后再利用熵編碼表對其進行熵編碼,熵編碼后得到的就是己壓縮的圖像數(shù)據(jù)。</p><p>  圖2-2 JPEG基本系統(tǒng)壓縮編碼處理框圖</p><p>  2

56、.1.3 壓縮編碼器的主要算法及編碼方法</p><p>  基本系統(tǒng)中涉及到的主要算法和編碼方法如下:</p><p> ?。?)色彩空間轉(zhuǎn)換(像素的RGB分量表示轉(zhuǎn)換成YCrCb分量)</p><p> ?。?)二維正向離散余弦變換(2DDCT);</p><p> ?。?)根據(jù)量化表進行均勻量化;</p><p&g

57、t; ?。?)DCT系數(shù)差值脈沖編碼(Differential Pulse Code Modulation,DPCM);</p><p> ?。?)AC系數(shù)Zig-Zag掃描編碼(Zig-zag Scan);</p><p> ?。?)AC系數(shù)行程長度編碼(Run Length Coding);</p><p> ?。?)霍夫曼編碼(Huffman Coding);

58、</p><p> ?。?)組成位數(shù)據(jù)流,以形成幀圖像。</p><p>  2.2 視頻測井系統(tǒng)中應(yīng)用的 JPEG編碼系統(tǒng)編碼流程</p><p>  在視頻測井系統(tǒng)中使用JPEG編碼系統(tǒng)模塊原理流程圖圖如圖2-3所示[9],在視頻測井系統(tǒng)中獲取的原始圖像輸入后經(jīng)過緩沖進行DCT編碼,將編碼結(jié)果進行ZZ掃描,然后量化,經(jīng)過碼流脈沖后進行霍夫曼編碼,最后輸出壓縮圖

59、像。</p><p>  圖2-3 在視頻測井系統(tǒng)中應(yīng)用的 JPEG編碼系統(tǒng)模塊圖</p><p>  首先將在視頻測井系統(tǒng)中獲取的圖像分為不重疊的8*8像素子塊(共有Y、U、V三幅數(shù)字圖像),接著對各個子塊進行DCT變換,然后對所有的系數(shù)進行線性量化。量化的過程是對系數(shù)值的量化間距劃分后的歸整運算,量化步長取決于一個“視覺閾值矩陣”它隨系數(shù)的位置變化而變化,并且對Y和UV分量也不相同。

60、其次,對DCT量化系數(shù)進行熵編碼,進一步壓縮碼率。這里可以采用算術(shù)編碼或霍夫曼編碼。</p><p>  2.3 各模塊分析</p><p>  將JPEG壓縮標(biāo)準基本系統(tǒng)的算法分成色彩空間轉(zhuǎn)換、DCT變換、量化、Z字掃描和熵編碼五大模塊,具體進行研究分析。是硬件結(jié)構(gòu)設(shè)計實現(xiàn)的理論基礎(chǔ)。</p><p>  2.3.1 DCT變換</p><

61、;p>  變換編碼是利用正交變換來實現(xiàn)圖像壓縮編碼的方法。模擬圖像采樣后,稱為離散化的亮度值。離散化的像素點可以是256點*256或512點*512點或者其他尺寸。假如把整幅圖像一次進行變換,則運算比較復(fù)雜,所需時間也較長。通常把圖像在水平方向和垂直方向上分為若干子區(qū),每個子區(qū)有4*4,8*8或16*16點,以子區(qū)為單位進行變換,每個子區(qū)的全部像素值構(gòu)成一個空間域矩陣。</p><p> ?。?-4)

62、 </p><p>  矩陣中元素f(i,j)表示子區(qū)中第i行、第j列像素的亮度值。對N*N階空間矩陣作變換的也是N*N階,變換就是在空間矩陣兩邊乘以變換矩陣[T]得到變換域矩陣[F]:</p><p>  [F ]=[T ]*[F ]*[T] (2-5)</p><p>  由于正交

63、矩陣[T]是滿秩的,它們有逆矩陣,設(shè)[T]的逆陣為,在式3-5兩端都乘以,得到: </p><p><b> ?。?-6)</b></p><p>  以上兩個式子就概括了變換編碼的中變換的基本思想和基本操作。</p><p>  

64、變換編碼中變換的目的何在呢?首先,假如變換矩陣是歸一化正交變換矩陣,則經(jīng)變換后,空間域中的總能量在變換域中得到保持,即滿足:</p><p><b> ?。?-7)</b></p><p>  式中f(m,n)為空間域矩陣中元素,F(xiàn)(i,j)為變換域矩陣中元素。公式(2-7)的意義在于:</p><p>  空間域中能量全部轉(zhuǎn)移到變換域中,而在

65、反變換中,變換域的能量又能全部轉(zhuǎn)移到空間域中。</p><p>  經(jīng)過變換之后,變換域中總的能量不變,但能量將會重新分布,在空間域中,能量分布具有一定的隨機性[10]。由于圖像有一定的相關(guān)性,變換域中能量在大部分情況下,集中于零空間頻率或低空間頻率對應(yīng)的變換系數(shù),從而使具有相關(guān)性圖像的相關(guān)性減少。同時由于能量集中于零空間頻率和低空間頻率所對應(yīng)的變換域矩陣元素中,我們對這些元素分配較多的比特數(shù),而對能量較少的元素

66、分配較少的比特數(shù)或不分配比特數(shù),由于相關(guān)性的減少,變換域中分配的總比特數(shù)可以比原圖像的總比特數(shù)少,這樣就可以使圖像所需傳送的比特數(shù)減少,達到壓縮的目的。</p><p>  我們知道離散傅氏變換DFT及其快速算法FFT是頻譜分析的有力工具。DFT的定義如公式(2-8)、公式(2-9)所示:</p><p>  m=0,1,2……,N-1 (2-8)</

67、p><p>  n=0,1, 2……,N-1 (2-9) </p><p>  上述一對變換式是由傅氏變換經(jīng)過時(空)域離散和頻域離散后推導(dǎo)所得。式中X(n)表示在時域中的N個(離散)值。X(m)表示在頻域中的N個頻域系數(shù)(應(yīng)于頻譜)。</p><p>  為什么圖像處理中不用DFT而用DCT呢?原因一是實時圖像處理時,每秒鐘要處理數(shù)百萬

68、乃至數(shù)千萬的數(shù)據(jù),而DFT要求復(fù)數(shù)運算,所以運算量大,難以滿足實時圖像處理的要求。但是DCT是一種實數(shù)域的變換,運算量比DFT少。原因二是DCT的變換矩陣的基向量很接近托波列茲(Toeplitz)矩陣的特征向量,而語音信號和圖像信號的協(xié)方差矩陣都是托波列茲矩陣,就這是為什么DCT變換接近最佳變換,即KLH(Karhunen loeveHoteling)變換,這種變換產(chǎn)生非相關(guān)變換系數(shù)(即頻率系數(shù)),非相關(guān)變換系數(shù)對壓縮極為重要。<

69、/p><p>  下面從一維DFT推導(dǎo)一維DCT。</p><p>  設(shè)x(0),x(1),……x(N-2),x(N-1)為N點實數(shù)據(jù)序列。令x(-1)=x(0)……x(-N+1)=x(N-2),x(-N)=x(N-1)。于是得到一個2N點的序列x(n)。下面給出對稱點n=-1/2的2N點序列x(n)的DFT變換公式(2-10)。</p><p><b> 

70、?。?-10)</b></p><p>  利用代換式n’=-n-1對上式中的第一項進行代換后,設(shè)n=n’可得:</p><p><b>  (2-11)</b></p><p>  利用公式2cos=,上式可化為:</p><p><b> ?。?-12)</b></p>

71、<p>  這就是一維離散余弦變換的一種形式。</p><p>  設(shè)圖像信號為二維函數(shù)F(x,y),二維DCT變換對定義如下:</p><p>  其中 (2-13)</p><p>  上述第二式為DCT的反變換IDCT,他將二維頻譜系數(shù)G(u,v)變換為二維空間圖像數(shù)</p>&

72、lt;p>  F(x,y)。為了方便起見,將上式中的變量平移,從而改寫成如下形式:</p><p>  上述第二式為DCT的反變換IDCT,他將二維頻譜系數(shù)G(u,v)變換為二維空間圖像數(shù)</p><p>  據(jù)F(x,y)。為了方便起見,將上式中的變量平移,從而改寫成如下形式:</p><p>  令x,=x+1,y,=y+1,u,=u+1,v,=v+1得到

73、如下公式(2-14):</p><p>  其中 (2-14)</p><p>  將上式用于圖像數(shù)據(jù)單元,即8*8方塊。則N=8得到公式(2-15):</p><p>  其中 (2-15)</p><p>  若圖像數(shù)據(jù)F(x,y)為8

74、*8矩陣時,經(jīng)DCT變換的頻率系數(shù)G(u,v)也是8*8矩陣,G(u,v)也稱DCT系數(shù)。</p><p><b>  2.3.2 量化</b></p><p>  量化是對經(jīng)DCT變換后的頻率系數(shù)進行處理以增加零系數(shù)的數(shù)目。量化是對DCT系數(shù)進行壓縮的關(guān)鍵一步,方法是通過降低DCT系數(shù)精度的方法,去除掉圖像中相對不重要的表示圖像細節(jié)[11]的AC系數(shù),從而減少圖像

75、數(shù)據(jù)量,達到壓縮目的,所以說量化是圖像質(zhì)量下降的最重要原因。</p><p>  將DCT系數(shù)按比例縮小,取其最接近的整數(shù)值,量化過程就是每個DCT系數(shù)除以各自的量化步距并按四舍五入取整得到量化系數(shù)。</p><p>  在JPEG標(biāo)準中采用線性均勻量化器,均勻量化的定義為,對64個DCT變換系數(shù),除以對應(yīng)的量化步長,四舍五入取整。如公式(2-16)所示。</p><p

76、><b>  (2-16)</b></p><p>  式中S(u,v)是量化步距。量化是通過量化表對DCT系數(shù)進行量化的,也就是對DCT系數(shù)8*8的塊依次以8*8的量化表為模板進行求模運算,結(jié)果是量化后的系數(shù)。</p><p>  用不同的量化表,提高壓縮比同時減少圖像失真。量化器步長是量化的關(guān)鍵,量化步長的最佳值是由輸入圖像及圖像顯示設(shè)備的特性來決定的,JP

77、EG標(biāo)準給出了一個參考標(biāo)準量化表,如表2-1和表2-2[12]所示。量化表就是給出了量化步長。它利用了人類視覺難以感覺高空間頻率失真的特點,量化步長隨空間頻率的增高而變大。而且由于人的眼睛對</p><p>  表2-1 亮度分量量化表</p><p>  亮度比較敏感,對色差不敏感,對亮度和色差采用不同的量化步長。從這兩張表可以看出,對亮度的量化步長劃分的細一些,對色度的量化步長劃分的

78、粗一些;兩張表都是在低頻部分(左上角)的步長小一些,在高頻部分的(右下角)步長大。</p><p>  表2-2 色度分量量化表</p><p>  因為大多數(shù)的圖像經(jīng)過DCT變換后能量大部分集中在左上角,所以其量化步長也比較小。8*8的DCT系數(shù)量化后高頻部分會出現(xiàn)一些0,這樣就實現(xiàn)了壓縮,而同時失真也主要就是在此時發(fā)生的。而由于人眼對高頻分量并不敏感,因而高頻部分的失真也不容被人眼發(fā)

79、覺。JPEG對圖像的壓縮主要就是在量化部分完成的。對于圖像壓縮而言,這種間濾波去掉右下角,取左上角,相當(dāng)于一個空間的低通濾波器。量化后得到的仍是8*8的64個系數(shù)Q(u,v),量化并沒有改變系數(shù)的性質(zhì),同樣Q(0,0)為DC系數(shù),其他63個系數(shù)Q(u,v)為AC系數(shù)。</p><p>  2.3.3 差值預(yù)測編碼</p><p>  量化過后,要進行熵編碼(無失真壓縮)。對于DC系數(shù)和A

80、C系數(shù)的編碼,由于兩者的統(tǒng)計性質(zhì)上有很大的不同,所以要分開進行。8*8矩陣塊的左上角第一個元素是直流DC系數(shù),即圖像子塊平均值,由于相鄰8*8塊之間的DC系數(shù)之間的相關(guān)性很強,JPE對DC系數(shù)采用差值脈沖編碼(DPCM),即對相鄰塊之間的DC系數(shù)的差值Diff=DCi-DCi進行編碼。例如,兩個相鄰DC系數(shù)分別為1001和1002,直接傳輸分別需要10bit和10bit采用DPCM后傳輸僅需10bit和1bit,從而達到壓縮的效果。&l

81、t;/p><p>  8*8矩陣塊的其它63個元素是交流(AC)系數(shù),經(jīng)壓縮后多為0分量,考慮進行零值行程(Run Length)的哈夫曼編碼。為了保證低頻分量先出現(xiàn),高頻分量后出現(xiàn),以增加行程中連續(xù)“0”的個數(shù),這63個元素采用了“之”字型(Zig-Zag)的排列方法,如圖3.3所示:按箭頭方向存儲,從Q(0,0)開始,指向Q(0,1),再指向Q(1,0),這樣使AC系數(shù)中的“0”集中,可以有效地壓縮數(shù)據(jù)。<

82、/p><p>  圖2-4 矩陣8*8的DCT系數(shù)的Zig-zag掃描</p><p>  2.3.4熵編碼和解碼</p><p>  為了進一步壓縮數(shù)據(jù),需要對量化后的DC系數(shù)和行程編碼后的AC系數(shù)再進行基于統(tǒng)計特性的熵編碼。</p><p>  1.直流分量的編碼和解碼。</p><p>  對直流分量,并不直接進行

83、編碼,而是利用差分編碼的方法,對本塊和前一塊的直流分量之差Diff=DCi-DCi-1(i為塊號)編碼。同時,由于亮度分量和灰度分量的統(tǒng)計特性不同,它們的霍夫曼編碼表也不同,其碼字結(jié)構(gòu)為:C=(SSSS,附加位)其中4bits二進制碼“SSSS”用來將DC差值的幅度范圍分為255。其后的附加位用以唯一地規(guī)定該類中一個具體的差值幅度。將附加位用霍夫曼碼變長編碼,其碼表也由JPEG預(yù)先給出。其霍夫曼編碼表如表2-3。直流分量在解碼時,只需要

84、用在編碼過程過程中相同的這張霍夫曼解碼就可以了,其過程比較簡單,所以在這里不再詳細論述。</p><p>  2.交流分量的編碼。</p><p>  JPEG用Z形掃描的方法將二維DCT系數(shù)展開成一維,其碼字結(jié)構(gòu)為:C=((NNNN,SSSS),尾數(shù))。其中低4位“SSSS”,同直流分量的含義一樣,表示尾數(shù)的位數(shù),高4位“NNNN”給出了當(dāng)前這個非零系數(shù)相對于前一個非零系數(shù)的位置。JPE

85、G對“NNNNSSSS”采用二維霍夫曼碼編碼,這有利于提高編碼效率,同樣,這張二維碼表也由JPEG預(yù)先給定。64個變換數(shù)經(jīng)量化后,左上角系數(shù)是直流分量(DC系數(shù)),即空間域中64個圖像采樣值的均值。相鄰8*8塊之間的DC系數(shù)一般有很強的相關(guān)性,JPEG標(biāo)準對DC系數(shù)采用DPCM編碼(差分編碼)方法,即對相鄰像素塊之間的L系數(shù)的差值進行編碼。其余63個交流分量(AC系數(shù))使用游程編碼,從左上角開始沿對角線方向,以Z字形(Zig-Zag)進

86、行掃描直至結(jié)束。量化后的AC系數(shù)通常會有許多零值,以Z字形路徑進行游程編碼有效地增加了連續(xù)出現(xiàn)的零值個數(shù)[13]。為了進一步壓縮數(shù)據(jù),對DC碼和AC行程編碼的碼字再作基于統(tǒng)計特性的熵編碼。JPEG標(biāo)準建議使用的熵編碼方法有霍夫曼編碼和自適應(yīng)二進制算術(shù)編碼。</p><p>  表2-3 直流分量霍夫曼表</p><p>  以上過程主要是基于數(shù)據(jù)的自身特點及其統(tǒng)計特性,整個過程以達到最大

87、壓縮里比為目的,其中又考慮到圖像數(shù)據(jù)的統(tǒng)計特性。以上過程已經(jīng)有相應(yīng)的軟件證明這個壓縮編碼系統(tǒng)的可行性,同時根據(jù)shannon(香農(nóng))無噪聲編碼定理,定義如果對熵為某個特定值的信號源做無失真編碼,計算所得的平均碼長為一個圍繞熵值向上波動的某個比特值,因此</p><p>  可能達到的最大壓縮比為:</p><p><b> ?。?-17)</b></p>

88、<p><b>  即可定義壓縮比為:</b></p><p><b> ?。?-18)</b></p><p>  通過分析JPEG壓縮的過程,認識到JPEG的目的是為了給出一個適用于連續(xù)色調(diào)圖像的壓縮方法,使之滿足以下三個要求:</p><p>  1.達到或接近當(dāng)前壓縮比與圖像保真度的技術(shù)水平,能覆蓋一個

89、較寬的圖像質(zhì)量等級范圍,能達到“很好”到“極好”的評估,于原始圖像相比,人的視覺難以區(qū)分。</p><p>  2.能適用于任何種類的連續(xù)色調(diào)的圖像,且長寬比都不受限制,同時也不受限于景物內(nèi)容、圖像復(fù)雜度。</p><p>  3.計算機復(fù)雜性是可控制的,其軟件可在各種CPU上完成算法也可用硬件實現(xiàn)。通過實驗可以驗證使用JPEG壓縮系統(tǒng)可以將壓縮比達到100:1,這樣的壓縮比可以說是基本上

90、可以解決我們在前面所論述過的由于圖像數(shù)據(jù)量大而產(chǎn)生的多種問題。</p><p>  經(jīng)過以上四個過程,原始圖像得到很大程度的壓縮。壓縮以后的數(shù)據(jù),對于圖像數(shù)據(jù)的存儲來說,節(jié)省了存儲空間,使得原有的存儲設(shè)備,能夠用米存儲更多的信息。而對圖像的傳輸而言,則減少了傳輸率,節(jié)省了傳輸時間,解決了數(shù)據(jù)量大和帶寬有限的問題。</p><p>  由于JPEG壓縮算法是個對稱算法,以上在JPEG的編碼過

91、程中已經(jīng)詳細說明了JPEG的編碼過程并說明了解碼過程的各個算法,所以這里只對JPEG的解碼過程做簡單說明。</p><p>  首先,待解碼的數(shù)據(jù)送入熵解碼器,如果熵編碼時采用的是霍夫曼編碼方法,則解碼需要根據(jù)相應(yīng)的碼表對輸入數(shù)據(jù)進行解碼,這種熵編碼的解碼過程是無失真的過程,所以解碼器的輸出能夠完全恢復(fù)編碼前的數(shù)據(jù)。由熵解碼器輸出的數(shù)據(jù)送入反量化器中,在反量化器中圖像模塊的每一個系數(shù)與相應(yīng)的量化階相乘,以恢復(fù)量化

92、前的系數(shù)值。由于在量化過程中采用了四舍五入的方法,且根據(jù)碼表設(shè)計原則對各個系數(shù)采用不同的量化間隔,所以在反量化過程中必然存在失真。因而不可能精確地恢復(fù)量化前的系數(shù)值相應(yīng)的恢復(fù)出的最終圖像也會因此而引入失真。正是由于這個過程,使得JPEG算法具有對圖像有較大的壓縮比.。量化器的設(shè)施是整個壓縮算法的關(guān)鍵環(huán)節(jié)。</p><p>  解碼的最后一個過程就是反向離散余弦變換,即FDCT過程。由反量化器輸出的數(shù)據(jù)通過在編碼過

93、程中算出的離散余弦變換表做反向的離散余弦變換,就得到了最終恢復(fù)的圖像數(shù)據(jù)。</p><p>  2.4 圖像壓縮效果和質(zhì)量</p><p>  顯而易見,壓縮比和圖像質(zhì)量是呈反比的,對于中等復(fù)雜程度的彩色圖像,使用基于DCT運行模式,其壓縮效率與圖像質(zhì)量之間的大致關(guān)系見表2-4,可以根據(jù)你的需要,選擇合適的壓縮比。</p><p>  表2-4 壓縮效率與圖像

94、質(zhì)量</p><p>  2.5 組成JPEG壓縮后比特流格式</p><p>  JPEG委員會在指定JPEG標(biāo)準時,定義了許多標(biāo)記用來區(qū)分和識別圖像數(shù)據(jù)及其相關(guān)信息。目前,使用比較廣泛的1992年9月由Eric Hamilton提出的JPEG文件交換格式JFIF(JPEG File Interchange Format)1.02版本。大多數(shù)應(yīng)用都支持JFIF文件交換格式,成為了事實上

95、的JPEG文件交換格式,JPEG編碼的最后一個步驟就是把各種標(biāo)記代碼和編碼后的圖像數(shù)據(jù)組成一幀一幀的位比特流,這樣就方便傳輸、存儲和解碼器譯碼。這里做一個簡單介紹。</p><p>  JFIF文件格式大體上可以分成以下兩個部分:標(biāo)記碼(Tag)加壓縮數(shù)據(jù)。JPEG的每個標(biāo)記都是由2個字節(jié)組成,其前一個字節(jié)是固定值0xFF。每個標(biāo)記之前還可以添加數(shù)目不限的0xFF填充字節(jié)(Fill Byte)。下面是其中的主要的

96、8個標(biāo)記:</p><p>  1)S O I    0xD8      圖像開始</p><p>  2)APP0    0xE0      JFIF應(yīng)用數(shù)據(jù)塊</p><p>  3)APPn    0xE1-0xEF   其他的應(yīng)用數(shù)據(jù)塊(n,1~15)</p><p>  4)D Q T    0xDB     量化表</p&

97、gt;<p>  5)SOF0    0xC0     幀開始</p><p>  6)D H T    0xC4     霍夫曼(Huffman)表</p><p>  7)S O S    0xDA     掃描線開始</p><p>  8)E O I    0xD9     圖像結(jié)束</p><p>  以SOF0標(biāo)記

98、碼作為例子,說明標(biāo)記碼的構(gòu)成,其他的標(biāo)記碼的具體構(gòu)成可以查看相關(guān)文檔。</p><p>  幀圖像開始標(biāo)記碼SOF0(Start of Frame)由以下幾個部分構(gòu)成。</p><p>  1.幀開始長度2字節(jié),標(biāo)記碼長度,不包括前兩個字節(jié)FFC0;</p><p>  2.精度,每個顏色分量每個像素的位數(shù)1字節(jié),基本系統(tǒng)中,為0x08;</p>&l

99、t;p>  3.圖像高度2字節(jié);</p><p>  4.圖像寬度2字節(jié);</p><p>  5.顏色分量數(shù)1字節(jié),F(xiàn)rame中的成分個數(shù),一般為1或3,1代表灰度圖3代表真彩圖;</p><p>  6.對每個顏色分量ID成分編號,1字節(jié)垂直方向的樣本因子,水平方向的樣本因子,量化表號。</p><p>  例如,某幅圖像的SOF標(biāo)

100、記碼為:FF C0 00 0B 08 01 E0 02 80 01 01 11 00</p><p>  FFC0表示SOF0字段開始。</p><p>  000B表示標(biāo)記碼占11個字節(jié)。</p><p>  08表示每個像素的每個顏色分量用8位表示。</p><p>  01E0表示圖像高度為480像素。</p><p

101、>  0280表示圖像寬度為640像素。</p><p><b>  01表示為灰度圖。</b></p><p>  01表示對亮度分量編號為1。</p><p>  11表示水平和垂直方向采樣頻率都是1,即每個像素采樣一次。</p><p>  00表示使用編號為00的哈夫曼編碼表對亮度分量進行編碼。有關(guān)JPEG

102、算法更詳細的資料,參看JPEG標(biāo)準ISO/IEC10918。</p><p>  2.6 JPEG2000壓縮算法</p><p>  目前的JPEG靜止圖像壓縮標(biāo)準,在中高比特率上壓縮效果較好,然而在低比特速率的情況下,重構(gòu)圖像存在嚴重的方塊效應(yīng),不能很好地適應(yīng)網(wǎng)絡(luò)傳描圖像的需要。盡管目前的JPEG標(biāo)準有44種操作模式,但是其中的大部分模式是針對不同的應(yīng)用提出的,不具有通用性,這給交換

103、、傳輸?shù)膲嚎s圖像帶來很大的麻煩。</p><p>  為了彌補目前標(biāo)準的不足,適應(yīng)21世紀圖像壓縮的需要,早在1997年ISO/ITU-T組織下的IEC JTC1/SC29/WG1小組便開始著手制定新的靜止圖像壓縮標(biāo)準——JPEG2000[14]。與JPEG不同,JPEG2000基于小波變換,采用當(dāng)前最新的嵌入式編碼技術(shù),在獲得優(yōu)于目前JPEG標(biāo)準壓縮效果的同時,生成的碼流有較強的功能,可應(yīng)用于多個領(lǐng)域。<

104、/p><p>  JPEG2000標(biāo)準可分為7大部分:</p><p> ?。?)JPEG2000圖像編碼系統(tǒng),是JPEG2000標(biāo)準的核心系統(tǒng)。</p><p> ?。?)擴展系統(tǒng),在核心系統(tǒng)上添加了一些功能。</p><p> ?。?)Motion JPEG2000(JPEG2000用于壓縮活動視頻序列)。</p><p&

105、gt; ?。?)一致性(測試用不同方法實現(xiàn)該標(biāo)準的一致性)。</p><p><b> ?。?)參考軟件。</b></p><p> ?。?)復(fù)合圖像文件格式,主要針對印刷和傳真應(yīng)用。</p><p>  (7)技術(shù)報告,介紹實現(xiàn)第1部分所需要的最小支持環(huán)境。</p><p>  2.6.1 JPEG2000壓縮原理&

106、lt;/p><p>  JPEG2000作為一種圖像壓縮格式,算法是它的核心。JPEG2000與傳統(tǒng)JPEG最大的不同,在于它放棄了JPEG所采用的以離散余弦變換為主的區(qū)塊編碼方式的多分辨率編碼方式,而改用以離散小波變換為主。</p><p>  余弦變換是經(jīng)典譜分析的工具,它考察的是整個時域過程的頻域特征,或整個頻域過程的時域特征,因此對于平穩(wěn)過程有很好的效果,但在非平穩(wěn)的圖像數(shù)據(jù)壓縮中,并

107、在空域/時域內(nèi)將其以較緊密的方式進行表達。如果圖像中的重要信息可用一個相對窄小的頻段表示的話,DCT算法可得到較好的結(jié)果。但大多數(shù)圖像的細節(jié)是非平穩(wěn)的,因而需要較寬的頻帶來表達,即需要許多變換系數(shù)的表述。如果不仔細量化這些系數(shù),解碼后的圖像會有平行于邊際的條紋。另外,分塊變換結(jié)構(gòu)會在重建圖像中表現(xiàn)出塊狀偽跡,特別是在解碼后需要用到邊緣增強[15]的情況下。這種算法以丟棄高頻信息達到壓縮目的,每一次壓縮都需要舍棄若干高頻信息,圖像壓縮率越

108、高,則高頻信息被丟棄的越多。在極端情況下,JPEG圖像只保留了反映圖像外貌的基本信息,精細的圖像細節(jié)都損失了。這樣的壓縮過程在圖像細節(jié)方面必然有所損失。</p><p>  小波變換[16]是現(xiàn)代譜分析的工具,其主要目的是要將影像的頻率成分抽取出來,它具有良好的空間一頻率局部化特性,因此特別適合于非平穩(wěn)信號的分析。子帶編碼和二進小波變換快速算法的提出導(dǎo)致了研究基于小波變換的靜態(tài)圖像壓縮算法的高潮,并獲得了較好的壓

109、縮性能。小波變換由于使信號的低頻長時特性和高頻短時特性同時得到了處理,有效地克服了傅立葉變換在處理非平穩(wěn)的復(fù)雜圖像信號時存在的局限性。與傳統(tǒng)的DCT編碼相比,小波的粗略邊緣可以更好地表現(xiàn)圖像,因為它消除了DCT壓縮所具有的方塊效應(yīng),在低比特率下就能夠獲得較好的圖像主觀質(zhì)量。小波在空間和頻率域上的局域性,是統(tǒng)計意義上的局域性。這里說的局域性,指的是一個變換系數(shù)實際牽涉到的圖像空間范圍是局部的。因而,要完全恢復(fù)圖像中的某個局部,并不需要所有

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論