2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩39頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2024年3月3日12時(shí)9分,1,第7章 圖象編碼與壓縮,主要內(nèi)容:1.圖象編碼的必要性?2.圖象編碼的分類?3.圖象編碼中的保真度準(zhǔn)則?4.編碼的性能參數(shù)?5.統(tǒng)計(jì)編碼6.預(yù)測(cè)編碼7.變換編碼8.圖象編碼的國(guó)際標(biāo)準(zhǔn),,2024年3月3日12時(shí)9分,2,1.圖象編碼的必要性,圖象編碼與壓縮,圖象編碼與壓縮,本質(zhì)上來說,就是對(duì)圖象源數(shù)據(jù)按一定的規(guī)則進(jìn)行變換和組合,從而達(dá)到以盡可能少的代碼來表示盡可能多的數(shù)

2、據(jù)信息。壓縮通過編碼來實(shí)現(xiàn),或者說編碼帶來壓縮的效果,所以,一般把此項(xiàng)處理稱之為壓縮編碼。,編碼的必要性,一幅模擬圖象必須經(jīng)過脈碼調(diào)制(PCM—Pulse Code Modulation)才能變成數(shù)字圖象。(PCM有時(shí)也指對(duì)信號(hào)進(jìn)行采樣、量化并以適當(dāng)碼字將其編碼的各個(gè)過程的總稱),2024年3月3日12時(shí)9分,3,模擬圖象,,空間采樣,PCM的過程:,,,,,中間體,幅值量化,中間體,,,數(shù)字圖象,編碼,例1設(shè)一幅活動(dòng)圖象的空間分辨率

3、為N,灰度分辨率為b, 時(shí)間分辨率為fB, 則在實(shí)時(shí)傳輸過程中,該圖象在傳輸通道里的傳輸率至少應(yīng)該為ρ=NbfB,若N=512?512, b=8, fB=25, 則ρ=52.4Mbps,2024年3月3日12時(shí)9分,4,例2地球資源衛(wèi)星(LANDSAT)一幀圖象(4幅)的數(shù)據(jù)量為 2340 ? 2340 ? 7 ? 4 = 153,316,800 ?153Mb衛(wèi)星每天要獲取很多幅圖象,這些數(shù)據(jù)都先暫時(shí)存儲(chǔ)在衛(wèi)星體內(nèi)的

4、磁性存儲(chǔ)器中,當(dāng)衛(wèi)星飛過地面接收站的有效接收區(qū)域時(shí),迅速將這些數(shù)據(jù)全部送到地面。,2024年3月3日12時(shí)9分,5,圖象編碼的目的:節(jié)省存儲(chǔ)空間;減少傳輸時(shí)間;利于處理,降低處理成本。,圖象數(shù)據(jù)經(jīng)過編碼壓縮、傳輸、解碼以及重建圖象數(shù)據(jù)的流程如下圖所示:,原始圖象數(shù)據(jù),編碼器,被壓縮的圖象數(shù)據(jù)流,,,重建圖象數(shù)據(jù),解碼器,被壓縮的圖象數(shù)據(jù)流,,,,,,信道,信源編(解)碼,信道編(解)碼,,,,2024年3月3日12時(shí)9分,6,,2.圖象

5、編碼壓縮分類,a)從應(yīng)用角度分類,靜止圖象編碼,活動(dòng)圖象編碼,二值圖象編碼,b)從信息保持程度角度分類,有損壓縮(保真度編碼,特征抽取編碼)無(wú)損壓縮(信息保持壓縮,熵保持壓縮),c)從具體的編碼技術(shù)角度分類,空域法,變換域法,預(yù)測(cè)編碼,變換編碼,統(tǒng)計(jì)編碼,等,2024年3月3日12時(shí)9分,7,3.圖象編碼中的保真度準(zhǔn)則,圖象品質(zhì)的核心問題是逼真度問題。經(jīng)過處理的圖象(包括經(jīng)過壓縮編碼后的圖象)與一個(gè)標(biāo)準(zhǔn)圖象之間的偏差可以作為圖象逼真度

6、(保真度)的度量。這一偏差,包括亮度,色度,分辨率以及某些心理物理學(xué)參數(shù)。,a)客觀保真度準(zhǔn)則,設(shè)f(x,y)是輸入圖象,f’(x,y)是輸出圖象, 定義偏差e(x,y)=f(x,y)-f’(x,y),則以下的參數(shù)可作為保真度準(zhǔn)則:,2024年3月3日12時(shí)9分,8,b)主觀保真度準(zhǔn)則,挑選一定數(shù)量的觀察者,2024年3月3日12時(shí)9分,9,4.編碼的性能參數(shù),圖象信息熵與平均碼字長(zhǎng)度,令,是圖象象素灰度級(jí)集合,其對(duì)應(yīng)的頻率為,定義,(

7、單位:比特/象素),令,是對(duì)應(yīng)象素灰度級(jí)的編碼長(zhǎng)度,定義,(單位:比特/象素),問題:如何度量編碼方法的優(yōu)劣?,2024年3月3日12時(shí)9分,10,稱H(d)為該圖象的平均信息熵,R(d)為平均編碼長(zhǎng)度。,編碼效率,冗余度,冗余大致分為三類1)編碼冗余 符號(hào)序列?碼字?(碼字長(zhǎng)度),2024年3月3日12時(shí)9分,11,2)象素間相關(guān)性冗余 幀間象素信息冗余,幀內(nèi)象素信息冗余3)視覺冗余 人眼對(duì)所有視

8、覺信息并不是都具有相同的敏感度; 人眼的空間分辨率,時(shí)間分辨率。,消除冗余能達(dá)到數(shù)據(jù)壓縮的效果。,Kunt的觀點(diǎn):1948-1988年40年研究的以去除冗余為基礎(chǔ)的編碼方法為第一代編碼方法。(PCM, DPCM, 經(jīng)典變換編碼,統(tǒng)計(jì)編碼等),2024年3月3日12時(shí)9分,12,80年代以后發(fā)展的許多新方法,是第二代編碼方法。基于神經(jīng)網(wǎng)絡(luò)理論,小波變換理論,分形理論等開發(fā)的編碼技術(shù),大多屬于這一類。,從實(shí)用方案角度來分,可分

9、為三大類:預(yù)測(cè)編碼,統(tǒng)計(jì)編碼,變換編碼。,5.統(tǒng)計(jì)編碼,根據(jù)圖象像素灰度值出現(xiàn)的概率的分布特性而進(jìn)行的壓縮編碼叫統(tǒng)計(jì)編碼。,2024年3月3日12時(shí)9分,13,熵與平均碼字長(zhǎng)度,1)H(d) < R(d)時(shí),一定可以設(shè)計(jì)出某種平均碼字 長(zhǎng)更短的無(wú)失真編碼方法。2)平均碼字長(zhǎng)小于H(d)的無(wú)失真編碼方法不存在,熵編碼,使編碼后的圖象的平均碼字長(zhǎng)度盡可能接近圖象的熵H?;舅悸肥牵焊怕蚀蟮幕叶燃?jí)用短碼字,概率小的,用長(zhǎng)碼

10、字。,2024年3月3日12時(shí)9分,14,編碼技術(shù)中的幾個(gè)常用的概念,碼,碼字(字符集)變長(zhǎng)碼 等長(zhǎng)碼單一性代碼任意一個(gè)有限長(zhǎng)度的碼字序列,只有一個(gè)有意義的分割。 [00,10,001,101]? [0,01,1,11] ?非續(xù)長(zhǎng)代碼 前綴碼;任意一個(gè)碼字都不是另一個(gè)的續(xù)長(zhǎng)。 [0,10,11] ? [0,01,11] ?,2024年3月3日12時(shí)9分,15,即時(shí)碼最佳編

11、碼 平均碼長(zhǎng)最接近于熵的無(wú)損編碼。,2024年3月3日12時(shí)9分,16,Huffman編碼,基本哈夫曼編碼系統(tǒng)框圖,2024年3月3日12時(shí)9分,17,算法1)將灰度等級(jí)按概率大小進(jìn)行排序(降序), 每個(gè)灰度等級(jí)作為一個(gè)葉子結(jié)點(diǎn),形成一棵樹;2)將兩個(gè)根節(jié)點(diǎn)概率最小的樹,合并(規(guī)則:這 兩個(gè)結(jié)點(diǎn)構(gòu)造一個(gè)雙親結(jié)點(diǎn),雙親結(jié)點(diǎn)的概率 大小是兩者之和);重復(fù)1) 2), 直到只有一個(gè)樹為止;3)設(shè)所有

12、左后代為0,右后代為1,2024年3月3日12時(shí)9分,18,特點(diǎn)優(yōu)點(diǎn):即時(shí)碼;最優(yōu)碼缺點(diǎn):當(dāng)需要對(duì)大量符號(hào)進(jìn)行編碼時(shí),構(gòu)造最優(yōu)哈 夫曼碼的計(jì)算量會(huì)很大。,2024年3月3日12時(shí)9分,19,,,,,,,,,例3,x8:0.04,x7:0.05,0.9,x6:0.06,x5:0.07,0.13,x4:0.10,x3:0.10,0.19,0.23,x2:0.18,0.37,0.60,x1:0.40,,,,,,,,

13、,,,,,,,,,,,,,,0.10,,黃色連線表示0,紅色連線表示1,x1:0x2:100x3:110x4:1011x5:1111x6:1110x7:10101x8:10100,2024年3月3日12時(shí)9分,20,,平均碼長(zhǎng):,信息熵:,編碼效率:,2024年3月3日12時(shí)9分,21,Shannon-Fano編碼,算法1)將消息非遞增排序2)按概率之和相近或相等原則將消息集一分為二3)將以上分割準(zhǔn)則遞歸地應(yīng)用到消息

14、子集,直止 最終 子集只有一個(gè)消息為止4)在分割過程中,分別給所分得的兩個(gè)子集賦予0和1,2024年3月3日12時(shí)9分,22,例4,x1:00x2:01x3:100x4:101x5:1100x6:1101x7:1110x8:1111,2024年3月3日12時(shí)9分,23,,平均碼長(zhǎng):,信息熵:,編碼效率:,2024年3月3日12時(shí)9分,24,6.預(yù)測(cè)編碼,預(yù)測(cè)編碼(Predictive Coding),就是根據(jù)

15、“過去”的時(shí)刻的像素值,運(yùn)用一種模型,預(yù)測(cè)當(dāng)前的像素值,預(yù)測(cè)編碼通常不直接對(duì)信號(hào)編碼,而是對(duì)預(yù)測(cè)誤差進(jìn)行編碼。當(dāng)預(yù)測(cè)比較準(zhǔn)確,誤差較小時(shí),即可達(dá)到編碼壓縮的目的。,原理:對(duì)圖象的一個(gè)像素的離散幅度的真實(shí)值,利用其相鄰象素的相關(guān)性,預(yù)測(cè)它的下一個(gè)象素的可能值,再求兩者差,對(duì)這種具有預(yù)測(cè)性質(zhì)的差值,量化,編碼,就可以達(dá)到壓縮的目的。,2024年3月3日12時(shí)9分,25,輸入圖象,,,,,預(yù)測(cè)器,,,,?n,量化器,,編碼器,,?‘n,,解碼

16、器,傳輸,,,?‘n,,輸出圖象,,預(yù)測(cè)器,,,,預(yù)測(cè)編碼示意圖,2024年3月3日12時(shí)9分,26,,預(yù)測(cè)器:,是根據(jù)前面幾個(gè)像素的亮度值,預(yù)測(cè)而得,量化器:對(duì)?n進(jìn)行舍入,整量化,編碼器:可采用成熟的編碼技術(shù),如Huffman編碼等,解碼器:編碼器的逆,線性預(yù)測(cè)器:,,2024年3月3日12時(shí)9分,27,例5,246884210,24357863,24331447,2468842

17、10,^,?,f,預(yù)測(cè)器,,,2024年3月3日12時(shí)9分,28,在預(yù)測(cè)編碼中,最常用的是差分脈碼調(diào)制(Differential Pulse Code Modulation, DPCM),原理圖如下所示:,輸入,,,,,預(yù)測(cè)器,,?n,量化器,,編碼器,,?‘n,,解碼器,傳輸,,,?‘n,,,預(yù)測(cè)器,,,,,,,,,,輸出,2024年3月3日12時(shí)9分,29,收端解碼時(shí)的預(yù)測(cè)過程與發(fā)端相同,所用預(yù)測(cè)器也相同,收端輸出的信號(hào)是發(fā)端的近

18、似值,兩者的誤差是,注意:1)多點(diǎn)預(yù)測(cè),,,,x1,x2,,,,x3,x,2024年3月3日12時(shí)9分,30,3)預(yù)測(cè)系數(shù)隨著不同的圖象而不同,但對(duì)每幅圖象都計(jì)算預(yù)測(cè)系數(shù)太麻煩,也不現(xiàn)實(shí),可參考前人得到的數(shù)據(jù)選擇使用。在靜止圖象壓縮的國(guó)際標(biāo)準(zhǔn)(JPEG)中,對(duì)這種方法的前置點(diǎn)形式以及預(yù)測(cè)系數(shù)有一推薦值可供參考。,2)每行的最開始的幾個(gè)像素?zé)o法預(yù)測(cè),這些像素需要用其他方式編碼,這是采用預(yù)測(cè)編碼所需要的額外操作,2024年3月3日12時(shí)9分

19、,31,7.變換編碼,原理:圖象數(shù)據(jù)經(jīng)過正交變換后,其變換系數(shù)具有一定的相互獨(dú)立性,(例如,對(duì)于FT來說,頻普系數(shù)大的變換系數(shù)均集中在低頻部分,而高頻部分的幅值均很小,因而可以對(duì)低頻的變換系數(shù)量化、編碼和傳輸,對(duì)高頻部分不處理,這樣可以達(dá)到圖象壓縮的目的。,構(gòu)造子圖象,正教變換,量化,編碼,解碼,反正交變換,合并子圖象,,,,,,,,,變換編碼的一般系統(tǒng)框圖,輸入,輸出,2024年3月3日12時(shí)9分,32,8.圖象編碼的國(guó)際標(biāo)準(zhǔn),,圖象

20、編碼標(biāo)準(zhǔn): JBIG,H.26x,JPEG,MPEG,,國(guó)際標(biāo)準(zhǔn)化組織(ID)和國(guó)際電報(bào)電話咨詢委員會(huì)(CCITT)聯(lián)合成立的專家組JPEG(Joint Photographic Experts Group)于1991年3月提出了ISO CDIO918號(hào)建議草案:多灰度靜止圖像的數(shù)字壓縮編碼(通常簡(jiǎn)稱為JPEG標(biāo)準(zhǔn))。這是一個(gè)適用于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。它包括基于DPCM(差分脈沖編碼

21、調(diào)制)、DCT(離散余弦變換)和Huffman編碼的有損壓縮算法兩個(gè)部分。,JPEG,2024年3月3日12時(shí)9分,33,,JPEG壓縮編碼算法的主要計(jì)算步驟如下:正向離散余弦變換(FDCT)。 量化(quantization)。 Z字形編碼(zigzag scan)。 使用差分脈沖編碼調(diào)制(differential pulse code modulation,DPCM)對(duì)直流系數(shù)(DC)進(jìn)行編碼。 使用行程長(zhǎng)度編碼(run-

22、length encoding,RLE)對(duì)交流系數(shù)(AC)進(jìn)行編碼。 熵編碼(entropy coding)。,2024年3月3日12時(shí)9分,34,2024年3月3日12時(shí)9分,35,2024年3月3日12時(shí)9分,36,量化DCT系數(shù)的序號(hào),2024年3月3日12時(shí)9分,37,(源于http://www.btc.sh.cn/wsxy/digi/d4z.htm),2024年3月3日12時(shí)9分,38,·MPEG-3:原本針對(duì)于H

23、DTV(1920×1080),后來被MPEG-2代替。 ·MPEG-4:針對(duì)多媒體應(yīng)用的圖像編碼標(biāo)準(zhǔn)。 ·MPEG-7:基于內(nèi)容表示的標(biāo)準(zhǔn),應(yīng)用于多媒體信息的搜索, 過濾,組織和處理。,MPEG,MPEG(Moving Pictures Experts Group)是 ISO/IEC/JTC/SC2/WG11的一個(gè)小組。它的工作兼顧了JPEG標(biāo)準(zhǔn)和CCITT專家組的H.261標(biāo)準(zhǔn),于1

24、990年形成了一個(gè)標(biāo)準(zhǔn)草案。,MPEG標(biāo)準(zhǔn)分成兩個(gè)階段:第一個(gè)階段(MPEG-I)是針對(duì)傳輸速率為 lMb/s到l.5Mb/s的普通電視質(zhì)量的視頻信號(hào)的壓縮;第二個(gè)階段(MPEG-2)目標(biāo)則是對(duì)每秒30幀的720x572分辨率的視頻信號(hào)進(jìn)行壓縮;在擴(kuò)展模式下,MPEG-2可以對(duì)分辨率達(dá)1440Xl152高清晰度電視(HDTV)的信號(hào)進(jìn)行壓縮。,2024年3月3日12時(shí)9分,39,回答問題,2024年3月3日12時(shí)9分,40,作業(yè):8.

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論