多聲道編碼現(xiàn)狀

上傳人：奔*** IP屬地：河北更新時間：2024-03-02 格式：doc 頁數(shù)：14 大?。?30.50KB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

已閱讀1頁，還剩13頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、　　當(dāng)前典型的多聲道音頻編碼方案　　杜比數(shù)字AC-3編碼壓縮算法　　杜比數(shù)字音頻壓縮標(biāo)準(zhǔn)( AC- 3) 是在1992年為35毫米電影研制出來的, 它解決了在一條膠片上數(shù)字聲和模擬聲并存的問題。后來, AC- 3技術(shù)被廣泛的應(yīng)用于激光唱片, 高清晰度電視系統(tǒng), 有線電視系統(tǒng), 數(shù)字衛(wèi)星廣播, DVD 影碟, DVD- ROM

2、和互聯(lián)網(wǎng)中。　　杜比數(shù)字AC- 3環(huán)繞聲系統(tǒng)是于1991年由美國杜比實(shí)驗(yàn)室與日本先鋒公司聯(lián)合開發(fā)的。其目的就是為了改善和提高三維聲場的重現(xiàn)能力。傳統(tǒng)的立體聲系統(tǒng)僅僅能夠提供給聽者面前的二維聲場, 而無法描述三維空間感。通過增加左、右環(huán)繞聲及中置聲道, 以多聲道音頻重放的方式來重現(xiàn)三維立體空問,就是AC- 3環(huán)繞聲系統(tǒng)要實(shí)現(xiàn)的。　　杜比數(shù)字AC-3環(huán)

3、繞聲是多聲道音頻系統(tǒng),它是由六只獨(dú)立的聲音聲道和揚(yáng)聲器來組成的。　　AC-3揚(yáng)聲器擺放　　其中C ( 中置音箱) 、L ( 左聲道) 、R ( 右聲道) 主要用于重建二維立體聲聲場, Ls ( 左后環(huán)繞) , Rs ( 右后環(huán)繞) 則用以與L、C、R 共同營造逼真的三維空間立體聲聲場, 而LFE (

4、超低音) 聲道則用來彌補(bǔ)聲場中低頻部分的不足, 烘托和渲染整個三維立體聲空間聲場, 由于六個獨(dú)立聲道中前五個聲道的頻響范圍都是音頻全頻帶即20Hz～20kHz, 而LFE 頻響范圍則是由15Hz～150Hz, 僅占整個頻譜的十分之一, 因此又稱為5. l 聲道環(huán)繞聲系統(tǒng)。　　由于聲場的構(gòu)造與揚(yáng)聲器的擺放位置有關(guān), 按照ITU - R BS.775建議, L, C, R, Ls,Rs

5、五只揚(yáng)聲器如圖示擺放, 用于構(gòu)造三維聲場, 而LFE 的擺放則沒有太多限制, 一般放置在側(cè)面即可。因此可以看到要想得到最好的環(huán)繞聲三維聲場效果, 則必須位于圖示的可聽范圍, 否則不會感受到良好的效果。　　對于數(shù)字音頻信號來說，AC-3通過應(yīng)用數(shù)字壓縮算法，來減少正確再現(xiàn)原始脈沖編碼調(diào)制(PCM)樣本所需要的數(shù)字信息量，得出原始信號經(jīng)數(shù)字壓縮后的表達(dá)式。<p

6、>　　編碼過程為:首先在分析濾波器組中完成把音頻表達(dá)式從一個PCM時間樣本的序列變換為一個頻率系數(shù)樣本塊的序列。每個樣本塊包含256個頻率系數(shù)。這些單獨(dú)的頻率系數(shù)用二進(jìn)制指數(shù)記數(shù)法表示為一個二進(jìn)制指數(shù)和一個尾數(shù)。這個指數(shù)的集合被編碼為信號頻譜的粗略表達(dá)式，稱作頻譜包絡(luò)。核心的比特指派例行程序用這個頻譜包絡(luò)來確定每個單獨(dú)尾數(shù)需要用多少比特進(jìn)行編碼。將頻譜包絡(luò)和6個音頻樣本塊粗略量化的尾數(shù)格式化成一個AC-3數(shù)據(jù)幀(FRAME)。AC

7、-3數(shù)碼流是一個AC-3數(shù)據(jù)幀的序列。　　Ac-3編碼原理圖　　在實(shí)際的AC- 3編碼器中, 還包括下述功能:　　●附有一個數(shù)據(jù)幀的信頭 ( header ) , 其中包含與編碼的數(shù)碼流同步及把它解碼的信息( 比特率、取樣率、編碼的信道數(shù)目等) 。&

8、lt;p>　　●插入誤碼檢測碼字, 以便解碼器能檢驗(yàn)接收的數(shù)據(jù)幀是否存在誤碼。　　●可以動態(tài)的改變分析濾波器組的頻譜分辨率, 以便同每個音頻樣本塊的時域/ 頻域特性更好的匹配。　　●頻譜包絡(luò)可以用可變的時間/ 頻率分辨率進(jìn)行編碼。　　●可以實(shí)行更復(fù)雜的比特指派, 并修改核心比特分派例行程序的一些參數(shù), 以

9、便產(chǎn)生更加優(yōu)化的比特指派。　　●在高頻一些聲道可以耦合在一起, 以便工作在較低比特率時, 仍可得到更高的編碼增益。　　●在兩聲道模式中, 可以有選擇的實(shí)施重新設(shè)置矩陣的過程, 以便提供附加的編碼增益,以及當(dāng)對兩信道的信號解碼時使用一個矩陣環(huán)繞聲解碼器, 同時獲得改進(jìn)的結(jié)果。　　解碼過程基本上是編碼的逆過程。解碼器

10、必須同編碼數(shù)碼流同步, 檢查誤碼, 以及將不同類型的數(shù)據(jù)( 例如編碼的頻譜包絡(luò)和量化的尾數(shù)) 進(jìn)行解格式化。運(yùn)行比特指派例行程序, 將其結(jié)果用于解數(shù)據(jù)大包( unpack) 和尾數(shù)的解量化。將頻譜包絡(luò)進(jìn)行解碼而產(chǎn)生各個指數(shù)。各個指數(shù)和尾數(shù)被變換回到時域成為解碼的PCM 時間樣本。　　AC- 3解碼過程框圖　　在實(shí)際的AC- 3解碼器中, 還包括

11、下述功能:　　●假若檢測出一個數(shù)據(jù)誤碼, 可以使用誤碼掩蓋或靜噪。　　●高頻內(nèi)容耦合在一起的那些聲道必須去除耦合。　　●已被重新設(shè)置矩陣處理的聲道, 必須進(jìn)行去除矩陣化的處理( 在2 - 聲道模式中) 。　　●必須動態(tài)的改變綜合濾波器組的分辨率, 與編碼器分析濾波器組在

12、編碼過程中所用的方法相同。　　杜比數(shù)字AC- 3編碼數(shù)據(jù)格式　　經(jīng)過杜比數(shù)字AC- 3編碼器的編碼處理, 可以將原始的數(shù)據(jù)PCM 信號編碼為杜比數(shù)字　　AC- 3音頻數(shù)據(jù)流。一個AC- 3串行編碼的音頻數(shù)據(jù)流是由一個同步幀的序列所組成。　　AC- 3同步幀結(jié)構(gòu)</p

13、>　　由上圖可見, 每個同步幀包含六個編碼的音頻樣本塊( AB) 其中每個代表256個新的音頻樣本。在每個同步幀開始的同步信息( SI) 的信頭中, 包含為了獲得同步和維持同步所需要的信息。接著SI 后面的是數(shù)碼流信息( BSI) 的信頭, 它包含描述編碼數(shù)據(jù)流業(yè)務(wù)的各種參數(shù)。編碼的音頻樣本塊之后接著是一個輔助數(shù)據(jù)( AU X) 字段。在每個同步幀結(jié)尾處是誤碼檢驗(yàn)字段,其中包含一個用于誤碼檢測的

14、CRC 字。一個附加的CRC 字位于SI 信頭中, 以供選用。AB0～AB5的每一塊代表一個編碼聲道, 可以分別獨(dú)立解碼, 塊的大小可以調(diào)整, 但總數(shù)據(jù)量不變。在圖中還有兩個未標(biāo)出的CRC, 其中第一個位于幀的5/ 8處, 另一個位于幀未。之所以如此安排, 目的就是可以減少解碼器的RAM 需求量, 使得解碼器不必完全接收一幀后才解碼音頻數(shù)據(jù), 而是分成了兩部分進(jìn)行解碼。　　杜比數(shù)字AC

15、- 3的兼容性　　由于AC- 3比特流中同步結(jié)構(gòu)中的AB0～AB5是獨(dú)立解碼的, 因此可以將這些編碼信號重新構(gòu)造為所需的輸出信號, 即輸出的下行兼容性。　　AC-3輸出的下行兼容性　　在許多重放系統(tǒng)中, 揚(yáng)聲器的數(shù)目不能同編碼的音頻聲道的數(shù)目匹配。為了重現(xiàn)完整的音頻節(jié)目, 需要向下混合。在幀同步中, AB

16、0～AB5中記錄著六個獨(dú)立聲道的音頻數(shù)據(jù), 按照AC-3重放時的安排, 我們稱之為L、R、C、Ls、Rs、LFE。一般用于向下混合的過程中, 低音增強(qiáng)LFE 聲道記錄的音頻信號主要用于渲染烘托氣氛, 所以向下混合時, 只用其中的L、RC、Ls、Rs。。從圖中可以看到編碼后的AC-3數(shù)據(jù)流可以直接傳輸后經(jīng)解碼器解碼為5. 1聲道音頻信息進(jìn)行重放, 也可以向下混合為兩個聲道信號, 然后經(jīng)不同的解碼器得到不同的重放模式。就單一環(huán)繞聲道

17、( n/ l 模式) 而言, 把S 稱為單個環(huán)繞聲道。從圖中可看出, 向下混合提供兩種類型: 向下混合為Lt、Rt 矩陣環(huán)繞編碼的立體聲對; 向下混合為通常的立體聲信號L 0 、R 0 。向下混合的立體聲信號( L 0 、R 0 或L t 、Rt) 可進(jìn)一步向下混合為單聲道M , 通過兩個聲道的簡單相加即可。如果將Lt、Rt 向下混合為單聲道, 環(huán)繞信息將會丟失。當(dāng)希望需要一個單聲道信號時, 則將Lo、Ro 向下混合即<

18、;/p>　　用于Lo、Ro 立體聲信號的一般3/ 2向下混合方程式為:　　Lo = 1. 0 ×L + clev ×C + slev ×L s;　　Ro = 1. 0 ×R + clev ×C + slev ×Rs;　　如果接

19、著L，R。被組合成單聲道信號重放, 有效的向下混合方程式為:　　M = 1. 0 ×L + 2. 0 ×clev ×C + 1. 0 ×R + slev ×L s + slev ×Rs;　　如果只出現(xiàn)單個環(huán)繞聲道S ( 3/ l 模式) , 則向下混合方程式為:<p

20、>　　L o = 1. 0 ×L + clev ×C + 0. 7 ×slev ×S;　　Ro = 1. 0 ×R + clev ×C + 0. 7 ×slev ×S;　　M = 1. 0 ×L + 2. 0 ×clev ×C + 1. 0

21、 ×R ×1. 4 ×slev ×S;　　其中clev、SIev分別代表中央聲道混合聲級系數(shù)和環(huán)繞聲道混合聲級系數(shù), 在BSI 數(shù)據(jù)中由Cmixlev、Surmixlev 比特字段來指出相對應(yīng)的值。　　用于Lt、Rt 立體聲信號的一般3/ 2向下混合方程式為:　　Lt =

22、 1. 0 ×L +0. 707 ×C - 0. 707 ×Ls - 0. 707 ×Rs;　　Rt = 1. 0 ×R +0. 707 ×C - 0. 707 ×L s - 0. 707 ×Rs;　　如果只出現(xiàn)單個環(huán)繞聲道S ( 3/ 1模式) , 則向下混合方程式為

23、:　　L t =1. 0 ×L + 0. 707 ×C -0. 707 ×S;　　Rt =1. 0 ×R +0. 707 ×C +0. 707 ×S;　　經(jīng)過對獨(dú)立聲道的音頻信號進(jìn)行不同的分配及矩陣重組, 則實(shí)現(xiàn)了AC- 3數(shù)據(jù)流的向下兼容性, 意即通過

24、不同的解碼器、解碼矩陣方式, 可以得到杜比數(shù)字5. 1聲道環(huán)繞聲、立體聲、杜比邏輯定向、單聲道以及杜比的虛擬環(huán)繞聲方式。其中Lo、Ro 與Lt、Rt 的最大區(qū)別就是Lt、Rt 是記錄的全部的L、R 及環(huán)繞聲的信息, 經(jīng)過矩陣重解可得到環(huán)繞產(chǎn)信息, 而Lo、Ro 則是將環(huán)繞聲信息增加至立體聲信號中, 無法再現(xiàn)環(huán)繞聲信號信息。　　DTS多聲道編碼</p

25、>　　DTS（Digital Theatre System 數(shù)字化影院系統(tǒng)）是美國另外一家非常有實(shí)力的數(shù)字音頻格式制定公司，總公司位于洛杉磯，公司主要分為兩大部分：一部分是以電影音樂的錄音現(xiàn)場及電影院的編、解碼為主的專業(yè)用“數(shù)字影院系統(tǒng)”，另一部分是以家庭用解碼器的開發(fā)及DVD/LD/CD等套裝軟件為主的消費(fèi)電子用“DTS技術(shù)”兩大部份。 DTS公司推出過很多多聲道技術(shù)，其中DTS D

26、igital Surround是最有影響力的一種，屬于5.1聲道系統(tǒng)，人們通常說的DTS技術(shù)，或者DTS環(huán)繞，一般就是指DTS Digital Surround。DTS采用CAC（Coherent Acoustics Coding，相干聲學(xué)編碼）方式工作，和Dolby Digital一樣也屬于利用心理聲學(xué)原理來對聲軌進(jìn)行編碼的有損的數(shù)字壓縮技術(shù)。　　DTS系統(tǒng)中采用相干聲學(xué)編碼，主要目的就是用于

27、提高音頻重放設(shè)備重放的音頻質(zhì)量，其音頻重放質(zhì)量可以超越原有的如CD唱片的質(zhì)量。相干聲學(xué)編碼器是一種感知、優(yōu)化、差分子帶音頻編碼器，它使用了多種技術(shù)對音頻數(shù)據(jù)進(jìn)行壓縮。　　編碼過程:編碼過程中的第一步是通過一個多相濾波器組將每個聲道的全頻帶24比特線性PCM源信號進(jìn)行分割到一定數(shù)目的子帶中去。這種濾波方式提供了一種框架，既可以消除頻譜滾降較快的音頻信號分量，同時又去除了感知上的冗余度。多相濾波器只

28、要通過低復(fù)雜度的計(jì)算就可以實(shí)現(xiàn)更好的線性、更高的理論編碼增益和更理想的阻帶衰減。每一個子帶信號都包含了相應(yīng)的、嚴(yán)格限制帶寬的線性PCM音頻數(shù)據(jù)。子帶的個數(shù)及相應(yīng)的帶寬是由輸入源的帶寬來決定的，一般情況下分為32個獨(dú)立的子帶。　　相干聲學(xué)編碼器流程圖　　在每個子帶中進(jìn)行差分編碼(子帶ADPCM)，這一步可以去除信號中的客觀冗余量，如周期很短的信號。通過對信

29、號的對比分析、心理聲學(xué)及信號瞬態(tài)的分析可以判斷信號中的感知冗余信息。通過子帶范圍比特率的選擇和上述分析的結(jié)果，來調(diào)整對每個信號的差分編碼程序的執(zhí)行。差分編碼與心理聲學(xué)模型(如噪聲掩蔽門限)的結(jié)合可以得到較高的編碼效率，甚至可以在不影響主觀聽覺的基礎(chǔ)上進(jìn)一步降低比特率。如果使用較高的比特率，那么對于心理聲學(xué)模型的依賴性則相對較弱但可以肯定隨著比特率的增加編碼信號的保真度也會提高。　　比特指派程序管

30、理著所有音頻聲道中子帶信息的編碼指派和分配。在時間和頻率上的自適應(yīng)可以優(yōu)化音頻質(zhì)量。作為音頻編碼系統(tǒng)設(shè)計(jì)的基礎(chǔ)，比特指派程序通過對音頻信號比特的分配和使用的比特率來決定音頻質(zhì)量。通過在編碼策略中獨(dú)立的執(zhí)行這些程序使得運(yùn)算的復(fù)雜程度大大提高，但是這樣做卻可以使得解碼器相對的簡單。相反，隨著比特率的增加，比特指派程序的靈活性也將大大降低，但是可以確保音頻質(zhì)量的透明性。　　編碼過程中最后一步就是將來自

31、每個子帶ADPCM處理后的音頻數(shù)據(jù)進(jìn)行數(shù)據(jù)復(fù)用(或稱打包)。數(shù)據(jù)復(fù)用器將所有聲道中子帶數(shù)據(jù)加上附加的輔助信息進(jìn)行打包，形成特殊數(shù)據(jù)語法格式的編碼數(shù)據(jù)流。在數(shù)據(jù)流中加入的同步信息將用于解碼器對編碼數(shù)據(jù)流的同步。　　MPEG多聲道編碼　　MPEG-2 BC&l

32、t;p>　　ITU-R工作組在關(guān)于多聲道聲音系統(tǒng)的建議方面進(jìn)行了工作。該項(xiàng)工作的主要成果就是說明一個適當(dāng)?shù)亩嗦暤缆曇襞渲脩?yīng)包含五個聲道，分別代表左、中央、右、左環(huán)繞、右環(huán)繞聲道。如果使用了一個作為選項(xiàng)的低頻增強(qiáng)聲道（LFE），則該配置被稱為“5.1”。五聲道配置也可表示為‘3/2’，即三個前置聲道及兩個環(huán)繞（后置）聲道。 　　MPEG也認(rèn)識到應(yīng)根據(jù)ITU-R的建議來增加音頻標(biāo)準(zhǔn)的多聲道能力

33、的必要性，由此產(chǎn)生了MPEG-2 BC音頻標(biāo)準(zhǔn)。在多聲道聲音方面的擴(kuò)展支持在一路碼流中傳輸五個輸入聲道、低頻增強(qiáng)聲道以及7個邊聲道。該擴(kuò)展與MPEG-1保持前向及后向兼容。前向兼容性意味著多聲道解碼器可正確地對立體聲碼流進(jìn)行解碼。后向兼容性則意味著一個標(biāo)準(zhǔn)的立體聲解碼器在對多聲道碼流進(jìn)行解碼時可輸出兼容的立體聲信號。它是通過一種真正的可分級方式實(shí)現(xiàn)的。在編碼器端，五個輸入聲道被向下混合為一路兼容立體聲信號。該兼容立體聲信號按照MPE

34、G-1標(biāo)準(zhǔn)進(jìn)行編碼。所有用于在解碼器端恢復(fù)原來的五個聲道的信息都被置于MPEG-1的附加數(shù)據(jù)區(qū)內(nèi)，該數(shù)據(jù)區(qū)被MPEG-1解碼器忽略。這些附加的信息在信息聲道T2、T3及T4以及LFE聲道中傳輸，這幾個信息聲道通常包含中央、左環(huán)繞和右環(huán)繞聲道。MPEG-2多聲道解碼器不但對碼流中的MPEG-1部分進(jìn)行解碼，還對附加信息聲道T2、T3、T4及LFE解碼。根據(jù)這些信息，它可以恢復(fù)原來的5.1聲道聲音。

35、　　當(dāng)相同碼流饋送至MPEG-1解碼器時，解碼器將只對碼流的MPEG-1部分進(jìn)行解碼，而忽略所有附加的多聲道信息。由此它將輸出在MPEG-2編碼器中經(jīng)向下混合產(chǎn)生的兩個聲道。這種方式實(shí)現(xiàn)了與現(xiàn)有的雙聲道解碼器的兼容性。也許更為重要的是，這種可分級的方式使得即使在多聲道業(yè)務(wù)中仍可使用低成本的雙聲道解碼器?？紤]到所使用的其它所有編碼策略，多聲道業(yè)務(wù)中的雙聲道解碼器本質(zhì)上就是一個對所有聲道進(jìn)行解碼并在解碼器中產(chǎn)生雙聲道向下混合信號的多聲道

36、解碼器。如圖所示。 　　就其包含了不同的可由編碼器使用以進(jìn)一步提高音頻質(zhì)量的技術(shù)而言，該標(biāo)準(zhǔn)是具有很大靈活性的。　　MPEG-2 AAC 　　AAC可以支持1到48路之間任意數(shù)目的音頻聲道組合、包括15路低頻效果聲道、配音/多語聲聲道，以及15路數(shù)據(jù)。它可同時傳送16套節(jié)目，每套節(jié)目的音頻及數(shù)據(jù)結(jié)構(gòu)可任意規(guī)定。在

37、碼率為64kbps/聲道的條件下，AAC可以提供很高的聲音質(zhì)量。 　　為提高音頻編碼效率，AAC采用了許多先進(jìn)技術(shù)，如霍夫曼編碼、相關(guān)立體聲、聲道耦合、反向自適應(yīng)預(yù)測、時域噪聲整形、修正離散余弦變換（MDCT）、及混合濾波器組等。 　　其中，濾波器組與MPEG層III所采用的濾波器組相比，由于層III算法在對濾波器進(jìn)行選擇時考慮了兼容性問題，因而具有固有

38、的結(jié)構(gòu)上的不足；而AAC則直接采用了MDCT變換濾波。同時，AAC增加了窗口長度，由1152點(diǎn)增至2048，使MDCT的性能優(yōu)于原來的濾波器組。 　　時域噪聲整形（TNS）技術(shù)是時域/頻域編碼中一項(xiàng)新穎的技術(shù)。它利用頻域的自適應(yīng)預(yù)測的結(jié)果來對時域中量化噪聲的分布進(jìn)行整形處理。通過采用TNS技術(shù)，可以使特殊環(huán)境下的話音信號質(zhì)量得到顯著的提高。 　　后向自適

39、應(yīng)預(yù)測是一項(xiàng)在語音信號編碼系統(tǒng)領(lǐng)域建立起來的技術(shù)。它主要利用了某一特定形式的音頻信號易于預(yù)測的特點(diǎn)。在量化過程中，通過對量化精度更為精細(xì)的控制，可以使給定的碼率得到更加有效的利用。在碼流復(fù)接時，通過對必須傳輸?shù)男畔⑦M(jìn)行熵編碼使冗余度降至最低。通過以上各種編碼技術(shù)的運(yùn)用以及采用一種可變的碼流結(jié)構(gòu)，使AAC編碼算法在得到大大優(yōu)化的同時，也為將來進(jìn)一步提高編碼效率提供了可能性。 　　AC可以在低

40、數(shù)據(jù)率的情況下提供較高質(zhì)量的音頻信息，如每個聲道僅64kb/s時就會有比較好的性能。 AAC當(dāng)前的應(yīng)用主要用于日本的數(shù)字音頻廣播及美國的IBOC（帶內(nèi)同頻技術(shù)）。 　　MPEG Surround　　MPEG Surround把多聲道音頻信號下混為正常的雙聲道數(shù)字音頻信號并提取表達(dá)聲像信息的參數(shù)，這些參數(shù)在解碼端與雙聲道信號一起使用，以恢復(fù)出高質(zhì)量的多聲道

41、信號。以下是它的整體框架圖：　　圖1 MPEG Surround整體框圖　　環(huán)繞MPEG編碼過程可通過三個步驟來描述：對每一個音頻通道分解其環(huán)繞信息的參量描述（提取環(huán)繞信息）；把各個通道混合成為單聲道或者立體聲的音頻（下混）；混合后的音頻通過核心音頻編解碼器進(jìn)行編碼并嵌入之前分解得到的環(huán)繞參量。如下是示意圖。

42、　在解碼端，混合后的音頻通過核心編解碼器解碼，并根據(jù)內(nèi)嵌的環(huán)繞信息參量重建完整的多通道信號。環(huán)繞MPEG數(shù)據(jù)是嵌入在比特流的額外數(shù)據(jù)部分，因此只會被環(huán)繞MPEG解碼系統(tǒng)所辨認(rèn)。對應(yīng)于內(nèi)嵌在環(huán)繞MPEG編碼系統(tǒng)內(nèi)部的核心編碼器，其傳統(tǒng)版本的立體聲解碼器會簡單地忽略掉環(huán)繞MPEG數(shù)據(jù)去解碼混合后的音頻信號。下圖分別為僅支持立體聲的解碼端和支持環(huán)繞MPEG的解碼端的示意圖：　　與BCC直接下混到一個聲

43、道的方式不同，MPEG Surround實(shí)現(xiàn)的是逐級下混的方法，采用2至1（One to Two, OTT）和3至2（Two to Three, TTT）兩種基本下混模塊（圖2），最終下混到一個或兩個聲道。　　(a)分析 (b) 合成　　圖2 5.1聲道樹狀結(jié)構(gòu)圖　　這種樹狀

44、分析和提取的下混結(jié)構(gòu)使得MPEG Surround具有較強(qiáng)的聲道可擴(kuò)展性，可以方便地進(jìn)行5.1、7.1甚至更多聲道的編碼，并且其雙下混聲道還可與當(dāng)前立體聲回放設(shè)備自然融和。此外，MPEG Surround在低碼率下對合成的空間參數(shù)采用參數(shù)平滑的后處理技術(shù)，避免了低碼率下重建聲中聲源位置的跳躍。　　為適應(yīng)多聲道應(yīng)用，MPEG Surround采用了基于混響濾波器的去相關(guān)技術(shù)首先下混聲道經(jīng)混響濾波器

45、生成統(tǒng)計(jì)獨(dú)立的信號，然后對它們進(jìn)行加權(quán)求和求出各個輸出聲道，使它們有給定的相關(guān)度值。該方法在數(shù)學(xué)上模擬了物理上的混響效應(yīng)，使合成信號在聲象的穩(wěn)定性、分布范圍的準(zhǔn)確度和飽滿度方面等方面較BCC有了很大的提高。此外混響去相關(guān)技術(shù)與時頻域的包絡(luò)整形技術(shù)結(jié)合，降低了合成失真，進(jìn)一步改善了音質(zhì)　　Ogg Vorbis多聲道音頻編碼算法　　Ogg Vorbis編碼特

46、點(diǎn)　　Ogg Vorbis是近年來由美國公司Xiph.Org Foundatinn開發(fā)的通用感覺音頻編碼器，其特點(diǎn)是:源碼完全開放、無專利限制，具有較大編碼靈活性。在高質(zhì)量(高比特率)級別CD或DAT立體聲，16/24bit量化時，與現(xiàn)在的MPEG-2和MPEG-4等音頻算法相當(dāng); Ogg Vorbis編碼器在沒有重新采樣到低采樣率時，可將CD高質(zhì)量立體聲信號壓縮到低于48KPs比特率。輸出碼率

47、可設(shè)置為(平均比特率)ABR或(可變比特率)VBR，范圍為16-128Kbps/ch，輸入音頻信號支持:采樣率8-192kHz;量化分辨率16-24bit量化;聲道數(shù):單聲道、立體聲、4聲道、5.1聲道，最高可支持255獨(dú)立聲道。　　Ogg Vorbis，設(shè)計(jì)成一個具有心理聲學(xué)模型的復(fù)雜編碼器，但解碼運(yùn)算復(fù)雜度低于MP3。沒有提供幀格式、同步及錯誤保護(hù)等，僅僅是接收輸入的音頻數(shù)據(jù)塊，并壓縮成數(shù)據(jù)

48、包方式。解碼器按順序接收元數(shù)據(jù)包，解碼并把音頻幀合成，然后把音頻幀合成原始音頻流。因此Vorbis數(shù)據(jù)包可用于任何能夠提供幀格式、同步、定位及錯誤保護(hù)的一個傳輸機(jī)制，如Ogg (文件傳輸)或RTP(網(wǎng)絡(luò)傳輸)。　　Ogg Vorbis編碼原理　　Vothis編碼過程的基本過程如下圖所示，首先對音頻PCM信號進(jìn)行穩(wěn)態(tài)/瞬態(tài)分析，決定MDCT(Modifie

49、d Discrete Cosine Transform，改進(jìn)的離散余弦變換)的長度:同時原始音頻信號要進(jìn)行FFT分析。2種變換的的頻譜系數(shù)輸入給心理聲學(xué)模型單元，MDCT系數(shù)用于噪聲掩蔽計(jì)算，F(xiàn)FT結(jié)果用于音調(diào)掩蔽特性計(jì)算，共同構(gòu)造總的掩蔽曲線，然后根據(jù)MDCT系數(shù)及掩蔽曲線，對頻譜系數(shù)進(jìn)行線性預(yù)測分析，用LPC線性預(yù)測系數(shù)表示頻譜包絡(luò)即基底曲線(filoor);或者通過線性分段逼近方式獲得基底曲線。從MDCT系數(shù)中去掉頻譜包絡(luò)則得到白

50、化的殘差(residue)頻譜，由于殘差頻譜動態(tài)范圍明顯變小，從而降低量化誤差。之后要采用聲道耦合技術(shù)(stereo channel coupling)122]進(jìn)一步降低冗余度，耦合主要是將左右聲道數(shù)據(jù)從直角坐標(biāo)映射到平方極坐標(biāo);然后對白化的殘差信號以矢量量化VQ的形式表示。最后將要傳輸?shù)母鞣N信息數(shù)據(jù)按vothis定義的包格式組成，形成vorbis壓縮碼流。　　Ogg Vorbis 編碼原理框圖

眾賞文庫> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

多聲道編碼現(xiàn)狀

文檔簡介

溫馨提示

最新文檔

評論

多聲道編碼現(xiàn)狀

文檔簡介

溫馨提示

最新文檔

評論

免費(fèi)下載