正弦-小波包混合感知音頻編碼技術(shù)研究.pdf

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-03-10 格式：pdf 頁數(shù)：133 大?。?.19MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

2023年全國(guó)碩士研究生考試考研英語一試題真題（含答案詳解+作文范文）_第1頁

已閱讀1頁，還剩132頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、低比特率音頻編碼可以減少傳輸音頻信號(hào)對(duì)信道帶寬的要求,流暢地實(shí)現(xiàn)網(wǎng)絡(luò)傳輸,還可以節(jié)約存儲(chǔ)空間,降低存儲(chǔ)的成本,具有重要的實(shí)用價(jià)值.MPEG音頻編碼標(biāo)準(zhǔn)采用了頻域的量化和編碼算法,將音頻信號(hào)分成短的編碼塊,假定每個(gè)編碼塊為穩(wěn)態(tài)信號(hào),然后將每個(gè)編碼塊轉(zhuǎn)換到頻域進(jìn)行量化和編碼;對(duì)于存在瞬態(tài)信號(hào)的編碼塊,將編碼塊分成更短的編碼塊,轉(zhuǎn)化到頻域,進(jìn)行量化和編碼.由于MPEG音頻編碼標(biāo)準(zhǔn)中編碼塊長(zhǎng)度短,編碼過程中,邊信息在整個(gè)比特流中所占的比重較大;

2、在MP3編碼比特流中,邊信息所占的比重約為11.5﹪.本文中研究了利用正弦/小波包混合感知音頻編碼技術(shù)來實(shí)現(xiàn)在低比特率對(duì)音頻信號(hào)的編解碼:小波包音頻編碼器利用了小波的時(shí)頻局部化特性,實(shí)現(xiàn)對(duì)穩(wěn)態(tài)和瞬態(tài)音頻信號(hào)的描述,因此可以選用較長(zhǎng)的編碼塊,邊信息在比特流中的比重較小,在低比特率下可以實(shí)現(xiàn)對(duì)音頻信號(hào)的高質(zhì)量編碼;本文中編碼器編碼比特流中,邊信息所占的比重為3.89﹪.由于小波包濾波器組頻域分辨率低,在純音分量占豐導(dǎo)地位的音頻信號(hào)中,采用小

3、波濾波器組不能對(duì)占頻信號(hào)做最簡(jiǎn)潔地描述.對(duì)于這種信號(hào),木文中先采用正弦分量提取,然后將剩余的殘羞信號(hào)利用小波進(jìn)行描述. 本文研究工作有四部分,第一部分對(duì)小波包域心理聽覺模型進(jìn)行了研究. 首先研究了人耳心理聽覺的掩蔽原理,人耳心理聽覺時(shí)頻域掩蔽現(xiàn)象;然后根據(jù)文中音頻編碼器的需要,改進(jìn)了MPEG音頻編碼標(biāo)準(zhǔn)中的頻域心理聽覺模型;最后利用頻域和小波域的對(duì)稱性,提出了新的直接轉(zhuǎn)化算法,將頻域得到的心理聽覺掩蔽閾值轉(zhuǎn)化到小波域的各

4、個(gè)子帶中.測(cè)試結(jié)果表明:采用各個(gè)子帶的最大許用量化能量失真來對(duì)相應(yīng)子帶中的小波變換系數(shù)進(jìn)行量化反量化后重建,所獲得重建音頻信號(hào)的質(zhì)量略好于MP3音頻編解碼器重建音頻信號(hào)的質(zhì)量. 第二部分研究了語音和音頻信號(hào)中正弦分量的提取,提出了PPMMSE算法,從語音和音頻信號(hào)中提取出正弦分量. 首先計(jì)算分析信號(hào)的功率譜,確定功率譜曲線最大峰值處對(duì)應(yīng)的頻率,然后在以該頻率為中心的小區(qū)間內(nèi),采用最小均方誤差法提取正弦分量,將提取的正弦分

5、量從分析信號(hào)中去除;然后再計(jì)算殘差信號(hào)的功率譜,找到功率譜最大峰值處對(duì)應(yīng)的頻率,確定出將要提取正弦分量的頻率,振幅和初相位;依次類推從分析信號(hào)塊內(nèi)提取出所有的正弦分量.相對(duì)于峰值拾取算法,本文所提出的算法不僅適用于穩(wěn)態(tài)信號(hào),而且適用于瞬態(tài)信號(hào),得到參數(shù)的精度較高;十日對(duì)于最小均方誤差算法,該算法得到參數(shù)的精度高,計(jì)算復(fù)雜度遠(yuǎn)遠(yuǎn)小于采用最小均方誤差算法需要的計(jì)算復(fù)雜度. 第三部分研究了小波包音頻編碼中濾波器和小波變換系數(shù)的量化和碼

6、率控制. 首先研究了信號(hào)多分辨率描述的原理以及快速算法實(shí)現(xiàn);然后根據(jù)人耳的臨界帶選擇了小波包分解樹結(jié)構(gòu).提出了采用DB20和DB5兩種小波自適應(yīng)切換分別來實(shí)現(xiàn)對(duì)穩(wěn)態(tài)和瞬態(tài)音頻編碼塊的描述;最后研究了小波變換系數(shù)的量化算法;對(duì)小波變換系數(shù)采用了全局均勻矢量量化,和局部子帶小波變換系數(shù)放大,來實(shí)現(xiàn)恒比特率的音頻編碼.采用內(nèi)外環(huán)技術(shù)來控制比特率,在內(nèi)環(huán)控制音頻編碼的比特率,在外環(huán),通過調(diào)整放大兇子來控制各個(gè)子帶的量化能量失真.

7、第四部分中,對(duì)正弦/小波包混合音頻編解碼器系統(tǒng)進(jìn)行了研究. 改進(jìn)了正弦/小波包混合音頻編解碼器框圖.在該框圖中,采用PPMMSE算法從音頻信號(hào)中提取正弦分量,融入了內(nèi)外環(huán)碼率控制模塊,頻域心理聽覺模型轉(zhuǎn)化到小波域模塊,和自適應(yīng)小波切換模塊;研究了音頻編碼比特流的語法結(jié)構(gòu),最后對(duì)音頻編解碼器進(jìn)行主客觀質(zhì)量評(píng)定,結(jié)果表明:對(duì)于大多數(shù)測(cè)試信號(hào)單通道在64kb/s進(jìn)行編碼,本文所提供的音頻編解碼器獲得重建音頻信號(hào)的質(zhì)量好于MP3音頻編

8、解碼器扶得重建音頻信號(hào)的質(zhì)量;編碼器計(jì)算復(fù)雜度略大于MP3占頻編碼器的計(jì)算復(fù)雜度. 本文的創(chuàng)新點(diǎn)如下: ●提出了新的直接轉(zhuǎn)化算法,將改進(jìn)后頻域得到的心胛聽覺掩蔽閾值直接轉(zhuǎn)化為小波域相應(yīng)了帶變換系數(shù)的最大許用量化誤差能量失真. ●提出了PPMMSE算法,從分析語音和音頻信號(hào)中提取正弦分量;并將該算法應(yīng)用到正弦/小波包混合感知音頻編碼器中. ●提出了采用DB20和DB5兩種小波自適應(yīng)切換分別來實(shí)現(xiàn)對(duì)穩(wěn)態(tài)和瞬態(tài)

眾賞文庫> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

正弦-小波包混合感知音頻編碼技術(shù)研究.pdf

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

正弦-小波包混合感知音頻編碼技術(shù)研究.pdf

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載