版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、<p><b> 摘要</b></p><p> 語音信號分離是近幾十年來廣泛應(yīng)用于通信、雷達、電子醫(yī)學(xué)等方面的發(fā)展方向,其理論基礎(chǔ)是語音信號的盲源分離。本文主要介紹了盲源分離和獨立分量分析概念以及相關(guān)知識,探討ICA研究中的主要問題。盲信號處理算法分為批處理算法和自適應(yīng)算法兩類,研究得到一種批處理和自適應(yīng)相結(jié)合的快速獨立分量分析(fast independent compon
2、ent analysis, Fast ICA)算法。在語音信號的處理和分離中,聲音的信號多種多樣,但是來自不同語音源的信號保持相對獨立,利用此特點及盲信號分離的思想,將Fast ICA算法作用在語音信號的分離上,從而獲得獨立的聲音文件。</p><p> 本文重點研究了盲信號處理的思想和ICA算法,明確了ICA方法的數(shù)學(xué)模型、基本假設(shè)條件以及ICA目標函數(shù)的估計準則。本文使用三個聲音文件做實驗,用matlab進
3、行仿真試驗,通過分離前后的波形圖進行對比與分析,來證明該算法具有良好的語音信號分離效果。</p><p> 關(guān)鍵詞:語音信號分離;盲信號處理算法;獨立分量分析;ICA固定點算法</p><p><b> 英文摘要</b></p><p><b> 緒論</b></p><p><b>
4、; 研究背景與意義</b></p><p> 數(shù)字信號處理技術(shù)是1960年開始,伴隨著計算機技術(shù)的發(fā)展而迅速發(fā)展起來的一門學(xué)科技術(shù)。從誕生起,它便顯示出了龐大的潛力,并很快在諸如雷達和聲納,電子通訊工程,以及電子生物醫(yī)學(xué)等領(lǐng)域中應(yīng)用于實際,并且取得了非常好的效果,使人們對這門技術(shù)給予了很大的期望。但是由于早期技術(shù)能力的不足,數(shù)字信號處理主要是根據(jù)一個高斯穩(wěn)態(tài)信號和系統(tǒng)限制因果最小相位系統(tǒng)的假設(shè),而
5、信號的分析主要使用其相關(guān)函數(shù)(時域)和功率譜(頻域)等二階統(tǒng)計信息。因為在許多情況下,這些假設(shè)大致成立,因此通過實際需要的數(shù)字信號處理技術(shù)的發(fā)展迅速并逐漸完善,且被日益廣泛的應(yīng)用。</p><p> 在這同時,信息理論,人工神經(jīng)網(wǎng)絡(luò),多維信號處理技術(shù),進化算法,模糊推理,盲信號處理等等技術(shù)在過去十年中取得的突破顯著,并已經(jīng)應(yīng)用到信號處理領(lǐng)域。在理論和技術(shù)方面,這些新的突破已逐漸成為現(xiàn)代信號處理的里程碑。使得無論
6、各行各業(yè)的研究人員都需要學(xué)習(xí)并掌握現(xiàn)代信號處理方法,并將其應(yīng)用于行業(yè)中。</p><p> 隨著數(shù)字信號處理技術(shù)的應(yīng)用在各個領(lǐng)域的應(yīng)用逐漸深化,以及數(shù)字信號處理技術(shù)本身的不斷發(fā)展,大家開始并不滿足于處理線性時不變因果最小相位系統(tǒng)以及平穩(wěn)高斯信號,以及經(jīng)典的信號處理理論,因此非平穩(wěn),非高斯和非線性、時變的非因果最小相位系統(tǒng)被推出舞臺。同時,由于對于高階統(tǒng)計量和小波變換的研究有很大的進展,現(xiàn)在已經(jīng)能夠?qū)?非高斯以及
7、非平穩(wěn)信號進行信號分析并進行處理。曾經(jīng)一度讓人認為無法解決的加性有色噪聲的信號處理,也已經(jīng)取得了實質(zhì)性的進展。此外,自適應(yīng)信號處理算法以及高分辨率頻譜分析等方面也有了突破性的發(fā)展。</p><p><b> 本文研究方向</b></p><p> 雞尾酒會效應(yīng)(cocktail party effect),也稱為選擇性關(guān)注(selective attention)
8、,即為盲源分離的一個實際例子,指人在嘈雜的環(huán)境中或者很多人同時說話的環(huán)境下依舊能分辨出自己感興趣的聲音,這說明人類的大腦可以進行類似于盲源語音分離的工作,在實驗中,我們并不能認為計算機可以完全替代人腦對于語音的識別程度,但是通過軟件將原本混合在一起的語音信號分開,來模擬嘈雜環(huán)境下的語音識別是可以實現(xiàn)的。</p><p><b> 盲信號處理相關(guān)知識</b></p><p
9、><b> 盲信號處理的概述</b></p><p> 盲信號處理(Blind Signal Processing, BSP)是近年來在現(xiàn)代數(shù)學(xué)信號處理領(lǐng)域中的重要發(fā)展方向。它指在信號在無參考信號的條件下,來估計出原始信號的方法,用系統(tǒng)的輸出數(shù)據(jù),通過處理手段來獲得我們想要了解的相關(guān)信息。盲信號處理已經(jīng)能夠在移動通信、電子信息處理、生物醫(yī)學(xué)工程、雷達與探測等等專業(yè)領(lǐng)域中廣泛應(yīng)用。&
10、lt;/p><p> 盲信號處理中的“盲”指信號源是未知的,并且混合信號也是未知的,因此我們在盲信號處理的過程中無法使用這點。例如,人們在用移動設(shè)備通信時,發(fā)出的信號是未知的,而且如果人們在大街上打電話,過程中可能在不斷走動,信號源也會移動,導(dǎo)致信道不斷變化,因此這也是未知的。通信的任務(wù)即為從接受到的信號去恢復(fù)本身的原始信號。</p><p> 盲信號處理雖然是近幾十年內(nèi)才剛剛發(fā)展起來的一
11、門新研究領(lǐng)域,但是由于其應(yīng)用范圍廣泛,使得各國科研人員都大力投入在這門學(xué)科中,但是研究進程不算太快,因為其涉及的知識面以及應(yīng)用面都很廣闊但是理論卻并不是很成熟,因此其中的許多問題都需要進一步的探討和解決。例如以下幾方面:</p><p> 1、帶噪聲的語音信號盲處理</p><p> 很多實際應(yīng)用的情況下,混合語音信號中往往摻雜著許多噪音,由于本身限制信號處理的制約條件就已經(jīng)很多,因此
12、在含有大量噪音的情況下去進行盲信號處理還是十分困難的,即使現(xiàn)在很多算法在原語音信號含有噪聲的情況下也能展現(xiàn)出較好的處理性能,但是由于噪聲種類繁多并且不好控制,進行盲信號處理還是有很大程度的制約。因此在現(xiàn)有的多數(shù)盲信號處理的計算方法中,都會假設(shè)原信號不含噪音,亦或者是將噪音看作另一個獨立的原信號來進行處理。</p><p> 2、非平穩(wěn)的語音信號盲處理</p><p> 我們的計算過程中
13、一般使用的是平穩(wěn)的語音信號,但是實際情況中,很多原信號都是非平穩(wěn)的。在非平穩(wěn)特性下如何進行盲信號處理也是該學(xué)科所面臨的一大難題。</p><p> 3、卷積語音信號的盲處理</p><p> 我們進行盲信號處理時一般使用的是直接傳遞來的語音信號,而大部分實際情況中,系統(tǒng)接收到的信號是通過不同途徑傳遞到接收器中的信號,在傳遞的過程中,必然會產(chǎn)生信號的反射過程,使得接收到的信號并非原信號本
14、身,在這種情況下的信號盲處理還沒有什么很好的解決方式。</p><p> 4、ICA算法的實際應(yīng)用</p><p> 在進行科學(xué)研究中,我們可以在理論的狀態(tài)下用ICA算法進行識別語音、處理圖像、雷達聲吶信號處理、處理電子醫(yī)學(xué)信號等等,但是如何將純理論狀態(tài)下的算法進行實際推廣還有一定難度,因為實際情況遠遠比理論狀態(tài)下要復(fù)雜的多。將ICA算法推廣到實際應(yīng)用是這門學(xué)科發(fā)展的當務(wù)之急。<
15、/p><p><b> 盲信號處理的方法</b></p><p> 盲信號處理依據(jù)其經(jīng)過傳輸信道的混合方式可劃分為三類,依次為線性瞬時混合信號盲處理、線性卷積混合信號盲處理以及非線性混合信號盲處理三類。</p><p> 依據(jù)其原信號和觀測信號數(shù)目的差距可劃分為欠定、適定和超定三種情況。</p><p> 依據(jù)其原信
16、號分布的不同可劃為超高斯、亞高斯、超高斯和亞高斯混合分離,同時其信號還可分為平穩(wěn)、非平穩(wěn)等。</p><p> 依據(jù)其信道中是否有噪聲及其特性可劃分為有噪聲、無噪聲、含加性噪聲和乘性噪聲等。</p><p> 而與此同時,我們可以把盲信號處理的目的分為兩種,即盲辨識和盲源分離。一般情況下,我們需要先進行盲辨識,之后進行盲源分離處理。其中盲辨識的目的是為了求出傳輸通道中用的何種混合矩陣來
17、組成混合系統(tǒng)。而盲源分離的目的則是為了通過混合矩陣來求出原信號的最佳估計。</p><p> 盲信號處理的研究與應(yīng)用</p><p> 近幾年來,盲信號處理已然成為當今時代信息處理領(lǐng)域的熱門話題之一,特別是在生物醫(yī)學(xué)工程,醫(yī)學(xué)影像,語音增強,通信系統(tǒng),地震勘測,地球物理,計量經(jīng)濟學(xué)和數(shù)據(jù)挖掘等領(lǐng)域表現(xiàn)出龐大的發(fā)展?jié)摿Γ绕涫敲ぴ捶蛛x技術(shù),通過ICA技術(shù)的不斷挖掘和應(yīng)用于實際,它已經(jīng)變得
18、相當令人矚目。</p><p> 下面介紹盲信號處理被應(yīng)用的最為廣泛的兩個領(lǐng)域:</p><p><b> 1、生物醫(yī)學(xué)信號</b></p><p> 在生物醫(yī)學(xué)領(lǐng)域,盲信號處理可以被應(yīng)用到心電圖(ECG),腦電圖(EEG)信號分離,可聽信號分析,以及功能性磁共振成像(FMRI)分析等等方面?,F(xiàn)在在電子醫(yī)學(xué)方面,心腦電圖等等的數(shù)據(jù)處理上,
19、已經(jīng)很廣泛的應(yīng)用了盲信號處理的思想與技術(shù)來進行識別、除偽跡等工作。</p><p><b> 2、語音識別領(lǐng)域</b></p><p> 語音識別是新一代人機交互所需的重要技術(shù)之一,也是機器即將更加人性化所需的技術(shù)基礎(chǔ),而噪聲則是阻礙其進行語音識別的主要影響原因之一,尤其是類似于“雞尾酒會效應(yīng)”的環(huán)境下,噪聲復(fù)雜且多變,這使得機器想進行語音識別變得更加的困難,而盲
20、信號處理就可以幫助去除噪音,起到抑制信號干擾,加強語音信號程度,提高語音質(zhì)量的重要作用,因此盲信號處理在語音識別領(lǐng)域起到了重要的推進作用。</p><p><b> 獨立分量分析</b></p><p> 獨立分量分析(Independent Component Analysis, ICA)是1990年前后得以發(fā)展并被廣泛認知和使用的一種新型信號處理技術(shù),它是一種
21、從多個源信號通過混合系統(tǒng)得出的線性混合信號中,通過計算混合矩陣,來分離出源信號的技術(shù)。在這個計算過程中,除去已知源信號是相互獨立以外并無其它條件,來分離或近似分離出原信號的分析過程。</p><p> 從原理上來講,只靠單一通道去觀察信號本身是無法做到這種目的的分解手段,只有通過尋求一組把這些信源按不同混合組合起來的多通道同步觀察才有可能完成。從另一個方面講,ICA是多導(dǎo)信號的一種處理方法,但是把一組觀察信號分
22、解成幾個獨立成分,分解結(jié)果必然不唯一,因此分解需要加一定的約束條件來使得到的答案更接近我們所期望的結(jié)果。ICA算法是基于在各個領(lǐng)域中困擾許久的盲源問題而被廣泛重視并研究的,故其又稱盲源分離算法。</p><p><b> 獨立分量分析的定義</b></p><p> ICA是在多變量(多維)統(tǒng)計數(shù)據(jù)中來找出其中隱藏因素及成分的手段,它被廣泛認為是主要成分分析(Pr
23、incipal Component Analysis, PCA)和因子分析(Factor Analysis)的擴展手段。ICA是在僅知混合信號而不知源信號、混合機制及噪聲干擾的情況下,</p><p> 在信號處理領(lǐng)域中,盲信號處理(其中包括盲辨識、盲信源分解、盲通道均衡等等)是在20世紀90年代后期才發(fā)展起來的,ICA是其中的一個重要組成部分。最早提出ICA理念的是Jutten與Herault分別于1986年
24、和1991年在Signal Processing期刊上發(fā)表的論文。他們在論文中闡述的理念讓人耳目一新,但是理論上卻不夠完善。在這之后,由Comon在1994年發(fā)表了一份新的論文,在理論上賦予了比較嚴密的數(shù)學(xué)定義。到了20世紀末,隨著科學(xué)技術(shù)的發(fā)展,ICA出現(xiàn)了很多不同的處理算法,被廣泛應(yīng)用于全世界很多科研單位的科學(xué)研究中。</p><p> 從時間上我們可以看出,ICA的發(fā)展歷程非常晚,從出現(xiàn)到現(xiàn)在時間很短,但
25、是不論是理論上還是實際應(yīng)用上,ICA都在被世人所廣泛關(guān)注著,在國內(nèi)外都是重點的研究對象。特別在應(yīng)用方面,ICA所展示出的適用范圍和前景是十分可觀的。目前其主要應(yīng)用于盲源分離、語音識別、通信領(lǐng)域、生物醫(yī)學(xué)工程、心腦功能成像、時間序列分析以及數(shù)據(jù)挖掘等等領(lǐng)域。</p><p><b> ICA基本概念</b></p><p> ICA 的基本過程如下圖所示</p
26、><p><b> 圖 21</b></p><p> 由圖示,在信源s(t)中的各個分量相互獨立的前提下,經(jīng)過混合系統(tǒng)A混合,再由觀察x(t)來通過解混系統(tǒng)B將其分離開來,使得輸出的y(t)能夠最大限度的逼近于s(t)。一般情況下,我們將解混系統(tǒng)分為兩步——即為球化W和正交變換系統(tǒng)U,通過這兩步來達到解混的目的。</p><p> 并且通
27、過這個整體過程我們可以知道,獨立分量分析實際上只是一個優(yōu)化手段,因為這個問題其實并沒有唯一解,我們所能做的只是在某一衡量獨立性的判斷依據(jù)最優(yōu)的意義下來尋求問題的最近似答案,來使得y(t)中的各個分量能夠盡可能的相互獨立;y(t)與s(t)不只是相互近似,得出的結(jié)果在幅度大小和排列順序上都允許它們有一定程度的不同。</p><p> 解混系統(tǒng)B中,我們采用兩步法來進行解混時,第一步的“球化”是使輸出z(t)的各個
28、分量z1(t)、z2(t)等等的方差為1,并且互不相關(guān)(但不一定相互獨立);第二步的“正交變換”是使輸出的分量y1、y2等等的方差繼續(xù)保持為1,同時使其相互獨立。</p><p> 由于輸出的z1(t)、z2(t)等分量均滿足了二階統(tǒng)計量中對于獨立性的要求,因此進行第二步的時候我們只需要考慮三階以上的統(tǒng)計量(通常情況下主要是三階和四階統(tǒng)計量),來使算法能夠簡化。因此在各種文獻中,有時能看到將ICA成為一種“對于
29、任意多變量數(shù)據(jù)來尋求一種非正交坐標系統(tǒng)的分解方法”。其中的坐標軸方向是由二階以及高階統(tǒng)計量來決定的。</p><p> 圖2-1中的流程圖中并沒有考慮噪聲,這種情況下的模型如下:</p><p> 1、無噪聲ICA模型</p><p> 給定隨機變量的一組觀測x1(t)、x2(t)、x3(t)… xn(t),其中t是樣本或者時間的編號,假設(shè)他們是由獨立分量線性
30、混合而成的:</p><p><b> (2.1)</b></p><p> 式中的A即為混合系統(tǒng),是一個未知矩陣。</p><p> 用向量和矩陣符號方式來表述上式。隨機向量x指混合向量,由x1、x2… xn組成,s指元素s1、s2… sn,A指混合矩陣系數(shù)aij。</p><p> 利用向量和矩陣符號,可以
31、將混合模型表示成如下形式:</p><p><b> (2.2)</b></p><p> 如果在計算中要用到混合系統(tǒng)A中的列向量時,前模型也可以寫為如下形式:</p><p><b> (2.3)</b></p><p> 當我們將噪聲的情況考慮進去時,會得到以下情況。</p>
32、<p> 2、有噪聲ICA模型</p><p> 現(xiàn)實中很大部分情況,在語音信號處理中是有加性噪聲的存在的,我們將上面基本無噪聲ICA模型擴展到有噪聲的情況下,就會得到如下新的模型:</p><p><b> (2.4)</b></p><p><b> 式中的是噪聲向量。</b></p>
33、<p> 如果噪聲是直接添加在原信號的情況下時,信號原噪聲可用如下公式來表示:</p><p><b> (2.5)</b></p><p> 以上即為有噪聲情況下的ICA模型。</p><p><b> 語音信號特性與分析</b></p><p><b> 語音的
34、特性</b></p><p> 語音,即語言的物質(zhì)外殼,是人類交談的語言符號的傳輸系統(tǒng)。語音由人的發(fā)聲系統(tǒng)發(fā)出,承載著語言意義。</p><p> 語音的物理基礎(chǔ)主要為音長、音強、音調(diào)、音色,這是語音的四要素。</p><p> 音長,取決于發(fā)聲持續(xù)時間的長短,也可稱之為“時長”;音強指聲波振動幅度的大小,也稱“響度”;音調(diào)指聲波的頻率,即每秒鐘振
35、動次數(shù)的多少,頻率快則音調(diào)高,慢則音調(diào)低;音色指聲音的本質(zhì)與特色,也稱為“音質(zhì)”,是一種聲音相較于其余聲音信號辨識度的基本特質(zhì)。</p><p> 語音信號有如下兩點特性:</p><p><b> 1、短時平穩(wěn)性</b></p><p> 由對語音信號的研究我們可以知道,語音信號是一種不平穩(wěn)并且會隨時間改變的傳輸信號。而從另一個角度來說
36、,人的發(fā)聲系統(tǒng)的結(jié)構(gòu)在一定時間內(nèi)的變化是有限的,在極短的時間內(nèi)(10~30ms),人的聲帶形狀是基本穩(wěn)定不變的。由此我們可以認為語音的特性在較短的時間內(nèi)是穩(wěn)定不變的,語音的短時平穩(wěn)性是我們進行語音信號分析以及處理的基礎(chǔ)。</p><p><b> 2、清音和濁音</b></p><p> 語音主要分為清音、濁音以及爆破音三種,它們在產(chǎn)生的方式上有極大的差別,在這里
37、我們只討論清音與濁音。</p><p> 清音由隨機性噪音所產(chǎn)生,在時域和頻域上并無明顯周期性及特征,與白噪音相似;而濁音由周期性脈沖產(chǎn)生,在時域上有非常明顯的周期性,在頻域上濁音的能量主要出現(xiàn)在低頻段中,并且會有共振峰結(jié)構(gòu)。</p><p><b> 3、語音的時域特征</b></p><p> 在大部分情況下,發(fā)聲人說話內(nèi)容時間均不同
38、,毫無規(guī)律可言,所以語音信號是隨時改變的,但是由語音的短時平穩(wěn)性作為基礎(chǔ),我們才可以在語音處理中進行計算與分析。人在講話時,句與句、字與字之間必然會存在一定時間內(nèi)的間隔,因此從時域上來看,語音信號可以分為兩種音段:有音段和無音段。通過檢測語音信號中有音段和無音段,可以去除語音中比較明顯的噪聲,且無音段越多,語音的稀疏性就越好。</p><p><b> 4、語音的頻域特征</b></
39、p><p> 語音信號中,頻譜能量一般集中于的區(qū)間中。由于語音信號主要分為濁音和清音,濁音信號所含的能量較多,占據(jù)整個語音信號的大部分,頻譜集中在低頻段,并且會表現(xiàn)出周期性;清音信號出現(xiàn)則較隨機,在頻譜圖上基本與白噪音類似。</p><p> 有關(guān)語音信號處理的基礎(chǔ)知識</p><p> 根據(jù)所要分析的參數(shù)的不同,語音信號處理的手段又可分為時域、頻域、倒頻域等手段
40、。其中時域分析較簡潔,并且物理意義十分明確。</p><p> 在進行頻譜分析時,我們需要對語音信號進行加窗處理,通過一個波形函數(shù)的分段來使得每次只需要處理“窗”所分出的數(shù)據(jù)。由于在顯示中,語音信號一般有一定長度,而我們并不需要對所有數(shù)據(jù)進行一次性處理。語音信號一般是在10~30ms之間,我們可將其視為平穩(wěn)的。因此我們可以每次只取一段數(shù)據(jù),進行分析,然后取下一段數(shù)據(jù)分析,依此類推。</p><
41、;p> 由于人說話的聲音可分為濁音、清音以及靜音三部分,所以我們需要改變原語音的基音頻率,來達到變聲的目的。方法是直接將采樣數(shù)據(jù)乘一個余弦函數(shù),通過這種方法可以將原語音信號的頻段調(diào)到一個更高的頻段,來達到變聲的目的。這種方法適于分析時域及頻域特效。</p><p> 語音信號的MATLAB程序</p><p> 輸入語音信號的MATLAB波形圖分析</p><
42、;p> 在實驗中,我們通過Matlab來處理選取的音頻文件,因為Matlab僅支持格式的音頻文件讀取及處理,因此我在網(wǎng)上找了三個wav音頻來進行模擬算法,分別為信號一:天下無賊中的對白;信號二:龍吼的聲音;信號三:一段薩克斯音樂,來確保三種信號沒有類似性。</p><p> 通過書籍以及網(wǎng)絡(luò)查閱,編寫了程序來用matlab對這三個音頻信號進行處理及分析,程序如附錄所示。</p><p
43、><b> 圖3-1</b></p><p> 混合語音信號的MATLAB波形圖分析</p><p> 通過程序處理,來將以上三個原始信號進行混合,然后用來模擬ICA算法,下為經(jīng)過程序處理混合后的語音信號的波形圖分析,程序如附錄所示。</p><p><b> 圖3-2</b></p><
44、p><b> FastICA算法</b></p><p> 語音信號數(shù)據(jù)的預(yù)處理</p><p> 在大多數(shù)情況下,我們進行語音信號盲處理時得到的數(shù)據(jù)都具有著相關(guān)性,所以需要在處理之前對數(shù)據(jù)進行球化,因為球化處理可去除各個觀測信號之間的相關(guān)性,使得之后在提取獨立分量的過程中更加簡單一些。并且很多時候,將進行了球化處理的結(jié)果與未進行球化處理的結(jié)果來比較可以發(fā)
45、現(xiàn),前者的收斂性往往更好。</p><p> 對語音信號數(shù)據(jù)進行預(yù)處理的方式如下:</p><p> 假設(shè)一個零均值的隨機向量Z=(Z1,Z2,… ,ZM)T滿足E{ZZT}=I,即可稱該向量為球化向量。球化處理即為去相關(guān),與主分量分析是目標一致的。在ICA中,對于均值為0的獨立原信號S(t)=[S1(t),S2(t),…,Sn(t)]T,有E{SiSj}=E{Si}E{Sj}=0,當
46、i≠j,并且其協(xié)方差矩陣是單位陣cov(S)=I,由此可以得知原信號S(t)是球化的。接下來對觀測信號X(t),我們需要尋找一個線性變換,來讓在投影到新的子空間后會變成球化向量,即:</p><p><b> (4.1)</b></p><p> 其中W0為球化矩陣,Z為球化向量。</p><p> 接下來用主分量分析,通過計算樣本向量能
47、夠得到一個變換:</p><p><b> (4.2)</b></p><p> 上式中代表協(xié)方差矩陣CX的特征值矩陣,U代表協(xié)方差矩陣CX的特征向量矩陣。</p><p> 由此我們可以得知,線性變換W0滿足球化變換的要求,由正交變換的規(guī)律,能夠保證UTU=UUT=I。因此協(xié)方差矩陣能夠?qū)懗扇缦滦问剑?lt;/p><p&
48、gt;<b> (4.3)</b></p><p> 接下來將X(t)=AS(t)代入到Z(t)=W0X(t),并令,有</p><p><b> (4.4)</b></p><p> 因為上式中線性變換是連接兩個球化隨機矢量和,我們可以得知必然是正交變換。假如我們將上式中的視為一個新的觀測信號,那么可以認為,我們
49、將原混合矩陣A經(jīng)過球化簡化成為了一個新的正交矩陣。</p><p> 正交變換相當于是對多維矢量所在的坐標軸進行了一次旋轉(zhuǎn)。在多維情況下,混合矩陣A是NN的,經(jīng)過球化處理之后的新混合矩陣,因為其本身為正交矩陣,自由度下降為,所以可以說球化處理能使我們進行ICA問題的工作量降低了很多。</p><p> 在ICA問題的處理中,進行球化處理的方法可以有效降低問題的計算量和復(fù)雜度,并且算法不
50、算困難,通過傳統(tǒng)PCA即可解決。</p><p> FastICA 算法</p><p> FastICA 算法,也稱為固定點(Fixed-Point)算法,是一種快速尋優(yōu)迭代算法,有效的統(tǒng)一了自適應(yīng)與批處理的計算方式,在每一次迭代過程中都運算了大量的樣本數(shù)據(jù)。FastICA 算法有很多種形式,如基于峭度、基于似然最大、基于負熵等等,在這里我們主要使用基于負熵的ICA算法。</p
51、><p> 1997年,芬蘭赫爾辛基大學(xué)學(xué)者 Aapo Hyvärinen等人率先提出了一種基于四階累積量的固定點算法,并且在這之后他們于1999年又提出了一種改進的方法——基于負熵的ICA固定點算法。而在2001年,他們在出版的Independent Component Analysis一書中,進行了進一步的簡化。由于新的算法相較于自適應(yīng)以及批處理算法具有更快的收斂速度,由此這種算法也稱“快速ICA算法
52、”(fast ICA,F(xiàn)ICA)。</p><p> 由于FastICA算法是以負熵最大作為尋找方向的,所以我們需要先確定下負熵的判斷條件。從信息論理論中,我們可以知道:如果所有隨機變量均為等方差的情況下,那么其中高斯變量的熵是最大的。所以我們能夠利用這個性質(zhì)來度量非高斯性。由中心極限定理,如果一個隨機變量X由許多相互獨立的隨機變量Si(i=1,2,3,…n)之和組成,那么只要Si具有有限的均值與方差,不論它是
53、哪種分布,隨機變量X必然比Si更接近高斯分布。所以,在分離的過程中,能夠使用分離結(jié)果的非高斯性的度量來表示分離結(jié)果之間的獨立性。各獨立分量分離完成的條件就是其非高斯性的度量達到最大值。</p><p><b> 負熵的定義:</b></p><p><b> (4.5)</b></p><p> 上式中的是一個和Y擁
54、有相同方差的高斯隨機變量;是該隨機變量的微分熵。其式如下:</p><p><b> (4.6)</b></p><p> 根據(jù)信息論的理論我們可以知道,如果幾個隨機變量有相同的方差,那么高斯分布的隨機變量具有較大的微分熵。當上式中的Y具有高斯分布時,;并且的非高斯性越強,它的微分熵就會越小,的值也會相對越大,所以我們可以將作為隨機變量Y的非高斯性測度。</
55、p><p> 但是因為計算微分熵需要知道Y的概率密度分布函數(shù),而我們并不能得知這點,因此只能采取下式作為近似算法:</p><p><b> (4.7)</b></p><p> 其中是均值運算;為非線性函數(shù),可以設(shè)g1(y)=tanh(y),或,亦或者。在這里,由于,所以通常取=1。</p><p> 快速ICA算
56、法的目的是找到一個方法來使得WTX(Y=WTX)的非高斯性達到最大??焖買CA算法的推導(dǎo)過程如下:</p><p> 第一,通過對E{G(WTX)}進行優(yōu)化來得到WTX的最大近似負熵。由Kuhn-Tucker條件可得,E{(WTX)2}=||W||2=1的約束條件下,E{G(WTX)}能再滿足下式的條件點上得到最優(yōu)值:</p><p><b> (4.8)</b>
57、</p><p> 上式中,的值恒定,,W0是優(yōu)化后的W。接下來用F來表示(4.8)式左邊的函數(shù),可以得到F的雅克比矩陣JF(W):</p><p><b> (4.9)</b></p><p> 為了簡化以上的矩陣求逆過程,我們可以將其近似為(4.9)式的第一項。因為數(shù)據(jù)已經(jīng)進行了球化處理,有,得到下式:</p><
58、p><b> (4.10)</b></p><p> 由上式的變換,雅克比矩陣變?yōu)榱藢顷嚕^易進行求逆計算。計算得到以下近似牛頓迭代公式:</p><p><b> (4.11)</b></p><p> 在上式中,是W的新值,,將解進行規(guī)范化能有有效提高解的穩(wěn)定性。簡化后即可得快速ICA算法的迭代公式如下
59、:</p><p><b> (4.12)</b></p><p> 在實際應(yīng)用中,快速ICA算法所要用到的期望要用其估計值來取代。最好的估計值必然是數(shù)據(jù)相應(yīng)的樣本平均。在理想條件下,快速ICA算法應(yīng)該計算所有的樣本有效數(shù)據(jù),但是這樣會大大降低計算效率。因此,通常在實際應(yīng)用中,我們要取一部分樣本的平均來作為估計值,而這樣做會使得估計的精確度很大限度上受制于所取樣本
60、數(shù)目的多少。因此在迭代計算中,樣本應(yīng)該分別來選取。如果計算中的收斂并不理想的話,應(yīng)該相應(yīng)增加樣本數(shù)量來提高收斂度和估計的精確度。</p><p> 快速ICA算法分離的基本步驟</p><p> 將觀測數(shù)據(jù)中心化,使其均值為0:</p><p><b> (4.13)</b></p><p> 對數(shù)據(jù)球化處理,求
61、自相關(guān)系數(shù)以及對自相關(guān)系數(shù):</p><p> 自相關(guān)系數(shù): (4.14)</p><p> 對自相關(guān)系數(shù):
62、 (4.15)</p><p> 球化處理: (4.16)</p><p> 選擇一個任意正交矩陣作為初始權(quán)矢量W0;</p><p> 用迭代公式更新每一列Wi,令</p><p><b>
63、 (4.17)</b></p><p> 其中非線性函數(shù)g可以使用以下函數(shù):</p><p><b> (4.18)</b></p><p><b> 將W正交化:</b></p><p><b> (4.19)</b></p><p&g
64、t; 如果W不收斂(迭代后的改變更大),則返回第四步。</p><p><b> 混合語音信號波形圖</b></p><p> 在論文上一部分中,已經(jīng)得到了通過隨機混合矩陣進行混合的語音信號的波形圖,如下所示:</p><p><b> 圖4-1</b></p><p><b>
65、 分離語音信號波形圖</b></p><p> 對得到的混合語音信號進行ICA分離,通過matlab編程處理的算法進行分析,得到了如下三個分離出的語音信號的波形圖,如下圖所示:</p><p><b> 圖4-2</b></p><p><b> 對比與分析</b></p><p>
66、; 通過將原信號與分離信號放在一起直觀對比進行分析:</p><p><b> 圖4-3</b></p><p> 通過對比原語音信號和進行FICA分離之后得到的語音信號的波形圖以及聽取分離后得到音頻文件,我們可以發(fā)現(xiàn)如下幾點:</p><p> FICA算法比較有效的對語音信號進行了分離;</p><p>
67、在多次試驗中我們發(fā)現(xiàn)FICA算法不可避免的打亂了輸入信號和輸出信號的順序,在上圖這次試驗中,原信號1是對應(yīng)解混信號3,原信號2是對應(yīng)解混信號1,原信號3是對應(yīng)解混信號2;</p><p> FICA算法對信號的幅值有較大改變,證明FICA算法可用于信號的放大處理上。</p><p><b> 結(jié)論</b></p><p> 通過以上的實驗
68、部分,我們能夠得出快速ICA算法可以有效的進行語音信號的分離處理。達到了實驗的初衷:實現(xiàn)一個快速ICA算法,并將其應(yīng)用于語音信號上,檢驗其效果。并且得出了快速ICA算法的幾點特點,而且發(fā)現(xiàn)這種方法在語音信號的放大上存在的潛力。但是本次實驗也有幾點缺點,比如沒有能對比語音信號混合和分離的頻譜及幅值等信號圖,如果這些信息全部可以得到的話對本次實驗?zāi)軌蚋姓f服力。</p><p> 在本次畢業(yè)設(shè)計的工作中,我首先閱讀
69、了關(guān)于獨立分量分析及快速ICA算法的相關(guān)資料,制定了本次畢業(yè)設(shè)計的工作時間安排及進程。上網(wǎng)學(xué)習(xí)matlab的使用方法及尋找相關(guān)程序信息,收集并編輯可用的語音信號,通過matlab進行算法的編程及調(diào)試,然后進行了本次實驗,最后撰寫論文。</p><p><b> 致謝</b></p><p><b> 主要參考文獻</b></p>
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 畢業(yè)論文設(shè)計盲信號處理
- 盲信號語音分離技術(shù)的研究與實現(xiàn)——畢業(yè)論文
- 樂音信號盲分離.pdf
- 雷達信號盲分離系統(tǒng).pdf
- 盲信號分離算法的研究.pdf
- 盲源分離與盲信號提取問題研究.pdf
- 通信信號盲分離方法研究.pdf
- 盲信號分離的DSP實現(xiàn).pdf
- 盲信號分離算法及其應(yīng)用.pdf
- 高效盲信號分離算法的研究.pdf
- 跳頻信號的盲分離和參數(shù)的盲估計.pdf
- 盲信號分離算法比較與研究.pdf
- 混沌信號的盲反卷積和含噪混合信號的盲分離.pdf
- 水聲信號處理的盲信號分離方法研究.pdf
- 基于盲信號分離的肺音信號提取研究.pdf
- 多路語音信號的盲分離.pdf
- 欠定盲信號分離方法研究.pdf
- 語音混合信號的盲分離研究.pdf
- 盲信號分離ICA理論與應(yīng)用.pdf
- 盲信號分離算法研究與應(yīng)用.pdf
評論
0/150
提交評論