版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、近年來,隨著人們對安全要求的逐漸提高以及遠程視頻會議系統(tǒng)的快速發(fā)展,智能環(huán)境下基于生物特征的身份識別技術(shù)成為模式識別領(lǐng)域的研究熱點,其在智能視覺物聯(lián)網(wǎng)、公共安全、金融服務和視頻會議系統(tǒng)等眾多領(lǐng)域有著廣泛的應用。受數(shù)據(jù)噪音和識別系統(tǒng)本身的限制,基于單一生物特征的身份識別系統(tǒng)所能達到的準確率是有限的,為此,研究人員提出利用視聽信息融合身份識別來提高識別的準確率,受到了廣泛的關(guān)注。但是目前基于視聽信息融合的身份識別主要局限于理想環(huán)境下的單模態(tài)
2、識別以及在現(xiàn)有融合方法上音視頻特征的簡單融合,對于復雜環(huán)境下單模態(tài)生物特征的有效提取、高精度高普適性識別算法的構(gòu)造與音視頻特征在不同融合層級最優(yōu)融合算法的確定少有考慮。從人的視聽覺認知機理出發(fā),本文從特征提取、識別算法和融合規(guī)則三個方面對視聽信息融合身份識別進行了研究,以便為智能環(huán)境下的視聽信息識別提供可行的解決方案,本文的主要工作和創(chuàng)新點如下:
1.實現(xiàn)了復雜背景下人臉特征和語音特征的精確高表征提取
針對人臉圖像D
3、CT特征系數(shù)的最優(yōu)提取問題,本文提出了一種基于鑒別能力分析的DCT系數(shù)提取方法,在分析DCT系數(shù)鑒別能力值的基礎(chǔ)上提取那些鑒別能力值較大的DCT系數(shù)作為特征。在分析頭發(fā)幾何特性和顏色特性的基礎(chǔ)上,本文將人體的Hair特征應用于人臉識別,擴展了人臉特征的多樣性。針對傳統(tǒng)語音參數(shù)MFCC受噪聲影響較大而且只能反映語音靜態(tài)特性的缺點,本文基于能有效反映人耳聽覺特性的Gammatone濾波器,提取了Gammatone濾波倒譜系數(shù),并基于滑動差分
4、倒譜,提取了能反映語音動態(tài)特性的Gammatone滑動差分倒譜系數(shù)。
2.提出了可有效解決“高維小樣本問題”的人臉識別算法
目前,基于子空間分析的方法由于描述能力強、可分性好、計算簡單等優(yōu)點,成為人臉識別的主流算法,但常常面臨“高維小樣本問題”,導致人臉識別系統(tǒng)泛化能力較差。本文結(jié)合子空間分析方法和核思想,先后提出核相關(guān)權(quán)重鑒別分析算法和核鑒別局部保持投影算法,一方面解決了“高維小樣本問題”,另一方面解決了傳統(tǒng)子空間
5、分析方法由于其線性本質(zhì)所導致的在處理高度線性不可分對象時能力差的缺點。
3.解決了說話人識別GMM模型的建模問題
GMM模型是目前說話人識別的主流算法,并且在此基礎(chǔ)上衍生了一系列說話人識別算法。針對由于訓練語料較短而導致GMM模型參數(shù)訓練不充分、識別性能下降的問題,本文通過引入因子分析技術(shù),實現(xiàn)了一種自適應均值的GMM模型。i-vector說話人識別系統(tǒng)是在GMM模型和因子分析技術(shù)基礎(chǔ)上產(chǎn)生的目前國內(nèi)外說話人識別研究
6、前沿的主流系統(tǒng),本文通過改進局部保持投影算法,實現(xiàn)了i-vector說話人識別系統(tǒng)中i-vector矢量的有效降維。
4.建立了不同層次音視頻特征的最優(yōu)融合規(guī)則
本文以信息熵理論、概率密度方法和決策科學為指導,建立最優(yōu)的匹配層融合規(guī)則和解決D-S證據(jù)理論的證據(jù)沖突問題。首先在分析現(xiàn)有證據(jù)沖突問題解決方法的基礎(chǔ)上,提出基于群體決策和多準則選擇融合的證據(jù)組合方法,有效解決證據(jù)沖突問題;其次為避免對匹配分數(shù)密度進行估計,本
7、文將總錯誤概率TER引入到匹配層融合,通過TER來刻畫匹配分數(shù)的分布,并將不確定度量融合方法引入到多特征融合識別;然后采用高斯密度求解加性融合中的最優(yōu)權(quán)值,并將其用于邏輯回歸排序?qū)尤诤?最后針對匹配分數(shù)密度融合密度函數(shù)的求解,引入FAR和FRR以求解信任度函數(shù),并基于三角模算子融合信任度函數(shù),有效規(guī)避加性融合中權(quán)值的求解。
綜上所述,本文的研究內(nèi)容有效提高了計算機對復雜感知信息的理解能力和對異構(gòu)信息的處理能力,進一步拓展了多生
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于感知替代的視聽信息融合方法研究.pdf
- 視聽信息融合方法研究及在語音識別中的應用.pdf
- 基于視聽信息的人體行為識別算法研究.pdf
- 基于人體特征信息融合的身份識別方法研究.pdf
- 融合視聽信息的鍵合圖語言的復雜機電系統(tǒng)故障機理的研究.pdf
- 面向機電系統(tǒng)狀態(tài)監(jiān)測的視聽信息融合理論與方法研究及應用.pdf
- 列車旅客信息系統(tǒng)數(shù)字化視聽信息的廣播.pdf
- 智能環(huán)境下基于音頻和視頻特征融合的多說話人識別.pdf
- 基于人臉與語音信息融合的身份識別技術(shù)研究.pdf
- 基于多層次信息融合的手寫體漢字識別研究.pdf
- 基于音頻和視頻特征融合的身份識別.pdf
- 基于信息融合的水泥回轉(zhuǎn)窯工況的智能識別.pdf
- 智能家居環(huán)境下動態(tài)人臉身份識別系統(tǒng)設(shè)計.pdf
- 基于智能穿戴及信息融合的山羊健康狀態(tài)識別.pdf
- 基于RBM多層神經(jīng)網(wǎng)絡(luò)的身份識別研究.pdf
- 基于多層特征融合的人體行為識別.pdf
- 多層次信息融合的道路識別方法研究.pdf
- 智能環(huán)境下基于音頻視頻信息融合的多說話人跟蹤.pdf
- 基于子空間的特征級信息融合——及其在身份識別中的應用.pdf
- 監(jiān)控視頻下融合多生物特征的身份識別研究.pdf
評論
0/150
提交評論