語音聲紋密碼驗證技術研究.pdf_第1頁
已閱讀1頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、語音聲紋密碼是采用語音段中的文本信息和說話人信息對用戶信息進行雙重加密的技術。因此具有較好的安全性和便捷性,在銀行、公安、智能家居等領域都有廣泛的應用。但是在實際應用中,傳統(tǒng)的語音聲紋密碼識別仍然面臨著密碼泄露、特征冗余、抗干擾性差等方面所帶來的挑戰(zhàn)。
  傳統(tǒng)的語音聲紋密碼識別屬于文本相關的聲紋識別任務。由于密碼文本是固定的,容易遺忘和泄露,因此安全性不高。針對這個問題,本文采用文本提示型的語音聲紋密碼識別方案。用戶每次登陸系統(tǒng)

2、時系統(tǒng)會提示輸入的動態(tài)密碼,用戶根據(jù)提示文本說出密碼語音。這種方法安全性雖然高但動態(tài)聲紋密碼識別屬于文本無關的聲紋識別任務其聲紋識別性能相對較低。針對以上各個問題,本文主要從以下幾個方面來提升文本提示型語音聲紋密碼的識別率。
  首先,語音聲紋密碼識別系統(tǒng)包含語音密碼識別和聲紋密碼識別兩個部分。因此系統(tǒng)前端需要一個識別率相對較高的語音識別系統(tǒng)來驗證用戶所說密碼是否正確。傳統(tǒng)基于GMM-HMM的語音密碼識別系統(tǒng)識別率相對較低難以滿足

3、安全性要求,因此本文采用識別性能更好的DNN-HMM語音密碼識別系統(tǒng)。
  第二、傳統(tǒng)聲紋識別中采用的聲學特征(如MFCC,PLP等特征)包含的主要是文本信息和信道信息,說話人信息屬于其中的弱信息。聲紋密碼識別性能極易受到語音信號中的文本、信道以及噪聲等干擾信息的影響。針對這個問題,本文利用深度神經(jīng)網(wǎng)絡的特征提取能力提出一種基于深度神經(jīng)網(wǎng)絡的說話人信息提取方法。采用該方法提取出的說話人信息相對傳統(tǒng)聲學特征具有更好的說話人區(qū)分能力。

4、
  第三、同樣針對傳統(tǒng)聲學特征中包含的冗余信息,本文進一步采用特征端因子分析的方法來去除聲學特征中的冗余干擾信息。傳統(tǒng)的特征端因子分析方法是在高斯混合模型的每個高斯上借用因子分析思想來對特征降維。但GMM模型屬于無監(jiān)督的聚類算法,其每個高斯成分物理意義不夠明確無法與具體的發(fā)音文本信息相對應。為解決這一問題,本文在特征端因子分析中利用語音識別中的聲學模型深度神經(jīng)網(wǎng)絡取代高斯混合模型,分別對不同音素上的語音特征進行分類然后在每個音素

5、子空間內(nèi)實現(xiàn)對特征降維,提取出說話人信息并用于提取DNNi-vector。接著在基于DNN的說話人信息提取中,本文采用基于DNN的特征端因子分析取代LDA對每幀語音的隱層輸出超矢量進行降維。
  最后根據(jù)文本提示型的聲紋密碼識別的特點,本文提出分數(shù)字建模聲紋密碼識別方案。針對數(shù)字聲紋密碼中的每個數(shù)字分別訓練一個聲紋識別模型。注冊和測試時匹配同時出現(xiàn)的數(shù)字進行測試,將文本無關聲紋密碼識別任務轉(zhuǎn)化為文本相關聲紋密碼識別任務。本文實驗采

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論