自主心智發(fā)育機器人的語音感知映射.pdf_第1頁
已閱讀1頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、說和聽是人類最為重要的信息獲取和傳達的手段。與文字等信息交流方式相比,基于語音的交互是絕大多數(shù)人所掌握的最普及、最自然的交互方式,不受使用者的教育水平和專業(yè)分類的約束。而隨著智能機器人的發(fā)展和高性能計算機的普及,若能夠以語音作為計算機或者智能機器人與使用者交互界面,將會極大的提升計算機和機器人的易用性、友好性,為人們在信息時代的生活帶來巨大的便利。自主心智發(fā)育作為一個新興的理論框架,有潛力解決傳統(tǒng)方法難以解決的復(fù)雜問題和跨任務(wù)問題。因此

2、,將自主心智發(fā)育理論框架和已有的高性能方法結(jié)合起來,使智能機器人能夠具備更強的語音交互能力,是一個值得深入探索的理論方向。傳統(tǒng)語音處理方法中需要針對特定領(lǐng)域、語言進行人工分析和設(shè)計以及人工干預(yù)訓(xùn)練,從而導(dǎo)致這些方法對環(huán)境的適應(yīng)能力以及對新語言新領(lǐng)域的擴展能力較弱,不能達到智能機器人在自然環(huán)境中為人類服務(wù)的設(shè)計要求。本文針對這個問題,以自主心智發(fā)育理論框架的任務(wù)無關(guān)的思想為前提,引入遞增計算、在線計算、在位計算等原理,通過對語音處理研究中

3、的經(jīng)典的隱馬爾可夫方法進行改進和擴展,將其融入到自主心智發(fā)育理論框架中,提出了雙隱層馬爾可夫模型,作為聽覺感知映射模塊的核心模型,為自主心智發(fā)育機器人這種新框架下的智能機器人進行針對性設(shè)計,使其具有在與外部的環(huán)境交互的過程中,自動產(chǎn)生和調(diào)整聲學(xué)單位內(nèi)部表達模型能力,讓智能機器人具有聽懂不同語種語言,自動適應(yīng)不同背景噪聲條件的潛力,并為機器人的聽說聯(lián)合打下基礎(chǔ)。隱馬爾可夫模型作為一種經(jīng)典的語音表達模型,在語音識別和語音合成等應(yīng)用中都取得了

4、一定的成果。但是這些成果都是針對特定領(lǐng)域的具體問題進行的,比如特定語言的語音識別,在識別之前必須要針對該語言和應(yīng)用領(lǐng)域訓(xùn)練大量的聲學(xué)模型和語言模型,這就導(dǎo)致了當應(yīng)用場景和使用環(huán)境發(fā)生改變時,原有模型不適用,導(dǎo)致識別效果急劇下降的問題。本文通過對其進行雙隱層擴展,并調(diào)整其搜索和訓(xùn)練算法,使其能夠達到自主心智發(fā)育框架中感知映射的基本要求,無需人為干預(yù),不受環(huán)境限定,不針對特定語言和領(lǐng)域,使其能夠達到自主心智發(fā)育機器人的聽覺系統(tǒng)感知映射層次的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論