文獻(xiàn)翻譯(1)_第1頁
已閱讀1頁,還剩13頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、語音識別在計(jì)算機(jī)技術(shù)中,語音識別是指為了達(dá)到說話者發(fā)音而由計(jì)算機(jī)生成的功能,利用計(jì)算機(jī)識別人類語音的技術(shù)。(例如,抄錄講話的文本,數(shù)據(jù)項(xiàng)經(jīng)營電子和機(jī)械設(shè)備電話的自動化處理),是通過所謂的自然語言處理的計(jì)算機(jī)語音技術(shù)的一個(gè)重要元素。通過計(jì)算機(jī)語音處理技術(shù),來自語音發(fā)音系統(tǒng)的由人類創(chuàng)造的聲音,包括肺,聲帶和舌頭,通過接觸,語音模式的變化在嬰兒期、兒童學(xué)習(xí)認(rèn)識有不同的模式,盡管由不同人的發(fā)音,例如,在音調(diào),語氣,強(qiáng)調(diào),語調(diào)模式不同的發(fā)音相同的

2、詞或短語,大腦的認(rèn)知能力,可以使人類實(shí)現(xiàn)這一非凡的能力。在撰寫本文時(shí)(2008年),我們可以重現(xiàn),語音識別技術(shù)不只表現(xiàn)在有限程度的電腦能力上,在其他許多方面也是有用的。語音識別技術(shù)的挑戰(zhàn)語音識別技術(shù)的挑戰(zhàn)古老的書寫系統(tǒng)要回溯到蘇美爾人的六千年前。他們可以將模擬錄音通過留聲機(jī)進(jìn)行語音播放,直到1877年。然而,由于與語音識別各種各樣的問題,語音識別不得不等待著計(jì)算機(jī)的發(fā)展。首先演講不是簡單的口語文本——同樣的道理戴維斯很難捕捉到一個(gè)not

3、efnote曲作為樂譜。人類所理解的詞、短語或句子離散與清晰的邊界實(shí)際上是將信號連續(xù)的流而不是聽起來:Iwenttothesteyesterday昨天我去商店。單詞也可以混合用Whaddayawa嗎這代表著你想要做什么。第二沒有一對一的聲音和字母之間的相關(guān)性。在英語有略多于5個(gè)元音字母——aeiou有時(shí)y和w。有超過二十多個(gè)不同的元音雖然精確統(tǒng)計(jì)可以取決于演講者的口音而定。但相反的問題也會發(fā)生在那里一個(gè)以上的信號能再現(xiàn)某一特定的聲音。字

4、母C可以有相同的字母K的聲音,如蛋糕,或作為字母S,如柑橘。此外說同一語言的人使用不相同的聲音即語言不同他們的聲音語音或模式的組織,有不同的口音。例如“水”這個(gè)詞wadder可以顯著watter,woaderwattah等等。每個(gè)人如果你認(rèn)為一個(gè)人之所以從事語音識別方面的研究是因?yàn)樗艿玫浇疱X,那就太草率了。這種吸引力也許類似于把水變成汽油、從海水中提取黃金、治愈癌癥或者登月的誘惑。一個(gè)人不可能用削減肥皂成本10℅的方法簡單地得到錢。如

5、果想騙到人,他要用欺詐和誘惑。皮爾斯1969年的信標(biāo)志著在貝爾實(shí)驗(yàn)室持續(xù)了十年的研究結(jié)束了。然而,國防研究機(jī)構(gòu)ARPA選擇了堅(jiān)持下去。1971年他們資助了一項(xiàng)開發(fā)一種語音識別器的研究計(jì)劃,這種語音識別器要能夠處理至少1000個(gè)詞并且能夠理解相互連接的語音,即在語音中沒有詞語之間的明顯停頓。這種語音識別器能夠假設(shè)一種存在輕微噪音背景的環(huán)境,并且它不需要在真正的時(shí)間中工作。到1976年,三個(gè)承包公司已經(jīng)開發(fā)出六種系統(tǒng)。最成功的是由卡耐基麥隆

6、大學(xué)開發(fā)的叫做“Harpy”的系統(tǒng)。“Harpy”比較慢,四秒鐘的句子要花費(fèi)五分多鐘的時(shí)間來處理。并且它還要求發(fā)音者通過說句子來建立一種參考模型。然而,它確實(shí)識別出了1000個(gè)詞匯,并且支持連音的識別。研究通過各種途徑繼續(xù)著,但是“Harpy”已經(jīng)成為未來成功的模型。它應(yīng)用隱馬爾科夫模型和統(tǒng)計(jì)模型來提取語音的意義。本質(zhì)上,語音被分解成了相互重疊的聲音片段和被認(rèn)為最可能的詞或詞的部分所組成的幾率模型。整個(gè)程序計(jì)算復(fù)雜,但它是最成功的。在1

7、970s到1980s之間,關(guān)于語音識別的研究繼續(xù)進(jìn)行著。到1980s,大部分研究者都在使用隱馬爾科夫模型,這種模型支持著現(xiàn)代所有的語音識別器。在1980s后期和1990s,DARPA資助了一些研究。第一項(xiàng)研究類似于以前遇到的挑戰(zhàn),即1000個(gè)詞匯量,但是這次要求更加精確。這個(gè)項(xiàng)目使系統(tǒng)詞匯出錯(cuò)率從10℅下降了一些。其余的研究項(xiàng)目都把精力集中在改進(jìn)算法和提高計(jì)算效率上。2001年微軟發(fā)布了一個(gè)能夠與0fficeXP同時(shí)工作的語音識別系統(tǒng)。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論