語音識別技術(shù)

上傳人：奔*** IP屬地：河北更新時間：2024-03-11 格式：doc 頁數(shù)：4 大?。?4.50KB 人氣指數(shù)：12 舉報 版權(quán)申訴

已閱讀1頁，還剩3頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、目前主流的語音識別技術(shù)是基于統(tǒng)計模式識別的基本理論。一個完整的語音識別系統(tǒng)可大致分為三部分：（1）語音特征提取：（2）聲學模型與模式匹配（識別算法）（3）語義理解：計算機對識別結(jié)果進行語法、語義分析。語音識別技術(shù)，也被稱為自動語音識別AutomaticSpeechRecognition，(ASR)，語音識別的發(fā)展簡史語音識別的發(fā)展簡史1952年AT&TBell實驗室實現(xiàn)了一個單一發(fā)音人孤立發(fā)音的十個英文數(shù)字的語音識別系統(tǒng)，到現(xiàn)在的人機語

2、音交互。語音識別研究從二十世紀50年代開始到現(xiàn)在歷半個多世紀的蓬勃發(fā)展，在這期間獲得了巨大的進展?，F(xiàn)代語音識別技術(shù)研究重點包括即興口語的識別和理解，自然口語對話，以及多語種的語音同聲翻譯。語音識別應用的特點語音識別應用的特點1.語音識別系統(tǒng)必須覆蓋的功能包括：（1）語音識別系統(tǒng)要對用戶有益（希望它是能檢測到的）。例如提高生產(chǎn)率，容易使用，更好的人機界面，或更自然的信息交流模式。（2）語音識別系統(tǒng)要對用戶“友好”。這種“友好”的含義是：用

3、戶在和系統(tǒng)進行語音對話時感到舒適；系統(tǒng)的語音提示既有幫助，又很親近。（3）語音識別系統(tǒng)必須有足夠的精度（4）語音識別系統(tǒng)要有實時處理能力；例如系統(tǒng)對用戶詢問的響應時間要很短。2.語音識別錯誤的處理有以下四種方式可以處理這個問題。（1）錯誤弱化法。這種處理僅僅花費用戶很少一點時間，對用戶幾乎沒什么其它不利影響。（2）錯誤自檢糾正法系統(tǒng)利用已知任務的限制自動地檢測并糾正錯誤。（3）確認或多層次判定個音相對應的地址及相應的投遞路線的。在這個例

4、子中，有三個投遞地址符合這一語音標準，分揀員知道哪一個是正確的地址，于是就可以把郵件分給相應投遞段的投遞員了。SpellIt技術(shù)可以識別字母、數(shù)字、關(guān)鍵詞以及無數(shù)的組合，對大公司的郵件收發(fā)中心和郵局的手工郵件分揀來說都是一次徹底的變革。這種進步使得郵件中心可以使用快捷、精密、配套的郵件自動化處理設備來提高郵件處理全過程的工作效率。SpellIt技術(shù)還可以適用于世界上的多種語言。大公司的郵件收發(fā)中心和郵局所面臨的一個重大問題就是如何能在控

5、制培訓經(jīng)費的情況下提高生產(chǎn)率？通過減少對內(nèi)部郵件和不能上分揀機郵件的查找時間能得到什么樣的經(jīng)濟效益？手工郵件分揀中心經(jīng)常要考慮和勞動力有關(guān)的問題：人力成本越來越高，人員更迭越來越快，培訓費用越來越多。公司內(nèi)部收發(fā)中心和郵局的手工分揀都主要依靠分揀人員的記憶力。招募、培訓和留住熟練分揀員往往需要很高的成本。如果一個熟練工因病、因事請假或去度假，或者辭職，必須有另外的人來補上空缺的崗位。因為生產(chǎn)率的提高有賴于工人的工作熟練程度，而許多企業(yè)由

6、于人員流動頻繁導致了培訓經(jīng)費的持續(xù)增長，這樣效益目標就很難達到。手工分揀主要依賴員工的記憶力，而人工標碼等半自動化處理雖然減輕了記憶的壓力，卻需要一套全新的技術(shù)。從手工操作到半自動化操作往往需要員工完全改變操作技能，許多熟練的手工分揀員改換使用鍵盤操作時生產(chǎn)率不升反降。許多公司在采用人工標碼臺及采用近距離或遠距離視頻標碼設備時都出現(xiàn)了這種情況，因為標碼技術(shù)完全依賴操作員的鍵盤技術(shù)來處理郵件。和標碼技術(shù)相比，語音識別技術(shù)可以大大地減少職工

7、培訓，并且可以減輕甚至消除從手工勞動向自動化轉(zhuǎn)變過程對生產(chǎn)率的影響。要達到熟練分揀不必再需要大量的工作經(jīng)驗。實際上，語音識別技術(shù)的應用使操作員不必再記憶郵箱編碼等郵政信息了，語音識別技術(shù)簡單易學，郵件中心的工作人員只用幾分鐘就可以達到熟練操作的程度了。培訓時間的減少促使了人工成本的下降。另外，語音識別技術(shù)又提高了生產(chǎn)率，從而大大提高了郵件中心的效益。MailCode公司的語音識別設備有兩種：口音適應型設備和非口音適應型設備?？谝暨m應型設

8、備需要在生產(chǎn)前操作員進行口音適應訓練，操作員要花半小時左右的時間讓設備適應自己的語音特點，這些特點作為文件保存到系統(tǒng)中，以備將來使用。這種設備尤其適合那些有地方方言或口音的操作員。非口音適應型設備基本上不需要語音訓練，適用于臨時工較多，操作員不固定的場所。只是非口音適應型設備比起口音適應型設備來速度略慢，準確率略低。實驗表明語音技術(shù)提高了生產(chǎn)率。一個熟練的手工分揀員平均每小時分揀700件郵件，這樣的效率至少需要三個月的訓練。而使用語音識

9、別技術(shù)，一個沒有經(jīng)過訓練的操作員僅一星期后分揀速度就可以達到每小時550件，四周后分撿速度就可達到每小時700件。另外，手工分揀每小時查找郵件150件，而利用語音技術(shù)，郵件查找量每小時可以達到600件，隨著操作員對設備越來越熟練，分揀的精確度會進一步提高。因為大部分的語音識別系統(tǒng)是基于界面友好的WindowsNT開發(fā)的，管理人員可以利用工具軟件對操作員的生產(chǎn)情況、郵件量以及整個郵件中心的生產(chǎn)情況進行跟蹤。最新的設備還裝備有數(shù)據(jù)庫管理系統(tǒng)

眾賞文庫> 全部分類> 畢業(yè)設計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

語音識別技術(shù)

文檔簡介

溫馨提示

最新文檔

評論

語音識別技術(shù)

文檔簡介

溫馨提示

最新文檔

評論

免費下載