版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、口語翻譯是語音、語言技術領域重要的研究方向之一,具有巨大的應用價值??谡Z翻譯涉及到語言學、計算機科學、語音識別、語音合成和通訊等多種學科和技術,開展這項研究具有非常重要的科學意義。 隨著各國人們在文化,經(jīng)濟,體育等各方面的日常交流日趨頻繁,口語翻譯越來越受到人們的關注。本文針對基于中間語言的口語翻譯方法中的口語解析問題和基于統(tǒng)計模型的口語翻譯方法中的短語翻譯對自動抽取問題以及口語翻譯系統(tǒng)實驗平臺建設等幾個方面做了相關的研究和實現(xiàn)
2、工作,主要內(nèi)容歸納為如下幾點: 1.論文在面向中間轉換格式(InterchangeFormat,IF)【"NESPOLE",2002】的口語解析方法研究方面,提出了一種基于語義分類樹的漢語口語淺層語義解析方法,用來獲取漢語口語句子的淺層語義領域行為(IF的一部分)。該方法利用統(tǒng)計模型從訓練語料中自動獲取語義規(guī)則構造語義分類樹,并利用語義分類樹對句子中和領域行為密切相關的詞語進行解析,然后對多個詞的解析結果利用統(tǒng)計解析模型進行選擇
3、和組合,從而生成句子的領域行為表示。規(guī)則自動獲取方法避免了人工制定規(guī)則的繁瑣性和主觀性,保證了解析具有較高的魯棒性;利用統(tǒng)計模型對領域行為各部分進行組合,避免了對IF表達能力的影響;與HMM相比,語義分類樹擴大了解析窗口,更好地利用了上下文信息。實驗結果表明:這種方法在限定領域內(nèi)進行漢語口語淺層語義解析具有較高的準確率和魯棒性。 2.基于統(tǒng)計模型的口語翻譯方法是目前口語翻譯研究領域中非常重要的方法。基于短語的統(tǒng)計翻譯方法與基于單
4、個詞的統(tǒng)計翻譯方法相比,可以更好地處理句子中短語內(nèi)部詞語之間的關系,從而有效地提高機器翻譯系統(tǒng)的性能?;诙陶Z的統(tǒng)計翻譯方法之一把短語翻譯對作為知識源加入到系統(tǒng)中,這樣整個系統(tǒng)的性能對于使用的短語翻譯對的質量具有非常大的依賴性,針對這個問題,論文提出了一種改進的基于HMM的短語翻譯對抽取方法,從大規(guī)模訓練語料中自動抽取高質量的短語翻譯對,作為統(tǒng)計口語翻譯的知識源。這種方法首先利用HMM對雙語句子進行雙向對齊,然后根據(jù)對齊的結果抽取短語翻
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于統(tǒng)計的中文文本關鍵短語自動抽取方法研究.pdf
- 領域術語自動抽取方法研究.pdf
- 基于WEB的雙語翻譯對抽取方法研究.pdf
- 詞語搭配自動抽取方法對比研究.pdf
- 短語級復述的識別與抽取.pdf
- 中文術語自動抽取相關方法研究.pdf
- 網(wǎng)頁信息的自動抽取方法研究.pdf
- 短語級復述的識別與抽取
- 金融領域信息的自動抽取與分析方法.pdf
- 特定領域術語自動抽取方法的研究.pdf
- 基于DOM信息抽取技術的網(wǎng)頁自動翻譯方法的應用研究.pdf
- Web記錄自動抽取與去重方法的研究與實現(xiàn).pdf
- 可比語料中命名實體翻譯等價對抽取方法研究.pdf
- 基于Hadoop的Web評論自動抽取方法研究.pdf
- 英漢機器翻譯模板自動抽取算法的研究與實現(xiàn).pdf
- 文本宏特征抽取與基于質心的自動分類方法研究.pdf
- 關鍵短語抽取及相關技術研究.pdf
- 利用web抽取雙語翻譯對的研究與實現(xiàn).pdf
- 關鍵短語抽取及相關技術研究
- 典型關系抽取系統(tǒng)的技術方法解析
評論
0/150
提交評論