版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、機器翻譯從出現(xiàn)到現(xiàn)在歷經了幾十年的發(fā)展,已經取得了令人矚目的成果,期間各種方法不斷被提出,目前主流的是基于統(tǒng)計的機器翻譯以及最新的基于神經網絡的機器翻譯方法,各種機器翻譯方法都有自己獨特的優(yōu)勢,因此提出了系統(tǒng)融合方法來“取長補短”,希望通過系統(tǒng)融合來優(yōu)化翻譯結果。目前,機器翻譯在工業(yè)上的應用已經十分成熟,百度、有道和谷歌等都推出了在線互聯(lián)網翻譯系統(tǒng),本次研究就是利用這些互聯(lián)網翻譯引擎以及利用Moses統(tǒng)計機器翻譯模型訓練出的系統(tǒng)來進行系
2、統(tǒng)融合。
系統(tǒng)融合按照操作基本操作單元的不同可以分為句子級、短語級和詞匯級系統(tǒng)融合三種,本研究中進行了句子級和詞匯級以及基于MEMT的三種融合方式,在漢英翻譯任務上進行。句子級系統(tǒng)融合采用了最小貝葉斯風險解碼的方法,在解碼時使用了不同的損失函數(shù),在使用TER作為損失函數(shù)時取得了最好的結果,比融合前的最好結果的BLEU得分提升了0.24個點。在詞匯級系統(tǒng)融合中需要構造混淆網絡并解碼來得到目標結果,研究中對構造混淆網絡時采用的不同
3、的詞對齊方式以及解碼時加入不同的特征進行了多組對比實驗,結果表明基于TER并加入詞干匹配的詞對齊以及解碼時加入多種有效特征可以提升系統(tǒng)融合的效果,這個實驗也取得了本次研究的最好結果,比融合前最好結果的BLEU得分提升了0.78個點,比融合前最差的系統(tǒng)提升了3.01個點?;贛EMT的系統(tǒng)融合效果表現(xiàn)一般,比融合前最好結果的BLEU得分提升了0.48個點。實驗結果表明融合互聯(lián)網引擎的機器翻譯系統(tǒng)可以提升翻譯的質量。
研究最后實現(xiàn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于互聯(lián)網的統(tǒng)計機器翻譯平行句對獲取.pdf
- 基于Web服務的多引擎機器翻譯系統(tǒng).pdf
- 機器翻譯中系統(tǒng)融合技術的研究.pdf
- “互聯(lián)網+”制造強國的新引擎
- 基于微引擎流水線的機器翻譯系統(tǒng)結構
- 基于復述的機器翻譯系統(tǒng)融合方法研究.pdf
- 融合統(tǒng)計機器翻譯特征的蒙漢神經網絡機器翻譯技術.pdf
- 面向互聯(lián)網應用的存儲引擎優(yōu)化.pdf
- 互聯(lián)網上的搜索引擎
- 基于統(tǒng)計機器翻譯日志的系統(tǒng)融合方法研究.pdf
- “互聯(lián)網+電視”的場景融合研究.pdf
- 探討互聯(lián)網+出版的融合路徑
- “互聯(lián)網電視”的場景融合研究
- 融合統(tǒng)計機器翻譯特征的蒙漢神經網絡機器翻譯技術_2092.pdf
- 互聯(lián)網+互聯(lián)網思維
- 基于混淆網絡的機器翻譯系統(tǒng)融合技術研究.pdf
- 融合多語編碼信息的神經機器翻譯研究.pdf
- 融合文檔信息的機器翻譯自動評價研究.pdf
- 互聯(lián)網+農業(yè)打造我國農業(yè)新引擎
- 互聯(lián)網金融融合與變革
評論
0/150
提交評論