學(xué)生英譯漢網(wǎng)上自動(dòng)測評探索.pdf_第1頁
已閱讀1頁,還剩140頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、網(wǎng)絡(luò)的普及和發(fā)展給語言學(xué)習(xí)和語言測試提供了前所未有的機(jī)遇和發(fā)展空間。隨著客觀題測試技術(shù)的日趨完善,主觀題的自動(dòng)測評讓語言測試者備感興趣,同時(shí)也給語言測試帶來了新的挑戰(zhàn)。學(xué)生英譯漢網(wǎng)上自動(dòng)測評研究具有很高的理論意義和實(shí)用價(jià)值。學(xué)生譯文與標(biāo)準(zhǔn)譯文的比對、測評是漢語語義理解和概念相似性分析研究,其理論探索有意義,技術(shù)實(shí)現(xiàn)也有難度。 本文研究學(xué)生英譯漢網(wǎng)上自動(dòng)測評問題,內(nèi)容包括實(shí)踐嘗試、理論探討、網(wǎng)上實(shí)現(xiàn)、部分標(biāo)準(zhǔn)譯文自動(dòng)生成四個(gè)部分。

2、實(shí)踐嘗試包括字符串完全匹配、關(guān)鍵詞匹配、詞語相似度計(jì)算、同義詞匹配和句式匹配等一系列有效實(shí)驗(yàn),并取得了較好的效果,與人工測評的相關(guān)系數(shù)達(dá)到了0.58(一般人工評分員之間公認(rèn)的相關(guān)系數(shù)為0.7~0.75)。理論探討包括學(xué)生英譯漢網(wǎng)上自動(dòng)測評問題的本質(zhì)以及與機(jī)器翻譯系統(tǒng)、漢語主觀題、標(biāo)準(zhǔn)化考試中的英譯漢三種自動(dòng)測評的區(qū)別。結(jié)合認(rèn)知心理學(xué)分析了測評中的相似度、離散度、容納度及有關(guān)理論和技術(shù)難點(diǎn)。理論模型將測評問題分解為相似度等四個(gè)子問題。網(wǎng)上

3、實(shí)現(xiàn)基于現(xiàn)有中文信息處理資源,設(shè)計(jì)了測評系統(tǒng)流程和算法,創(chuàng)建了自動(dòng)測評網(wǎng)站,完善了必要的網(wǎng)站結(jié)構(gòu)及其功能,研究了題庫結(jié)構(gòu)并逐步積累題庫資源,從而初步完成了測評的工程化,實(shí)施了學(xué)生英譯漢的網(wǎng)上自動(dòng)測評。實(shí)際效果表明學(xué)生英譯漢網(wǎng)上自動(dòng)測評已達(dá)到了實(shí)用要求。最后探索了利用網(wǎng)絡(luò)資源為標(biāo)準(zhǔn)譯文庫自動(dòng)生成和篩選源自英語名詞短語的標(biāo)準(zhǔn)譯文候選項(xiàng),以及利用語義對候選項(xiàng)進(jìn)行再次篩選等深層理論和應(yīng)用技術(shù)問題。實(shí)驗(yàn)結(jié)果表明,自動(dòng)語義篩選方法的正確率為84.2

4、1%,召回率為76%。實(shí)踐證明詞頻統(tǒng)計(jì)和詞語語義的雙重篩選方法可以使自動(dòng)生成的候選項(xiàng)基本達(dá)到標(biāo)準(zhǔn)譯文數(shù)量和質(zhì)量上的要求。方法論上,創(chuàng)新研究不是從算法比較開始,而是從學(xué)生譯文分析和測評問題的本質(zhì)及實(shí)踐探索開始,旨在認(rèn)識問題的實(shí)質(zhì)及其關(guān)鍵。重視實(shí)踐過程,數(shù)據(jù)分析及其相關(guān)理論:具有獨(dú)特特點(diǎn)的漢語語義理論,涉及人腦學(xué)習(xí)機(jī)制的認(rèn)知理論。 本文的創(chuàng)新點(diǎn)主要在于: 一、凸現(xiàn)本質(zhì),攻克難點(diǎn)。首次對學(xué)生英譯漢自動(dòng)測評問題進(jìn)行實(shí)踐探索和理論

5、探討,提出測評問題的本質(zhì)是基于語義的自動(dòng)測評。在現(xiàn)有中文信息處理相關(guān)理論和技術(shù)條件下,采用關(guān)鍵詞匹配和詞語語義相似度計(jì)算的混合方法實(shí)現(xiàn)自動(dòng)測評,超越了通常單純字符串匹配的局限性。其難點(diǎn)在于如何處理好相似度、離散度和容納度三者之間的關(guān)系。給出了學(xué)生英譯漢網(wǎng)上自動(dòng)測評模型。 二、技術(shù)獨(dú)特,分類處理?!霸~語對比分析器”首次采用詞語分類對比方法,對不同詞類(名詞、動(dòng)詞、形容詞和副詞)采用不同的基于語義的自動(dòng)評分方法,有別于現(xiàn)有常規(guī)的不分

6、詞類的相似度單一算法,明顯提高了譯文對比時(shí)的精確度,而對其它詞類仍采用關(guān)鍵詞匹配,更貼切真實(shí)地反映了學(xué)生的實(shí)際水平。此外,設(shè)計(jì)了“句式對比分析器”,采用人工設(shè)計(jì)標(biāo)準(zhǔn)譯文句式模板,實(shí)現(xiàn)了句子層次上的全局評分,從而更客觀地反映了學(xué)生的理解程度。 三、獨(dú)辟蹊徑,生成譯文。自動(dòng)篩選源自英語名詞短語的部分標(biāo)準(zhǔn)譯文候選項(xiàng)時(shí),首次提出了在概念意義層次上對比英漢詞語、篩選漢譯短語的方法,從而實(shí)現(xiàn)自動(dòng)語義篩選。將詞語表達(dá)式提升到概念層次,克服單純

7、字串匹配所帶來的弊端,試圖反映學(xué)生心智上對詞語的認(rèn)知,從而在較高層次,即復(fù)合概念層次,而不是從單個(gè)概念上,客觀地反映學(xué)生對語言的理解和掌握程度。實(shí)踐證明,該方法對源自英語名詞短語“N1N2”和“N1ofN2”的漢語譯文的自動(dòng)語義篩選,成效顯著。 四、注重實(shí)用,工程實(shí)現(xiàn)。研制了面向?qū)嵱玫南到y(tǒng),建成了自動(dòng)測評網(wǎng)站,實(shí)現(xiàn)了學(xué)生網(wǎng)上注冊、網(wǎng)上選題、網(wǎng)上限時(shí)做題、網(wǎng)上提交譯文、網(wǎng)上即時(shí)反饋和電子郵件反饋評分結(jié)果及標(biāo)準(zhǔn)譯文等功能,在當(dāng)前國內(nèi)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論