基于深度學(xué)習(xí)的動詞檢錯算法的研究及其設(shè)計.pdf_第1頁
已閱讀1頁,還剩68頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、英文作文自動批閱,是近年來快速發(fā)展的一個領(lǐng)域。它逐漸替代了教師人工批閱,成為緩解英語教師教學(xué)負(fù)擔(dān)的重要工具。同時,通過文獻(xiàn)調(diào)研可知,動詞的一致性錯誤和動詞時態(tài)錯誤是英文作文中出錯率最高的兩類語法錯誤。所以,對于動詞錯誤的檢測結(jié)果能反映一個自動批閱系統(tǒng)的實用性和有效性?,F(xiàn)階段,主流的自動批閱系統(tǒng)有冰果、句酷等。在經(jīng)過調(diào)研后,這些系統(tǒng)對于動詞的一致性錯誤和動詞時態(tài)錯誤的檢測結(jié)果不滿足學(xué)習(xí)者的要求。本文針對這個情況,研究出一種基于深度學(xué)習(xí)的動

2、詞語法檢錯算法。
  通過研究和分析發(fā)現(xiàn),動詞一致性錯誤和動詞時態(tài)錯誤的出現(xiàn)與上下文中出現(xiàn)的單詞和短語相關(guān)性較大,而深度學(xué)習(xí)模型LSTM(Long Short-Term Memory)能夠在訓(xùn)練時有效的保留上下文中有效的信息,所以本文決定采用LSTM作為訓(xùn)練模型對于已標(biāo)注的訓(xùn)練語料進(jìn)行建模。同時,如何將英文作文中的文字信息轉(zhuǎn)換為數(shù)值以供后續(xù)計算,也是自動批閱中重要的一步,主流工具中大多使用詞袋模型,即按照每個單詞在詞典中的順序,對

3、每個單詞進(jìn)行編碼。這種編碼方式雖然簡單易用,但是既會導(dǎo)致向量丟失文字的順序信息,也容易出現(xiàn)維度災(zāi)難。所以本文采用詞嵌入模型對于文字進(jìn)行編碼,將文本信息按照順序映射到一個低維度的向量空間,這樣既不丟失文字的位置信息,也避免了維度災(zāi)難。之后,本文收集了一定的語料樣本,將本文算法與句酷和冰果進(jìn)行對比驗證,驗證結(jié)果表明本文算法在動詞檢錯上的優(yōu)越性。
  本文針對主流的自動批閱系統(tǒng)在動詞語法檢錯上的效果較差的情況,提出了基于深度學(xué)習(xí)的動詞語

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論