2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩51頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、漢語的虛詞豐富多樣且沒有形態(tài)標記和曲折變化,卻又擔負著繁重的語法和語義的表現(xiàn)任務,這就決定了虛詞更加靈活和難以掌握,因此對虛詞的研究有著重要的意義?,F(xiàn)代漢語虛詞用法的自動識別是以虛詞用法知識庫為基石的,虛詞用法知識庫越完備、規(guī)模越大,對現(xiàn)代漢語虛詞用法的自動識別也會越有幫助。本文簡要介紹了現(xiàn)代漢語虛詞用法知識庫的概念和“三位一體”的結構框架,并詳細介紹了現(xiàn)代漢語虛詞用法知識庫的內(nèi)容:現(xiàn)代漢語虛詞用法詞典、現(xiàn)代漢語虛詞用法規(guī)則庫、現(xiàn)代漢語

2、虛詞用法語料庫。
   目前虛詞用法的自動識別方法有基于規(guī)則和基于統(tǒng)計兩種基礎方法,還有二者相互結合的方法,本文采用基于規(guī)則的方法詳細介紹了虛詞用法的自動識別。一個虛詞有多種用法,就有多個識別規(guī)則,在虛詞用法的自動識別過程中使用規(guī)則的不同順序可以得到不同的用法識別的準確率。對規(guī)則進行全排序并用全排序的結果逐一標注可以得到最佳排序,但是時間復雜度較高。而先對全排序的結果進行篩選,然后用篩選之后的集合標注則可以大大降低時間復雜度。<

3、br>   “偏誤”一詞主要用于二語習得領域的中介語錯誤,初高中生語文考試中的病句與其在句型和特征方面有不同的地方,但是大體上都可以歸類于錯序、誤加、誤代、遺漏四大類,并且虛詞錯用在其中所占的比例都非常大。因此可以考慮都用基于虛詞用法的方法進行識別研究。偏誤類型在大的方面可以分為四類,但是具體到每個虛詞的用法,情況卻千差萬別。本文從虛詞用法的角度,用基于規(guī)則的識別方法對四類偏誤中的部分小類進行研究,識別準確率為:83.67%、91.5

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論