2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩227頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、復(fù)句作為漢語語法的重要實體單位,在語法學(xué)界受到較多關(guān)注,且相關(guān)理論成果較多。但是,從中文信息處理的角度來看,漢語復(fù)句的信息化處理的相關(guān)成果還較少,復(fù)句信息工程尚未取得實質(zhì)性的突破和進(jìn)展。究其原因,一是研究還不全面深入,現(xiàn)有的成果還未囊括復(fù)句信息處理的所有環(huán)節(jié)和難題:二是大多數(shù)研究成果都是面向人的,很多方法在信息處理中操作性不強(qiáng);三是各個研究相對孤立,未將所有環(huán)節(jié)串聯(lián)起來,形成一個有機(jī)的整體。目前,復(fù)句的信息化研究主要是分句與非分句的識別

2、、復(fù)句層次關(guān)系的識別,而這些研究都以關(guān)系詞的提取為前提??梢?一方面,關(guān)系詞的自動提取是其他各項研究工作得以開展的基礎(chǔ):另一方面,關(guān)系詞作為構(gòu)成復(fù)句的一個部件,本身也需要深入研究。在這種背景下,本文以面向中文信息處理為出發(fā)點(diǎn),以邢福義先生的復(fù)句理論為指導(dǎo),對復(fù)句關(guān)系詞的自動標(biāo)識方法進(jìn)行研究和探討,并以自動機(jī)理論、形式化邏輯等為輔助手段,對關(guān)系詞標(biāo)識涉及的問題進(jìn)行建模,對總結(jié)的規(guī)則進(jìn)行形式化描述和存儲,并研究基于規(guī)則的關(guān)系詞自動標(biāo)識的方法

3、,已達(dá)到自動標(biāo)識復(fù)句關(guān)系詞的目的。
   本文的研究主要從以下四個方面展開:
   1、全面總結(jié)影響關(guān)系詞自動標(biāo)識的因素。影響關(guān)系詞標(biāo)識準(zhǔn)確率的因素主要有五類,分別為:關(guān)系副詞的影響,介詞的影響,關(guān)系標(biāo)記不同用法的影響(同形異義詞、同形異構(gòu)詞、同形異類詞的關(guān)聯(lián)和非關(guān)聯(lián)用法的影響),關(guān)系標(biāo)記搭配的影響和關(guān)系標(biāo)記隱現(xiàn)形式的影響。對每一類影響因素,主要分析其各自的特點(diǎn),并討論對應(yīng)的處理方法和策略。
   2、對標(biāo)記連用

4、現(xiàn)象進(jìn)行深入研究。主要研究二標(biāo)記連用和三標(biāo)記連用時各個標(biāo)記的語法語義功能和類別。對于二標(biāo)記連用,歸納出矛盾類和限制類兩種類型.這種類型的區(qū)分,既可以在計算機(jī)處理時減少不必要的計算,也可以作為復(fù)句分析過程中的一個切入點(diǎn)。三標(biāo)記連用現(xiàn)象中,識別不同的關(guān)系詞所需的方法不同,沒有一個統(tǒng)一且粒度較細(xì)的策略,需要具體問題具體分析。
   3、研究句式特點(diǎn)與關(guān)系詞標(biāo)識之間的關(guān)系。主要考察三類句式:第一、格式固定且無歧義,但語義關(guān)系不好確定導(dǎo)致

5、關(guān)系詞轄域確定困難的句式,稱之為特殊句式;第二、擴(kuò)展句式,普通的基于搭配理論的算法不能很好地處理擴(kuò)展句式的關(guān)系詞標(biāo)識問題;第三、多重復(fù)句的普通句式,復(fù)句實例的標(biāo)記序列中含有多個標(biāo)記對。對于特殊句式,采用表里關(guān)聯(lián)的方式將標(biāo)記序列與處理結(jié)果——對應(yīng);對于擴(kuò)展句式,采用自動機(jī)理論進(jìn)行建模,既保證了可操作性,又保證了對語言現(xiàn)象的概括性;對普通句式,主要是把問題抽象化,并轉(zhuǎn)化為數(shù)學(xué)模型,利用解空間的求解來對標(biāo)記序列進(jìn)行處理。針對上述句式,建立規(guī)則

6、庫,并探討了基于規(guī)則的關(guān)系詞自動標(biāo)識方法。
   4、對部分充盈模態(tài)和非充盈模態(tài)下關(guān)系詞的標(biāo)識問題進(jìn)行研究。文章首先對分句的語義關(guān)聯(lián)理論進(jìn)行了進(jìn)一步地補(bǔ)充,提出3大類14個語義關(guān)聯(lián)特征,并制定了特征分析的優(yōu)先圖,修正了分句語義關(guān)聯(lián)度的計算方法。充盈模態(tài)下的關(guān)系標(biāo)記主要考察“不是就是”,“雖然但是所以”等。研究發(fā)現(xiàn)。對“不是就是”,可利用極值分析法處理;對“雖然但是所以”,暫無較好的處理策略,需要建立常識知識庫。非充盈模態(tài)下主要是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論