版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、回指是自然語言中最為常見的現(xiàn)象之一,因而回指解析與生成對于語篇理解和生成至關重要.零形回指在漢語語篇中應用廣泛,然而解析和生成零形回指卻是一項較為棘手的任務,因為漢語中的零形回指可充當各種論元角色,且先行詞也可以出現(xiàn)于任一語法位置。到目前為止,許多學者從不同角度探討了漢語零形回指的解析與生成方法,其中最為普遍的是從句法角度(HuangL1984,1989;XuLJ.,1986),語篇功能角度(LiandThompson,1979,198
2、1;Chen,1986;XuJ.J.,1990,2003;Tao,1993,1997;Cheng,1990;Lee,1990d995;You,1998;XuYL.,1995,2004),語用角度(HuangY.,1994)以及認知角度(TomlinandPu,1991)。然而這些研究在很大程度上還是停留于‘解釋’階段,因而不能成為真正意義上的‘解析’與‘生成’。而且這些研究不夠明晰化且應用性較弱,不太適用于計算機處理。 本研究旨
3、在推導出用于解析和生成漢語語篇零形回指的計算模型。向心理論(CenteringTheory,Groszetal.1995;Walkeretal.1998,interalia)是當前計算機語言學中用于語篇回指解析與生成的主要理論模式之一。為了驗證該理論中規(guī)則和限制條件的跨語言適用性,許多學者將其應用于各種語言的回指解析與生成。其中有些學者將其應用于零形回指的解析與生成(Karneyama,1985,1986,1988,1998;Walke
4、r,Iida,andCote,1990,1994;Mitsukoetal.,2001;Turan,1995,1998;DiEugenio,1990;Rainbow,1993;Ryu,2001;Prasad,2003;Prince,1994)。然而在國內,很少有學者將向心理論應用于漢語語篇回指解析與生成。從已發(fā)表的文獻中,筆者只發(fā)現(xiàn)兩篇有關向心理論的文章。一篇是(Miao,2003),另一篇是(Wang,2004)。Miao(2003)對
5、向心理論進行了評介,但沒有將其應用于漢語語篇分析;Wang(2004)將向心理論應用于漢語語篇零形回指的解析,但他使用的算法是采用Iida(1998)的宏觀模型(OlobalModel),而且對于許多細節(jié)問題都沒有進行深入探討?;谝陨锨闆r,本研究擬將向心理論全面而系統(tǒng)地應用于漢語語篇分析,從而推導出用于解析和生成漢語語篇零形回指的計算模型。 本研究將向心理論作為理論框架。推導出的第一個計算模型是漢語零形回指解析模型,稱為RIC
6、M(RevisedIntegratedCacheModel)。此模型是對Walker,(1996)集成貯藏模型(IntegratedCacheModel)的改進,它吸取了Walker(1996)的‘反堆棧’(anti-stack)思想,并利用了Cheng(1990)和Lee(1990,1995)的找回原則(RecoveryPrinciples),因為詞匯語義可作為尋找指稱對象的理想尋找提示語(retrievalcues)。 具體
7、來說,本研究修訂了第一向心規(guī)則(或稱代詞規(guī)則),并制定了其他六個規(guī)則,即下指中心排序規(guī)則(theCfRankingrule)、下指中心提升規(guī)則一(theCfPromotionruleI)、下指中心提升規(guī)則二(theCfPromotionruleII)、下指中心遷移規(guī)則(theCfTransferrule,)、下指中心刪除規(guī)則(theCfDeletionrule)以及下指中心移出規(guī)則(theCfDisplacememrule)。基于以上規(guī)
8、則,本研究推導出漢語零形回指的解析模型和算法。與堆棧模型(Croszand-Sidner1986)、宏觀模型(Iidal998)和貯藏模型(Walker1996)相比,此模型的優(yōu)點是既可以不求助于宏觀排序列表來解析跨語段零形回指,還可以解決排序較低實體充當回指中心的問題。 為了驗證本解析算法的有效性,我們進行了實證研究,所采用的語料是選自《中國民間故事選粹》中的18篇短篇故事。實驗結果表明,在語料中出現(xiàn)的所有零形回指中,95%都
9、被本算法成功解析,因此本算法是有效可行的,因為算法的解析正確率為95%。 本研究推導出的第二個計算模型是漢語零形回指生成模型。此模型將向心過渡類型(CenteringTransitions)作為回指詞分布的限定條件,因為過渡類型是生成回指形式的有效方法之一(Turan1995;Kim1999;Ryu2000)。本研究從語料中提取出所有相關的過渡類型,并基于這些過渡類型推導出零形回指生成算法。通過語料驗證,此算法的生成準確率高達9
10、6.75%,因此此算法是有效可行的。 由于向心理論具有跨語言的特征,因此必須對其參數(shù)進行適當?shù)男抻?,以便對漢語語篇進行應用分析。這些參數(shù)包括語段定義、語篇片段切分和下指中心集排序。 語段(utterance)是語篇組織的基本單位?;谙惹暗亩x方法(n,1956;Hu,1981;Huang&Liao,198l;MannandThompson1987;Crystal1991;Zhu,1995;Poesio1995;Trau
11、m&Heeman1996;Bussmarm1996;Chu1998;Kameyama1998;Aronoff&Rees-Miller2001;Song,2001;Xu,2003),本研究推導出語段的定義方法,此方法適用于漢語語篇的向心分析,因為它既符合漢語的句子特征,又便于計算機處理。 語篇可切分為一個個語篇片段(discoursesegment),但語篇片段的切分標準和方法卻尚無定論。為避免出現(xiàn)無回指中心(sil)和零過渡類型
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 意識流語篇中搭橋回指的生成——一項基于向心理論的研究.pdf
- 先行詞的凸顯度與回指詞選擇的關系——一項基于英語新聞語料的研究.pdf
- 基于語料庫的現(xiàn)代漢語語篇零形回指歷時研究.pdf
- 基于句子和篇章層次的回指研究.pdf
- 現(xiàn)代漢語語篇話題探微——一項基于不同語體語料的研究.pdf
- 基于現(xiàn)代漢語語料庫的文言虛詞“之”的回指研究.pdf
- 漢語零形回指的認知機制研究.pdf
- 英漢敘述性語篇回指對比研究——一項實證研究.pdf
- 基于語料庫的英語回指的漢譯研究.pdf
- 基于向心理論的維吾爾語語篇回指研究.pdf
- 情態(tài)與語篇-一項基于語料庫的功能途徑調查.pdf
- 現(xiàn)代漢語零形回指加工的ERP研究.pdf
- 英語學術書評中的評價:一項基于語料庫的研究.pdf
- 英漢翻譯語言接觸與漢語變異——一項基于《-中國翻譯-英譯漢選萃》語料的對比研究.pdf
- 漢英同傳中的自我修正現(xiàn)象-一項基于語料庫的研究.pdf
- 基于語料庫的回式漢語定量研究.pdf
- 一項基于中國英語學習者語料庫的語義韻研究.pdf
- 一項語料庫數(shù)據(jù)驅動下基于認知模型網(wǎng)絡的搭配研究.pdf
- 詞匯銜接與大學英語作文質量的關系——一項基于語料庫的研究.pdf
- 英語專業(yè)學生口試語言錯誤分析——一項基于SECCL語料的研究.pdf
評論
0/150
提交評論