版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、篇章指由一系列連續(xù)的子句、句子或語段構(gòu)成的語言整體單位,每個篇章不僅具有內(nèi)部連貫性,而且篇章中的各級語言整體。在一個篇章中,子句、句子或語段間具有一定的層次結(jié)構(gòu)和語義關(guān)系,篇章結(jié)構(gòu)分析旨在分析出這種結(jié)構(gòu)關(guān)系。篇章結(jié)構(gòu)分析結(jié)果對于提高自動文摘、知識抽取、自動問答等相關(guān)系統(tǒng)的性能均有重要作用。隨著詞法、句法分析技術(shù)的成熟,篇章結(jié)構(gòu)分析成為制約自然語言處理單位是描述同一問題或同一種情境的相對完整的語言的關(guān)鍵基礎(chǔ)問題。
目前篇章結(jié)構(gòu)分
2、析研究主要面向英語,面向漢語的研究相對落后。主要表現(xiàn)在:1)適用于漢語的篇章結(jié)構(gòu)分析理論還不完善;2)符合漢語特點的大規(guī)模漢語篇章結(jié)構(gòu)語料資源匱乏;3)由于漢英語言上的差異性,適用于英語的篇章結(jié)構(gòu)分析方法不能直接應(yīng)用在漢語篇章結(jié)構(gòu)分析研究中。
本文重點研究了漢語篇章結(jié)構(gòu)的理論表示體系。借鑒英語修辭結(jié)構(gòu)理論和賓州篇章樹庫體系的優(yōu)點,參考漢語復(fù)句和句群的研究成果,結(jié)合漢語本身特點,本文提出一種基于連接依存樹的漢語篇章結(jié)構(gòu)表示體系,
3、并根據(jù)漢語特點定義了其中的關(guān)鍵元素:子句(基本篇章單位)、連接詞、篇章結(jié)構(gòu)關(guān)系、篇章單位主次。連接依存樹的主要特征是葉子節(jié)點為子句,內(nèi)部節(jié)點為連接詞,連接詞通過其層級地位(管轄范圍)表示篇章結(jié)構(gòu)層次,通過其語義(具體與抽象)表示篇章關(guān)系,連接詞所連接的篇章單位根據(jù)篇章整體意圖區(qū)分主次。與修辭結(jié)構(gòu)理論、賓州篇章樹庫體系的理論對比表明,本文所提基于連接依存樹的漢語篇章結(jié)構(gòu)表示體系在理論上具有一定的優(yōu)越性,并且符合漢語特點。基于連接依存樹的漢
4、語篇章結(jié)構(gòu)表示體系是進(jìn)一步開展篇章結(jié)構(gòu)語料庫構(gòu)建的理論基礎(chǔ)。
在此基礎(chǔ)上,進(jìn)行了漢語篇章結(jié)構(gòu)語料庫的構(gòu)建研究?;谶B接依存樹表示體系,本文采用自頂向下的標(biāo)注策略和人機(jī)結(jié)合的語料庫標(biāo)注方式,構(gòu)建了漢語篇章結(jié)構(gòu)語料庫(Chinese Discourse Treebank,CDTB)。CDTB目前包含來自Chinese Treebank的500個文檔,本文對其進(jìn)行分析并展示了語料庫的標(biāo)注情況。標(biāo)注一致性測試表明CDTB標(biāo)注質(zhì)量較好,
5、統(tǒng)計數(shù)據(jù)表明所標(biāo)CDTB達(dá)到一定規(guī)模。CDTB可以為漢語篇章結(jié)構(gòu)分析研究提供資源支持。
最后,本文實現(xiàn)了基于連接依存樹的漢語篇章結(jié)構(gòu)分析平臺。該平臺包括子句識別、篇章結(jié)構(gòu)樹構(gòu)建、篇章關(guān)系識別、篇章單位主次識別任務(wù),實驗結(jié)果驗證了本文所提基于連接依存樹的漢語篇章結(jié)構(gòu)表示體系的合理性,以及所標(biāo)CDTB語料庫的可用性。
目前,漢語篇章結(jié)構(gòu)分析研究尚處于起步階段,本文研究亦屬探索性工作,上述工作在理論研究、資源建設(shè)、計算分析
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 漢語篇章話題結(jié)構(gòu):表示體系、資源構(gòu)建及其分析研究.pdf
- 漢語篇章銜接方式及應(yīng)用.pdf
- 意思表示錯誤體系構(gòu)建論.pdf
- 漢語篇名的篇章化研究.pdf
- 基于修辭結(jié)構(gòu)理論的留學(xué)生漢語議論文篇章結(jié)構(gòu)研究.pdf
- 現(xiàn)代漢語篇章管界問題研究.pdf
- 漢語篇章中的時間范疇研究.pdf
- 人力資源會計體系構(gòu)建研究.pdf
- 漢語指示語及其篇章銜接功能研究.pdf
- 漢語篇章詞匯銜接淺探.pdf
- 漢語被動表示法研究.pdf
- 學(xué)校體育資源評估指標(biāo)體系構(gòu)建及驗證研究.pdf
- 英漢篇章結(jié)構(gòu)對比在對外漢語寫作教學(xué)中的應(yīng)用研究.pdf
- 構(gòu)建資源LMS循環(huán)利用戰(zhàn)略模式及標(biāo)準(zhǔn)體系的研究.pdf
- 漢語篇章零形式識別與填充.pdf
- 移動個性化服務(wù)系統(tǒng)研究——體系結(jié)構(gòu)及內(nèi)容表示研究.pdf
- 漢語篇章連貫性自動分析方法研究.pdf
- 陵墓旅游資源評價體系構(gòu)建研究.pdf
- 基于框架語義的漢語篇章連貫性研究.pdf
- 企業(yè)人力資源培訓(xùn)體系構(gòu)建研究
評論
0/150
提交評論