面向自然語言文本的否定性與不確定性識別研究.pdf_第1頁
已閱讀1頁,還剩116頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、蘇州大學(xué)學(xué)位論文獨創(chuàng)性聲明本人鄭重聲明:所提交的學(xué)位論文是本人在導(dǎo)師的指導(dǎo)下,獨立進(jìn)行研究工作所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本論文不含其他個人或集體已經(jīng)發(fā)表或撰寫過的研究成果,也不含為獲得蘇州大學(xué)或其它教育機(jī)構(gòu)的學(xué)位證書而使用過的材料。對本文的研究作出重要貢獻(xiàn)的個人和集體,均已在文中以明確方式標(biāo)明。本人承擔(dān)本聲明的法律責(zé)任。研究生簽名:壘車鯉華日面向自然語言文本的否定性與不確定性識別研究摘要面向自然語言文本的否定性與不確定性

2、識別研究摘要自然語言文本中存在大量否定性與不確定性語言現(xiàn)象,反映了人類在使用語言表達(dá)觀點時的態(tài)度,亦或者語言信息本身的可信度。語言的否定性指,由否定運算符對命題本身或其某一方面的語義進(jìn)行了反轉(zhuǎn);語言的不確定性指,包含了情態(tài)、言據(jù)性、或然性、主觀性等任何一類語義,介于肯定和否定語義之間。識別并理解自然語言的否定性與不確定性,對更深層次的自然語言理解具有重要意義,并且隨著自然語言處理領(lǐng)域相關(guān)應(yīng)用的不斷增長,該研究受到越來越多的關(guān)注,如信息抽

3、取、情感分析、信息檢索、機(jī)器翻譯等研究。面向自然語言文本的否定性與不確定性識別研究主要包含三個子任務(wù):1)觸發(fā)詞檢測,即識別出文本中表達(dá)否定或不確定語義的關(guān)鍵詞;2)覆蓋域界定,即在句子內(nèi),判定否定或不確定語義的作用范圍;3)聚焦點識別,指在覆蓋域中識別被否定語義強(qiáng)調(diào)的內(nèi)容。本文研究圍繞以上三個任務(wù)展開。首先,本文提出了基于樹核的覆蓋域界定模型,有效并充分地利用結(jié)構(gòu)化句法特征,提高了該任務(wù)的性她He;其次,本文提出了基于“詞主題”雙層結(jié)

4、構(gòu)圖模型的聚焦點識別方法,該方法通過上下文信息判斷聚焦點;為推動該研究在漢語上的進(jìn)展,本文構(gòu)建了首個漢語否定性與不確定性語料庫;最后,本文針對漢語的語言特點提出了一套完整的面向漢語的否定性與不確定性識別方法。具體地,本研究的主要內(nèi)容包括以下四個方面:1基于樹核的覆蓋域界定模型。覆蓋域是指觸發(fā)詞的語義作用范圍,大量研究表明,句法特征是判定覆蓋域的重要證據(jù),然而,相關(guān)工作通常僅考慮平面化的句法特征,即用特征向量來表示句法結(jié)構(gòu),該表示方法很難

5、恰當(dāng)并全面地反映觸發(fā)詞與覆蓋域在句法結(jié)構(gòu)上的關(guān)系。因此,本文提出了兩種類型的子樹結(jié)構(gòu)來提取觸發(fā)詞與覆蓋域之間的關(guān)系特征,并利用卷積樹核模型衡量這些結(jié)構(gòu)特征之間的相似度,進(jìn)而確定覆蓋域。此外,本文還嘗試采用復(fù)合核將平面化特征與結(jié)構(gòu)化特征進(jìn)行融合,提高了現(xiàn)有覆蓋域界定方法的性能。2基于“詞主題”雙層結(jié)構(gòu)圖模型的聚焦點識別方法。不同于面向語音語料的相關(guān)研究能夠利用重音和語調(diào)等特征,面向文本的聚焦點識別研究僅根據(jù)詞法和句法特征識別聚焦點。通過對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論