版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、命名實體關系是構建語義網(wǎng)絡、本體和語義Web的基礎,并且廣泛應用于信息檢索、機器翻譯以及自動問答等系統(tǒng)中。在命名實體關系抽取研究中,特征選擇和特征抽取是兩個關鍵問題。位置特征擁有良好的可計算性和可操作性,同時語義特征具有較強的可理解性和現(xiàn)實性。目前,中文命名實體關系抽取主要采用空間向量模型、傳統(tǒng)語義計算或支持向量機等方法。上述三種方法均是單一地使用位置特征或語義特征,沒能將兩種特征進行合理而有效地結合,因此抽取效果均不夠理想。
2、 為了提高中文命名實體關系抽取的效果,本文提出了一種基于位置特征和語義特征相結合的關系抽取算法LaSE(Location and Semantic Extraction)。本文的主要工作如下:
(1)在確保關系抽取效果的前提下,LaSE 算法靈活地運用詞語的詞性識別命名實體,替代了傳統(tǒng)抽取方法需要人工提供的命名實體表。一方面,這一改進大大地減少了人工參與;另一方面,詞性是一個與領域無關的概念,不會引入任何領域知識。
3、r> (2)本文中,采用基于詞語間相對距離的信息增益來刻劃位置特征,使用基于泛本體《知網(wǎng)》的語義相似度計算來抽取語義特征。通過位置特征和語義特征的結合,能很好地適應中文實際情況。大量實驗證明:LaSE 算法的抽取效果明顯高于單一使用位置特征或語義特征的抽取算法。
(3)LaSE 算法僅需要提供少量的關系種子就能自動抽取目標關系的關系實例,是一種半監(jiān)督學習算法;算法不需要任何領域知識,具有良好的領域獨立性,從一個領域移
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于詞匯語義信息的中文命名實體關系抽取研究.pdf
- 基于依存樹的中文命名實體語義關系抽取的研究.pdf
- 命名實體間語義關系抽取研究.pdf
- 中文命名實體識別及其關系抽取研究.pdf
- 語言學特征在中文命名實體間語義關系抽取中的應用研究.pdf
- 漢語專業(yè)領域命名實體語義關系自動抽取研究.pdf
- 基于樹核函數(shù)的命名實體語義關系抽取方法的研究.pdf
- 命名實體識別及其關系抽取.pdf
- 基于網(wǎng)絡抱團發(fā)現(xiàn)的命名實體關系抽取.pdf
- 面向信息抽取的中文命名實體識別研究.pdf
- 中文命名實體識別粒度和特征選擇研究.pdf
- 基于核函數(shù)的命名實體關系抽取技術研究.pdf
- 基于迭代方法的命名實體關系抽取技術研究.pdf
- 基于種子自擴展的命名實體關系抽取方法的研究.pdf
- 基于特征向量的中文實體間語義關系抽取研究.pdf
- 基于混合方法的復雜命名實體抽取研究.pdf
- 基于句法和語義分析的中文實體關系抽取.pdf
- 基于CRF的中文命名實體識別研究.pdf
- 基于Wikipedia的中文命名實體識別研究.pdf
- 中文微博的地理位置命名實體識別研究.pdf
評論
0/150
提交評論