版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著Web2.0的迅猛發(fā)展,其中的服務項目--Blog的網頁數量急劇增長,如何在數以百萬的Blog頁面中找到主題相關的Blog網頁成為博客檢索的一個重要研究內容。由于Blog網頁資源的獨特特征,普通的網頁搜索引擎對Blog的檢索效率不高,于是針對Blog頁面的專業(yè)搜索引擎Blog搜索引擎誕生了。然而現有Blog搜索引擎技術存在一些不足,表現在以下三個方面:第一,現有對博客資源搜索的研究未涉及到語義組織層面;第二,目前的Blog搜索引擎不
2、支持語義查詢擴展;第三,現在國內外的Blog搜索引擎檢索結果都差強人意。目前尚無專門用于專業(yè)領域學術博客的語義搜索系統(tǒng),研究人員一般借助現存可用的通用網頁搜索引擎等工具來實現檢索。因此開發(fā)一個適用于某一領域學術博客的專業(yè)搜索系統(tǒng)將會給研究人員的工作帶來更多的方便。
本文從這一實際出發(fā),基于自身所學知識,選擇與專業(yè)相關的圖情領域學術博客作為研究對象,探討了一種新的信息檢索模式--圖情博客語義檢索,即以領域本體庫作為概念支撐,
3、從傳統(tǒng)的面向句法和結構的關鍵詞匹配轉變?yōu)槊嫦蛘Z義概念的推理,使整個博客資源的搜索上升到語義層面。筆者從語義信息描述、語義本體構建、語義檢索幾個方面對圖情博客語義檢索系統(tǒng)的關鍵問題進行了深入分析和研究,選擇有代表性的圖情博客資源作為實例對象,利用本體構建的方法,構建了圖情領域本體,在此基礎上,通過概念之間的語義聯(lián)系,實現對圖情博客資源的語義描述、圖情博客語義檢索系統(tǒng)的設計、構建和實現。該系統(tǒng)的測試結果表明,文中提出的博客資源語義檢索模式與
4、傳統(tǒng)搜索引擎相比更能為用戶提供準確的信息,說明語義檢索能夠滿足用戶語義層面的需要。
本文主要研究內容如下:1、語義信息描述。本體是語義信息的描述基礎,語義信息主要由語義類、語義屬性、語義關系、語義規(guī)則和語義實例構成,而這和本體中的概念、概念屬性、概念關系、規(guī)則和公理、本體實例對應;語義信息提取是本體實例化的一種重要形式,在語義信息描述模式被定義后,所有的類或概念、屬性、關系將根據實際情況進行具體賦值,這個過程也可以稱為本體
5、實例化;本體是語義檢索的構成基礎之一,由于本體本身具有一定的推理功能,可以利用本體進行擴展查詢,從而使檢索結果更加全面。本文引入本體概念描述圖情博客資源,具體介紹了本體的功能、結構、構建方法和描述工具,分析了幾種構建方法和工具的利弊,選用七步法配會Protégé工具構建圖情領域本體。
2、領域本體知識庫構建。由以上對語義信息描述的研究可知,一個專業(yè)的領域本體的構建需要有完善的領域概念框架。本文試圖利用《中國圖書館分類主題詞
6、表》和《漢語敘詞表》中規(guī)范的敘詞和關系來搭建圖情領域本體的基本框架體系。因此,筆者分析了敘詞表和本體的聯(lián)系和區(qū)別,指出其結構上的相似性,并闡述了基于敘詞表向本體轉換的可行性和必然性,提出了具體的轉化步驟。在此基礎上,進行圖情領域本體的構建,給出了構建原則、步驟、本體結構和詳細的構建實例,并通過設計算法實現形式化本體的生成和導出。然后設計并實現了以敘詞表為基本框架的圖情博客本體的語義檢索系統(tǒng)。
3、圖情博客語義檢索。語義檢索
7、的主要任務是從某一領域相關的非結構化信息、半結構化語義信息和結構化信息中提取語義實體和語義關系實例,并將結果存儲到檢索結果庫中。對于圖情學術博客這一有特殊結構形式的半結構化網頁信息,通過建立原有結構和語義類及屬性之間的映射關系,可以進行數字化處理。本文研究的語義檢索是區(qū)別于傳統(tǒng)關鍵詞檢索的,對檢索條件、信息組織及檢索結果都賦予了一定語義成份的新的檢索方式。從語義信息檢索的新模式出發(fā),詳細分析和研究了基于本體驅動的圖情博客語義檢索系統(tǒng)的總
8、體結構以及詳細功能模塊設計,并對系統(tǒng)的功能進行了測試和評價,證明了本文提出方法的可行性。由此證明了這種新的語義檢索模式能夠提高博客資源的利用率,更好的滿足用戶檢索需求。最后,總結了本文研究中存在的問題,提出了后續(xù)研究的方向和內容。
本文以敘詞表為框架的圖情博客領域本體構建方法研究以及基于該領域本體的語義搜索引擎系統(tǒng)的設計、開發(fā)與實現是本文的重點研究內容和創(chuàng)新之處。該原型系統(tǒng)證明了基于敘詞表構建博客領域本體并實現語義檢索的可
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于語義網的博客搜索系統(tǒng)研究.pdf
- 基于本體的語義搜索研究與實現.pdf
- 基于搜索排序算法的本體評價系統(tǒng)研究.pdf
- 基于領域本體集成的語義查詢系統(tǒng)研究.pdf
- 基于搜索日志的用戶語義本體構建研究.pdf
- 基于本體管理的高校信息搜索系統(tǒng)研究.pdf
- 基于本體的語義數據搜索的研究與實現.pdf
- 基于本體的語義Web服務搜索技術的研究.pdf
- 基于Nutch的圖情博客搜索引擎的設計與實現.pdf
- 基于本體技術的旅游信息語義查詢系統(tǒng)研究.pdf
- 基于Rough本體的語義搜索引擎研究.pdf
- 基于語義本體的智能搜索引擎研究.pdf
- 基于本體知識庫推理的語義搜索研究.pdf
- 基于語義網的博客搜索引擎的研究.pdf
- 基于本體的語義垂直搜索引擎研究.pdf
- 基于本體的港口客戶Web語義分析系統(tǒng)研究.pdf
- 語義Web搜索中的本體映射研究.pdf
- 基于本體的Deep Web語義搜索引擎.pdf
- 基于語義本體的垂直搜索引擎模型研究.pdf
- 基于領域本體的語義化搜索技術研究與實現.pdf
評論
0/150
提交評論