基于面本體的情境搜索研究.pdf_第1頁
已閱讀1頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、人們在傳統(tǒng)搜索引擎上所用到的關(guān)鍵字搜索技術(shù)發(fā)展成熟,是當(dāng)今最流行的搜索方式。但是用戶輸入關(guān)鍵字,搜索自己想要的東西,想表達(dá)的意思僅僅用幾個關(guān)鍵詞并不能完全表達(dá)清楚,而計算機(jī)卻只能根據(jù)關(guān)鍵詞作全文匹配,常常不能達(dá)到用戶想要的效果。比如,“椅子”這個詞,它本身的屬性包括了椅子的材質(zhì),形狀,設(shè)計工藝,制作廠家,制作時間,地點等等,這一系列潛在的屬性構(gòu)成了一個復(fù)雜的基于語義的關(guān)聯(lián)網(wǎng)。單純的關(guān)鍵詞匹配已經(jīng)不能適應(yīng)人們對搜索更精細(xì)化,人性化的要求。

2、下一代網(wǎng)絡(luò)WEB3.0”語義網(wǎng)”在搜索方面的研究側(cè)重于具有語義分析能力的搜索引擎,要求搜索引擎能夠理解人類的自然語言,并且具有一定的推理和判斷能力。
   本文提出了一種基于面本體的情境搜索模型(ContextSearchBasedonFacetedOntology,CSFO),CSFO模型構(gòu)建面本體FO來表示信息搜索領(lǐng)域的各個屬性面,構(gòu)建情境本體CO來創(chuàng)造用戶搜索的當(dāng)前情境,CSFO模型的主要思想根據(jù)情境本體CO對用戶輸入的關(guān)

3、鍵字進(jìn)行語義擴(kuò)展,生成相應(yīng)的搜索本體SO,通過面本體FO標(biāo)注獨立數(shù)據(jù)源的異構(gòu)文檔,最后利用相關(guān)的本體匹配算法進(jìn)行搜索本體與面本體的本體匹配,從面本體中匹配出與當(dāng)前搜索本體最相似的結(jié)果本體RO,實現(xiàn)情境搜索。CSFO模型旨在為用戶提供更符合用戶當(dāng)前情境的搜索結(jié)果。本文的研究工作主要包括以下五個方面:
   第一,本文將本體技術(shù)整合到信息檢索中,構(gòu)建多個不同的本體數(shù)據(jù)模型表示不同的信息。本文用到的本體數(shù)據(jù)模型包括:情境本體CO,搜索

4、本體SO,面本體FO,結(jié)果本體RO。CO用來表示用戶的情境信息,SO來表示用戶當(dāng)次的查詢信息,F(xiàn)O來表示被搜索的相關(guān)領(lǐng)域信息,RO用來表示當(dāng)次的查詢結(jié)果。
   第二,本文用搜索本體模型SO代替關(guān)鍵詞進(jìn)行搜索查詢,將用戶情境信息引入搜索系統(tǒng)。本文利用情境本體模型中的概念詞匯,對用戶在客戶端輸入的關(guān)鍵詞進(jìn)行語義擴(kuò)展,規(guī)范用戶自然語言的查詢輸入,提取有檢索意義的概念詞組通過基于情境本體的語義擴(kuò)展算法SECO生成完成當(dāng)次搜索的搜索本體

5、模型。用搜索本體代替關(guān)鍵詞進(jìn)行信息匹配,擴(kuò)大了用戶情境信息表示的完整度。
   第三,本文從不同的獨立數(shù)據(jù)源構(gòu)建面本體FO,規(guī)范搜索信息的表示形式。本文通過下面四個步驟:a.產(chǎn)品系列分類;b.實體擴(kuò)展;c.生成面單元FU及概念映射;d.面建模;來構(gòu)建一個完整的特定領(lǐng)域的面本體。每個面本體從實體(Entity),性質(zhì)(Property),活動(Action),修正(Modifier)這四個面進(jìn)行概念分層。本文將被搜索的信息用面本體

6、進(jìn)行表示,不僅能規(guī)范各個獨立數(shù)據(jù)源的信息,而且能通過面本體擴(kuò)展各實體,概念及其屬性之間的相關(guān)關(guān)系,豐富情境搜索結(jié)果的內(nèi)容,提高搜索結(jié)果與用戶情境的相關(guān)性。
   第四,本文通過搜索本體SO與面本體FO的本體匹配從用戶角度,返回查詢信息,實現(xiàn)情境搜索。本文用到兩種本體匹配的方法進(jìn)行搜索本體與面本體的本體匹配,其中一種是基于圖的情境搜索算法CRG,該算法借鑒了相似度洪泛算法的思想;另一種是不一致本體推理算法CRIO,是將面本體,情境

7、本體,搜索本體,結(jié)果本體全部抽象成不一致本體,通過不一致本體的推理,從面本體中匹配出與之相似的搜索本體。無論是哪一種方法,最終目的都是在面本體中匹配出與搜索本體最相似的面本體的子本體,然后通過相關(guān)函數(shù)將子本體轉(zhuǎn)換成由標(biāo)題,日期,鏈接,內(nèi)容這幾個關(guān)鍵字段組成的數(shù)據(jù)信息,形成搜索結(jié)果,返回給用戶實現(xiàn)情境搜索。
   第五,實驗分析與評價。為驗證CSFO模型的可行性和有效性,通過仿真實驗對該方法進(jìn)行了小數(shù)據(jù)集的模擬與實現(xiàn),同時,通過即

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論