版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、目前,大多數(shù)搜索引擎系統(tǒng)都是基于用戶關鍵詞查詢的信息檢索系統(tǒng)。在使用這類搜索引擎查詢信息時,主要通過匹配用戶輸入的查詢關鍵詞進行檢索。由于用戶輸入查詢詞的數(shù)目有限,因此僅通過用戶輸入的關鍵詞并不能很好的體現(xiàn)用戶的查詢意圖。另外,搜索引擎將查詢結果返回給用戶時,往往將只包含用戶查詢請求的幾個句子作為Web頁面的摘要返回給用戶。雖然返回摘要的內容包含用戶的查詢關鍵詞,但是這些句子并不能表達出整個Web文檔的中心意思。也就是說,用戶通過閱讀搜
2、索引擎返回的摘要并不能確定自己查找的信息是否包含在這個頁面中。
針對上述問題,本文對搜索引擎返回結果的自動摘要進行了研究,在對用戶查詢關鍵詞擴展的基礎上,提出一種適合用戶查詢的句子權重計算方法,通過有效地利用關鍵詞間的距離信息來提高摘要的準確率和覆蓋率,方便用戶查找自己所需要的信息。
基于偽相關反饋的思想,對用戶的查詢關鍵詞進行擴展。根據用戶的原始查詢關鍵詞將文本中的句子分為主題相關句和非主題相關句,只選取主
3、題相關句子中的名詞或者名詞短語作為查詢擴展的候選擴展詞語。通過計算候選詞與用戶查詢關鍵詞之間的相關權重來選擇查詢擴展的擴展詞。從而使最終得到的查詢關鍵詞序列既體現(xiàn)Web頁面的主題,又滿足和查詢的相關性。
在計算句子的重要度時,考慮句子中包含的用戶查詢關鍵詞之間的關系,基于“詞距離越近,關系越密切”的原則,在句子權重計算公式中有效地引入詞的距離信息,提高用戶查詢的準確效率。實驗結果表明,使用融合詞距離信息的句子權重計算方法可
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 搜索引擎返回結果的聚類方法研究.pdf
- 搜索引擎返回結果聚類技術的研究與實現(xiàn).pdf
- 搜索引擎中搜索結果組織的研究.pdf
- 搜索引擎搜索結果的聚類研究.pdf
- 搜索引擎結果的再檢索.pdf
- Web搜索引擎的搜索結果聚類研究.pdf
- 傳統(tǒng)搜索引擎與智能搜索引擎比較研究.pdf
- [學習]搜索引擎優(yōu)化與搜索引擎營銷
- 搜索引擎
- 搜索引擎及搜索引擎優(yōu)化(seo)實驗
- 基于Agent的元搜索引擎結果優(yōu)化研究.pdf
- 搜索引擎精簡摘要緩存方法研究.pdf
- 基于網頁自動分類的搜索引擎研究.pdf
- 搜索引擎07011
- 全文搜索引擎
- 搜索引擎18307
- 搜索引擎06826
- 搜索引擎概述
- 搜索引擎1
- 搜索引擎分類
評論
0/150
提交評論