基于用戶訪問意圖的網(wǎng)頁動(dòng)態(tài)建模技術(shù)的研究.pdf_第1頁
已閱讀1頁,還剩75頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、當(dāng)一個(gè)用戶向搜索引擎提交一個(gè)查詢時(shí),其搜索意圖可以分為以下三類:(1)尋找某一個(gè)站點(diǎn)-導(dǎo)航查詢(Navigational Query);(2)尋找Web站點(diǎn)上的某種以靜態(tài)形式存在的信息-信息查詢(Informational Query);(3)尋找某類站點(diǎn),這類站點(diǎn)能夠提供下載或進(jìn)一步的在線操作-資源查詢(Resource Query)。目前雖然很多搜索引擎提供了一些交互功能來設(shè)法獲得用戶的搜索意圖,但用戶仍然很難準(zhǔn)確地表達(dá)他們的搜索意

2、圖。況且,獲取用戶意圖并非搜索引擎的目的,其真正的目的應(yīng)該是根據(jù)用戶意圖提供相應(yīng)的檢索結(jié)果。而目前的搜索引擎返回的結(jié)果大多包括用戶想要的和不想要的信息,特別是,用戶想要的結(jié)果很多不能被排到返回的前幾頁。
   本文通過歸納用戶的搜索意圖以及每種搜索意圖需求的信息類型,進(jìn)一步提出三種搜索意圖之間的搜索關(guān)系:信息型查詢是導(dǎo)航型和資源型查詢的開始,或者說導(dǎo)航型和資源型查詢是信息型查詢的目的。根據(jù)這種關(guān)系,提出基于意圖的Web網(wǎng)頁動(dòng)態(tài)建

3、模的思想?;谠撍枷?,設(shè)計(jì)并實(shí)現(xiàn)了一種簡(jiǎn)單易行的網(wǎng)頁聚類算法,分別以關(guān)鍵字包含、格式包含、類型包含為相似性度量,從而實(shí)現(xiàn)了根據(jù)上述三種意圖對(duì)搜索引擎返回的網(wǎng)頁聚類的過程,以便為不同的訪問意圖返回不同的聚類結(jié)果。
   與其它相關(guān)工作對(duì)比,本文的工作重點(diǎn)并非獲取用戶意圖,也非對(duì)用戶意圖進(jìn)行分類,而是基于目前用戶意圖的三種分類對(duì)搜索引擎返回的網(wǎng)頁建模,模型能夠?yàn)椴煌L問意圖的用戶提供所需信息的選擇。本文的方法不僅能夠基于用戶搜索意圖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論