2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩59頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、近年來隨著垂直搜索引擎的出現(xiàn)和發(fā)展,一定程度上克服了傳統(tǒng)搜索引擎的弱點。然而現(xiàn)在的垂直搜索引擎基本上還是基于單一關(guān)鍵字查詢的方式,無法克 服關(guān)鍵字查詢方式帶來的準確率和召回率低的問題。在農(nóng)業(yè)領(lǐng)域里,垂直搜索引擎也存在同樣的問題,在國家重大科技支撐項目子課題“基于本體的農(nóng)業(yè)搜索引擎”(2006BAD10A0502)的支持下,本文針對農(nóng)業(yè)搜索引擎構(gòu)建了用戶個性化平臺。首先研究了個性化平臺的重要基礎(chǔ)之一,農(nóng)業(yè)信息的的地理屬性的添加,這

2、是為實現(xiàn)個性化平臺在構(gòu)建索引文檔時做的基礎(chǔ)工作。文中的設(shè)計主要對農(nóng)產(chǎn)品市場名稱進行地理定位,采用了基于地理信息庫索引的市場名地理定位、基于搜索引擎搜索結(jié)果項的市場名地理定位、基于搜索引擎搜索結(jié)果數(shù)量的市場名地理定位三種方法逐步提高對市場名稱的地理定位能力。然后本文研究了用戶搜索個性化平臺的構(gòu)建方法,從服務(wù)器日志中挖掘用戶興趣信息,并基于本體對用戶興趣詞匯進行語義擴展,形成用戶興趣模型,當用戶檢索相關(guān)信息時,應(yīng)用用戶興趣模型對用戶提交的關(guān)

3、鍵詞進行擴展,然后將擴展后的關(guān)鍵詞提交給檢索系統(tǒng),按照相似度排序輸出結(jié)果,這是在信息檢索時所采取的步驟,從而實現(xiàn)個性化服務(wù)平臺。 本文首先介紹了關(guān)于搜索引擎和本體論方面的一些基本知識,接著分析了網(wǎng)絡(luò)上抓取的農(nóng)產(chǎn)品市場名稱的一些特征,根據(jù)市場名稱特點構(gòu)建了帶有別名識別的多級地理信息庫,然后基于構(gòu)建的地理信息庫索引對市場名進行地理定位;下一步分析了在互聯(lián)網(wǎng)上市場名稱和它所在的地名一起出現(xiàn)在搜索結(jié)果的同一網(wǎng)頁中的可能性關(guān)系后,研究了一

4、種基于搜索引擎搜索結(jié)果的市場名地理定位的方法;在上述方法無法定位時,基于皮爾遜卡方來評價市場名稱和地名同時出現(xiàn)在一個網(wǎng)頁上的關(guān)系,從而產(chǎn)生了基于搜索引擎搜索結(jié)果數(shù)量的市場名地理定位的方法。然后本文研究了用戶興趣庫的的構(gòu)建和更新方法,首先通過用戶注冊信息構(gòu)建初始興趣詞庫,然后通過挖掘服務(wù)器日志和計算興趣詞的響應(yīng)系數(shù),來維護和更新用戶興趣庫;接著研究了根據(jù)用戶訪問文檔的具體信息計算關(guān)鍵詞用戶興趣度的方法;進一步系統(tǒng)通過將用戶興趣庫中的詞基于

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論