知識服務平臺構建與段落搜索.pdf_第1頁
已閱讀1頁,還剩77頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、分散在互聯(lián)網上的信息資源極其豐富,但表現(xiàn)形式卻各不相同,如何全面準確地從中查找特定信息一直是網絡應用服務的重要研究內容。傳統(tǒng)的搜索引擎使用簡單的關鍵詞匹配查找信息,盡管在一定程度上能夠滿足用戶的需要,但是用戶的信息需求通常比較復雜,很難用關鍵詞清楚描述,有時還需要使用大粒度的文字進行檢索。在實際生活中,信息需求往往要經過分類、比較等多種手段才能明確,并進一步得到滿足。如何最大可能地滿足用戶的各項信息獲取要求,成為信息檢索領域最熱門的話題

2、之一。
  本文構建了知識服務平臺,并研究和實現(xiàn)了平臺中機器自動服務模塊的段落搜索引擎系統(tǒng)。課題的主要研究工作包括:
  1)提出了知識服務的概念。知識服務,不僅要進行信息服務、信息檢索,而且還要進行知識增值服務,提供信息交流、知識創(chuàng)新的場所,構建起網絡信息與知識轉換的平臺,為實現(xiàn)網民隨時隨地查找信息、學習知識、發(fā)表個人見解創(chuàng)造條件。
  2)根據(jù)以上概念構建了知識服務平臺。在平臺中利用自然語言處理技術對雜亂無序的網絡

3、信息進行搜集、分類、整理并加以組織,使之成為井然有序的知識體系。
  3)實現(xiàn)了知識服務平臺機器自動服務模塊中的段落搜索引擎系統(tǒng)。它將文檔庫中的文檔采用窗口固定長度分段,并使用TF/IDF值抽取出查詢段落中的關鍵詞組,按照權值大小排序后在文檔庫中檢索。在文檔分段時比較了兩種不同的方法:窗口重疊固定長度分段和窗口不重疊固定長度分段。在兩種分段方法的比對實驗中,窗口不重疊固定長度分段的搜索時間較少,準確率略低于窗口重疊固定長度分段。而

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論