2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩56頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著Internet的發(fā)展與普及,企業(yè)的運營日益擴展到Internet上,Internet已經(jīng)成為世界上包含信息量最大、涵蓋知識面最廣的信息知識庫,是全球信息傳播的主要渠道,為人們提供了最有價值的信息源。Internet的迅速發(fā)展讓Web信息更具多樣性,人們在Internet這個廣闊的選擇空間中獲得有用知識信息的同時也面臨著巨大的挑戰(zhàn)。傳統(tǒng)搜索引擎存在檢索結(jié)果信息冗余、不精準和碎片化的問題,用戶不得不承受沉重的信息加工負擔。信息融合技術(shù)

2、已經(jīng)廣泛用于軍事、經(jīng)濟和生物醫(yī)學等領(lǐng)域,其在改善信息置信度、降低信息冗余度方面的能力為Web信息處理提供了新途徑,已有的信息融合技術(shù)在處理結(jié)構(gòu)化數(shù)據(jù)方面具有很好的發(fā)展前景,但是并不適用于具有非結(jié)構(gòu)化、大容量并且動態(tài)變化的Web信息。基于以上問題,本文從“構(gòu)造-集成”和“事件-索引”兩個認知角度處理非結(jié)構(gòu)化的Web信息,研究Web信息多粒度融合方法。借鑒現(xiàn)有的粒計算理論和Web信息融合理論,采用Web信息抽取技術(shù)抽取Web信息作為知識源,

3、采用Web挖掘技術(shù)對Web信息進行深層挖掘,對Web信息進行提取及分析,將大量的、不確定的、非結(jié)構(gòu)化Web信息轉(zhuǎn)換為量化的、結(jié)構(gòu)化的文本信息,研究Web信息多粒度融合模型和Web信息多粒度融合算法,主要的工作如下:
   (1)采用Web信息抽取技術(shù)抽取Web信息中包含的標題、正文、發(fā)布時間、信息來源等信息作為知識源,針對文本信息非結(jié)構(gòu)化的特征,采用Web內(nèi)容挖掘技術(shù)對Web信息進行內(nèi)容上的深層挖掘,對文本信息進行量化表達;采用

4、Web結(jié)構(gòu)挖掘技術(shù)挖掘文本信息中的結(jié)構(gòu)信息,設(shè)計包括概念、內(nèi)容屬性和鏈接結(jié)構(gòu)屬性的Web信息表示模型。
   (2)研究能反映知識的粒度性的構(gòu)造-集成認知模型,結(jié)合模糊商空間理論從“構(gòu)造-集成”認知角度設(shè)計Web信息粒度空間模型;研究能反映知識的關(guān)聯(lián)性的事件-索引認知模型,針對Web信息的特征從“事件-索引”認知角度設(shè)計Web信息粒度關(guān)聯(lián)模型;
   (3)研究文本特征權(quán)重計算方法,針對Web信息動態(tài)更新的特征,研究主題

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論