版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、隨著Internet的發(fā)展與普及,企業(yè)的運營日益擴展到Internet上,Internet已經(jīng)成為世界上包含信息量最大、涵蓋知識面最廣的信息知識庫,是全球信息傳播的主要渠道,為人們提供了最有價值的信息源。Internet的迅速發(fā)展讓Web信息更具多樣性,人們在Internet這個廣闊的選擇空間中獲得有用知識信息的同時也面臨著巨大的挑戰(zhàn)。傳統(tǒng)搜索引擎存在檢索結(jié)果信息冗余、不精準和碎片化的問題,用戶不得不承受沉重的信息加工負擔。信息融合技術(shù)
2、已經(jīng)廣泛用于軍事、經(jīng)濟和生物醫(yī)學等領(lǐng)域,其在改善信息置信度、降低信息冗余度方面的能力為Web信息處理提供了新途徑,已有的信息融合技術(shù)在處理結(jié)構(gòu)化數(shù)據(jù)方面具有很好的發(fā)展前景,但是并不適用于具有非結(jié)構(gòu)化、大容量并且動態(tài)變化的Web信息。基于以上問題,本文從“構(gòu)造-集成”和“事件-索引”兩個認知角度處理非結(jié)構(gòu)化的Web信息,研究Web信息多粒度融合方法。借鑒現(xiàn)有的粒計算理論和Web信息融合理論,采用Web信息抽取技術(shù)抽取Web信息作為知識源,
3、采用Web挖掘技術(shù)對Web信息進行深層挖掘,對Web信息進行提取及分析,將大量的、不確定的、非結(jié)構(gòu)化Web信息轉(zhuǎn)換為量化的、結(jié)構(gòu)化的文本信息,研究Web信息多粒度融合模型和Web信息多粒度融合算法,主要的工作如下:
(1)采用Web信息抽取技術(shù)抽取Web信息中包含的標題、正文、發(fā)布時間、信息來源等信息作為知識源,針對文本信息非結(jié)構(gòu)化的特征,采用Web內(nèi)容挖掘技術(shù)對Web信息進行內(nèi)容上的深層挖掘,對文本信息進行量化表達;采用
4、Web結(jié)構(gòu)挖掘技術(shù)挖掘文本信息中的結(jié)構(gòu)信息,設(shè)計包括概念、內(nèi)容屬性和鏈接結(jié)構(gòu)屬性的Web信息表示模型。
(2)研究能反映知識的粒度性的構(gòu)造-集成認知模型,結(jié)合模糊商空間理論從“構(gòu)造-集成”認知角度設(shè)計Web信息粒度空間模型;研究能反映知識的關(guān)聯(lián)性的事件-索引認知模型,針對Web信息的特征從“事件-索引”認知角度設(shè)計Web信息粒度關(guān)聯(lián)模型;
(3)研究文本特征權(quán)重計算方法,針對Web信息動態(tài)更新的特征,研究主題
最新文檔
- 不完備多源信息融合的粒計算方法研究.pdf
- 基于多特征信息融合的WEB廣告分類方法研究.pdf
- 基于粒計算的Web結(jié)構(gòu)模型的研究.pdf
- 基于信息粒與粒計算理論的數(shù)據(jù)約簡研究.pdf
- 基于粒計算的圖像檢索方法研究.pdf
- 基于粒計算的知識獲取方法研究.pdf
- 基于多特征信息融合的WEB廣告聚類方法研究.pdf
- 基于粒計算的數(shù)據(jù)粒化聚類方法研究.pdf
- 基于信息粒的情感計算模型研究.pdf
- 基于粒計算的粒表示及其度量方法和粒結(jié)構(gòu)分析研究.pdf
- 基于信息融合的Web信息可信度研究.pdf
- 基于Web Services的電力計算信息平臺構(gòu)建方法的研究.pdf
- 基于粒計算的決策模型與方法研究.pdf
- 基于軟計算和信息融合的故障診斷方法研究.pdf
- 基于信息粒的模糊聚類方法研究.pdf
- 基于粒計算的信息系統(tǒng)知識發(fā)現(xiàn)研究.pdf
- 基于Web的病毒信息抽取方法研究.pdf
- 基于粒計算的增量式知識獲取方法研究.pdf
- 基于粒計算的多尺度聚類方法.pdf
- 基于粒計算的上下文信息處理研究.pdf
評論
0/150
提交評論