2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩70頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著互聯(lián)網技術的飛速發(fā)展,網絡信息呈現(xiàn)出幾何倍增的趨勢。海量信息在給人們生活帶來便利的同時,也導致了一系列問題:如數據的檢索和查找變得更復雜;垃圾短信、不良信息的識別、過濾以及屏蔽變得更難實現(xiàn)等。信息過濾(Information Filtering,IF)技術在面對復雜的網絡環(huán)境中應運而生。通過對網頁中無關、不良信息的過濾,使用戶能更快速、準確的得到所需信息,從而提高信息搜索的效率和準確率。
  本文在提出純度基尼指數的基礎上,對

2、文本預處理算法進行研究,并提出了重構變異算子遺傳算法。結合純度基尼指數在文本信息預處理中的應用,將重構變異算子遺傳算法應用于文本信息過濾,提高了文本信息過濾中用戶類別模板的過濾精度。取得的主要成果有:
  1.提出了基于純度原理基尼指數的文本特征選擇方法
  文本信息預處理是文本信息過濾前期的準備工作,文本的特征選擇是信息預處理的關鍵,特征選擇的目的是選出最能代表文檔特征的特征詞作為特征空間維數。本文針對于傳統(tǒng)基尼指數在文本

3、信息預處理上的缺點進行了改進,并將其應用于文本的特征選擇中,降低了原始文本的空間維數、減小了時間復雜度,提高了分類器的分類精度。
  2.基于重構變異算子遺傳算法的提出并應用于文本信息過濾
  重構變異算子遺傳算法用來平衡交叉算子與變異算子的地位,進而優(yōu)化用戶模板。對四個類別進行過濾精度對比實驗,結果表明:基于重構變異算子遺傳算法能更好地應用于文本信息過濾。
  最后設計并實現(xiàn)了基于重構變異算子遺傳算法的互聯(lián)網文本信息

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論