2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩85頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、聚類分析是研究數(shù)據(jù)聚簇模式的技術(shù).由于它始終是數(shù)據(jù)挖掘研究的重要內(nèi)容、手段和工具,因此,聚類分析又是一個被不斷探索并充滿創(chuàng)新的研究主題.離群點檢測是研究包含在數(shù)據(jù)中的少數(shù)異常而新穎的數(shù)據(jù)分布模式的技術(shù).隨著數(shù)據(jù)挖掘研究的不斷深入并拓展到風(fēng)險檢測等眾多特殊應(yīng)用領(lǐng)域,面向這一新興課題的研究方興未艾.近年來,網(wǎng)絡(luò)和數(shù)據(jù)庫技術(shù)高速發(fā)展,由此引發(fā)的數(shù)據(jù)爆炸使面向大規(guī)模海量數(shù)據(jù)集的數(shù)據(jù)挖掘研究成為關(guān)鍵.探索并構(gòu)造具有高性能、高效率的新算法是解決大規(guī)

2、模數(shù)據(jù)挖掘問題的有效途徑,也是本文開展聚類分析和離群點檢測問題研究的著眼點和出發(fā)點.本文將數(shù)據(jù)空間網(wǎng)格劃分技術(shù)與數(shù)據(jù)集密度函數(shù)構(gòu)造技術(shù)緊密結(jié)合在一起,形成了基于網(wǎng)格上近似密度函數(shù)模型的算法構(gòu)造思想.數(shù)據(jù)空間網(wǎng)格劃分技術(shù)不僅被有效地運用于數(shù)據(jù)組織,使其發(fā)揮數(shù)據(jù)存儲和索引上的高效率,而且被運用于分箱核密度估計,成為簡化密度函數(shù)計算中的有效機制.在密度函數(shù)構(gòu)造上,通過采用簡便高效的分箱核估計避免傳統(tǒng)核密度估計方法的繁復(fù)計算.為了提高分箱核估計

3、的計算精度,本文提出了基于網(wǎng)格數(shù)據(jù)重心的分箱核近似方法,從理論上證明了其在誤差階上的改進(jìn)結(jié)果的正確性.進(jìn)一步地,本文就常用的高斯核估計提出并論證了用于進(jìn)一步提高近似核估計精度的帶修正的近似核函數(shù)計算方法.這種方法在不改變分箱近似核估計計算復(fù)雜度的同時,可以十分精確地逼近傳統(tǒng)的核密度函數(shù).將上述基于網(wǎng)格上近似密度函數(shù)計算的思想運用于聚類分析和離群點檢測算法構(gòu)造,提出了用于改進(jìn)DENCLUE算法的DENCLUE-M聚類算法和離群點檢測算法G

4、ridOF,GROFC.其中,DENCLUE-M算法和GridOF算法深入揭示了聚類分析與離群點檢測之間的內(nèi)在聯(lián)系,GROFC算法則從離群數(shù)據(jù)與聚類數(shù)據(jù)在個別屬性上的差異性的角度,在Chebyshev距離意義下討論了離群點檢測問題.所構(gòu)造的幾類算法均源自于嚴(yán)格的數(shù)學(xué)理論,具有相對于原始數(shù)據(jù)集線性的時間復(fù)雜度和優(yōu)良的空間效率,能夠在有限的內(nèi)存空間中處理任意規(guī)模的數(shù)據(jù)集并支持增量聚類,且對數(shù)據(jù)維數(shù)具有良好的適應(yīng)性.此外,DENCLUE-M聚

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論