2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩72頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、傳統(tǒng)的聚類分析主要是基于歐幾里得空間作為特征空間來進行。其中基于劃分的聚類算法(例如Crisp clustering和Fuzzy clustering)能夠處理線性可分的數(shù)據(jù),但對于線性不可分的數(shù)據(jù)分類效果較差。針對這類問題,核函數(shù)將其映射到高維的特征空間中,在這一空間中數(shù)據(jù)樣本變得線性可分?;诤说木垲惙治鲆恢笔菄鴥?nèi)外研究的熱點,它在圖像處理、文本聚類、嫌疑犯排查、客戶細分等領(lǐng)域得到了廣泛運用,有很好的應(yīng)用價值。
  本文系統(tǒng)介

2、紹了基于劃分的聚類分析中的幾個經(jīng)典算法,關(guān)鍵介紹了迭代公式的計算、核函數(shù)、隸屬度矩陣。并使用UCI數(shù)據(jù)庫中的數(shù)據(jù)進行實驗仿真比較它們的聚類效果。結(jié)果顯示基于核函數(shù)的算法較其它算法有更好的聚類效果,模糊聚類比硬聚類有更好的聚類效果。進而提出了新的基于DCA算法和核模糊k均值聚類(Kernel Fuzzy k-means,KFCM)的算法:DCA-KFCM和DCA-KFCM2算法,這兩種算法的是比較新穎的聚類方法。
  但隨著社會的發(fā)

3、展,現(xiàn)實生活中的數(shù)據(jù)呈現(xiàn)出由少到多,由簡單到復雜,由低維到高維的趨勢。造成核矩陣的計算時間的加長和存儲空間的不足。本文針對這一不足提出了近似KFCM算法,該算法過程中不需要計算整個核矩陣,而是僅僅計算核矩陣的對角線元素和被選出的數(shù)據(jù)樣本所對應(yīng)的行,大大降低了計算復雜度。實驗證明,近似KFCM算法能夠有效處理大數(shù)據(jù)樣本。
  為了驗證近似KFCM的效果,本文將其應(yīng)用到分治SVM中,稱為近似分治SVM算法。近似分治SVM比起現(xiàn)有的算法

4、有更快地收斂速度,而且在更少的時間內(nèi)獲得比其它算法更精確的解。近似分治SVM首先將整個問題分成若干可以被獨立解決的子問題。在理論上可以證明近似KFCM算法可以使得子問題與全局問題間差異最小化,且由子問題所確定的支持向量與全局問題的支持向量相似。然而,在整個數(shù)據(jù)集上運行近似KFCM問題有些耗時,運用兩步近似KFCM方法找到有效劃分。在“治”這一步中,子問題的解可以“拼”成全局問題的初始解,在后面的分析中可以得出,其能快速地收斂到全局最優(yōu)解

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論