版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、聚類分析作為一種無監(jiān)督學習方法,是機器學習領域重要研究方向之一。近年來,數(shù)據(jù)聚類正在蓬勃發(fā)展,聚類分析已成功應用于圖像處理,文本挖掘,生物信息學等諸多領域。
本文重點研究聚類分析中兩個關(guān)鍵問題:相似性度量和聚類算法的設計及應用。聚類的目的是發(fā)現(xiàn)相似對象的集合,因此如何度量對象間的相似性是聚類分析中的一個關(guān)鍵問題。本文基于現(xiàn)有的高斯型相似度計算模型,提出了新的相似度計算模型,并針對數(shù)據(jù)特征對相似度的影響進行了討論,將本質(zhì)維數(shù)作為
2、新的特征來改善相似性度量。在聚類算法設計及應用方面,針對不同的聚類問題,設計快速有效的聚類算法是十分必要的。本文分析了現(xiàn)有聚類算法的優(yōu)缺點,提出了一種快速的基于相似度矩陣的聚類算法,并將其應用到圖像分割中??紤]到現(xiàn)實中大多數(shù)圖像受到了噪聲干擾,為了降低噪聲對圖像分割和其他后續(xù)圖像分析帶來的影響,提出了一種基于稀疏表示的混合噪聲去噪算法。
本文的主要工作包括:
(1)提出一種加權(quán)的自適應高斯型相似性度量方法。傳統(tǒng)的高斯
3、型相似度適用于同密度簇的聚類問題,而且對于數(shù)據(jù)中的野值點不夠魯棒??紤]到實際數(shù)據(jù)中野值點和不同密度簇的存在,提出了一種新的魯棒的高斯型相似度計算方法?;谝延械淖赃m應高斯型相似度度量,新的相似度根據(jù)數(shù)據(jù)點的鄰域信息對每個數(shù)據(jù)點賦以權(quán)值,并通過降低野值點的權(quán)重來降低野值點與其他數(shù)據(jù)點的相似度。實驗表明新的相似性度量能更好地反映類內(nèi)和類間數(shù)據(jù)點的相似性關(guān)系,得到更加滿意的聚類結(jié)果。
(2)提出一種基于本質(zhì)維數(shù)的相似性度量。相似性度
4、量不僅依賴于相似度計算公式,還依賴于數(shù)據(jù)的特征。數(shù)據(jù)集中的每個類可以看作是一個子流形,通過定義反映流形拓撲結(jié)構(gòu)的數(shù)據(jù)特征來對各個子流形進行劃分。本質(zhì)維數(shù)可以用于區(qū)分不同的流形結(jié)構(gòu),位于同一流形的數(shù)據(jù)點的本質(zhì)維數(shù)應該保持一致,具有不同本質(zhì)維數(shù)的數(shù)據(jù)點通常也可以認為分布在不同的流形上。通過數(shù)據(jù)點的鄰域信息來估計數(shù)據(jù)點的本質(zhì)維數(shù),將本質(zhì)維數(shù)作為數(shù)據(jù)的新的特征,結(jié)合數(shù)據(jù)的原始特征來計算新的相似度。實驗表明,基于新的相似度的聚類結(jié)果要優(yōu)于單獨使用
5、本質(zhì)維數(shù)或者原始特征的相似度得到的聚類結(jié)果。
(3)對于具有復雜結(jié)構(gòu)的數(shù)據(jù)集,只通過無監(jiān)督的方法改變相似性度量很難達到滿意的聚類結(jié)果。半監(jiān)督聚類是利用有限的標簽數(shù)據(jù)對全部數(shù)據(jù)的聚類過程進行指導,從而可以得到更好的聚類結(jié)果。本文提出一種基于近鄰傳播算法的半監(jiān)督聚類算法。近鄰傳播算法是基于相似度矩陣的聚類算法,新算法根據(jù)約束對先驗信息調(diào)整相似度矩陣,進而改善聚類結(jié)果。實驗結(jié)果表明,通過加入少量先驗約束對信息,半監(jiān)督近鄰傳播算法較大
6、程度地改善了無監(jiān)督近鄰傳播算法的聚類結(jié)果。
(4)基于Wittgenstein的家族相似性,提出了一種基于相似度矩陣的聚類算法。已有的基于相似度矩陣的聚類算法要么時間復雜度較高,要么需要調(diào)節(jié)的參數(shù)較多。新算法通過相似度矩陣構(gòu)建鄰接矩陣,然后在鄰接矩陣中發(fā)現(xiàn)連通分支進而對數(shù)據(jù)進行劃分。與常用的基于相似度矩陣的譜聚類算法相比,新算法無需計算特征向量,大大降低了時間消耗。而且,在給定相似度矩陣的基礎上,新算法不需要設置任何參數(shù)。實驗
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 聚類分析及其在圖像分割中的應用.pdf
- 聚類分析在醫(yī)學圖像中的應用.pdf
- 聚類分析在圖像分類中的應用研究.pdf
- 聚類分析在圖像區(qū)域分割中的應用研究.pdf
- 云模型理論研究及其在彩色圖像聚類分析中的應用.pdf
- 聚類分析及其在文本挖掘中的應用.pdf
- 遺傳算法及其在聚類分析中的應用.pdf
- 圖論在聚類分析中的應用.pdf
- 基于beamlet的多尺度圖像分析及其在CT圖像處理中的應用.pdf
- VAGUE集理論及其在聚類分析中的應用.pdf
- 壓縮感知及其在圖像處理中的應用.pdf
- 聚類分析研究及其在文本挖掘中的應用.pdf
- 空間聚類分析及其在GIS中的應用研究.pdf
- 聚類分析及其在農(nóng)業(yè)物種信息自動提取中的應用.pdf
- 聚類分析及其在基因表達數(shù)據(jù)中的應用研究.pdf
- RANSAC算法及其在遙感圖像處理中的應用.pdf
- 輪廓波變換及其在圖像處理中的應用.pdf
- 蟻群算法的改進及其在聚類分析中的應用.pdf
- 幾何分析方法在圖像處理中的應用.pdf
- 小波分析在圖像處理中的應用.pdf
評論
0/150
提交評論