版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、在對(duì)數(shù)據(jù)進(jìn)行分類(lèi)時(shí),數(shù)據(jù)本身所具有的某些不良特點(diǎn),如噪聲影響、簇間密度變差顯著、類(lèi)間不平衡和特征維方差各不相同等問(wèn)題都會(huì)影響分類(lèi)效果。因此,研究適應(yīng)不良數(shù)據(jù)特點(diǎn)的分類(lèi)算法,具有重要的理論和應(yīng)用價(jià)值。目前,雖然有DBSCAN,Trimmed k-means等算法也能處理一些不良特點(diǎn)的數(shù)據(jù),但是渴求一種通用的處理所有不良類(lèi)型數(shù)據(jù)的分類(lèi)算法是不現(xiàn)實(shí)的,根據(jù)數(shù)據(jù)的特點(diǎn)研究一些有針對(duì)性的抗干擾算法逐漸形成一種共識(shí)。
本文受分子動(dòng)力學(xué)原理
2、的啟發(fā),在數(shù)據(jù)點(diǎn)之間引入引力和斥力的相互作用機(jī)制,并結(jié)合數(shù)據(jù)點(diǎn)在原始特征空間和迭代空間的距離、簇密度差和近鄰性等信息,提出了仿分子動(dòng)力學(xué)數(shù)據(jù)聚類(lèi)法;同樣考慮近鄰性和特征維方差等因素提出了橢球-平面分類(lèi)法,并改進(jìn)了基于核密度估計(jì)的數(shù)據(jù)分類(lèi)算法。新的聚類(lèi)方法除是對(duì)帶噪聲、簇間密度變差明顯的數(shù)據(jù)具有好的適應(yīng)力外,不需要預(yù)先設(shè)置簇個(gè)數(shù),可自動(dòng)發(fā)現(xiàn)數(shù)據(jù)中可能包含的簇,并解決了引力模型中的黑洞問(wèn)題。
基于核密度估計(jì)的數(shù)據(jù)分類(lèi)法是實(shí)際應(yīng)用中
3、的常見(jiàn)分類(lèi)法,它在處理不平衡類(lèi)時(shí)可能出現(xiàn)諸如少數(shù)類(lèi)的數(shù)據(jù)點(diǎn)錯(cuò)分到多數(shù)類(lèi)的問(wèn)題。為了使該方法可處理不平衡類(lèi)帶來(lái)的影響,并在不平衡類(lèi)問(wèn)題嚴(yán)重時(shí)也能發(fā)揮好的效果,本文對(duì)其進(jìn)行了改進(jìn),在基于核密度估計(jì)的數(shù)據(jù)分類(lèi)法中引入具有較小搜索區(qū)間的平滑因子,增強(qiáng)了其對(duì)不平衡類(lèi)的適應(yīng)力。實(shí)驗(yàn)表明這種改進(jìn)是有效的,它提高了原方法對(duì)不平衡類(lèi)的適應(yīng)力。
事實(shí)上,像基于核密度估計(jì)一類(lèi)的分類(lèi)方法在預(yù)測(cè)階段由于可能涉及整個(gè)樣本集的計(jì)算,當(dāng)數(shù)據(jù)集規(guī)模較大時(shí)其預(yù)測(cè)
4、開(kāi)銷(xiāo)可能會(huì)很大。為了達(dá)到減小預(yù)測(cè)開(kāi)銷(xiāo),同時(shí)又使模型兼?zhèn)浒瑪?shù)據(jù)在特征維上方差信息的特點(diǎn),本文提出了一種新的橢球-平面分類(lèi)法,它是一個(gè)兩階段的監(jiān)督型分類(lèi)方法。該方法利用橢球面和平面分類(lèi)參考面進(jìn)行分類(lèi),由于分類(lèi)時(shí)待測(cè)點(diǎn)只需與相應(yīng)的參考面進(jìn)行計(jì)算,使其時(shí)間開(kāi)銷(xiāo)小于基于距離的 k最近鄰點(diǎn)方法和基于核密度估計(jì)一類(lèi)的方法,并且強(qiáng)化了鄰近性原則。
以上算法除理論分析外,基于標(biāo)準(zhǔn)數(shù)據(jù)集都與其他現(xiàn)有方法進(jìn)行了對(duì)比試驗(yàn),確認(rèn)了理論推導(dǎo)的正確性,為
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 數(shù)據(jù)挖掘中若干方法的研究.pdf
- 數(shù)據(jù)挖掘分類(lèi)方法研究.pdf
- 不均衡數(shù)據(jù)分類(lèi)方法的研究.pdf
- 數(shù)據(jù)層資源適應(yīng)型若干優(yōu)化實(shí)現(xiàn)方法及應(yīng)用研究.pdf
- 若干圖像和語(yǔ)音數(shù)據(jù)分類(lèi)問(wèn)題研究.pdf
- 高維數(shù)據(jù)的若干分類(lèi)問(wèn)題及算法研究.pdf
- 分類(lèi)數(shù)據(jù)挖掘中若干基本問(wèn)題的研究.pdf
- 基因表達(dá)數(shù)據(jù)的若干挖掘方法研究.pdf
- 適應(yīng)概念漂移的數(shù)據(jù)流分類(lèi)算法研究.pdf
- 數(shù)據(jù)挖掘方法的若干應(yīng)用.pdf
- 矩陣數(shù)據(jù)的分類(lèi)預(yù)測(cè)方法
- 模式分類(lèi)中數(shù)據(jù)選擇方法的研究.pdf
- 基于Hyperion數(shù)據(jù)的地物分類(lèi)方法研究.pdf
- 數(shù)據(jù)流分類(lèi)中若干問(wèn)題的研究.pdf
- 基于分類(lèi)超曲面的數(shù)據(jù)分類(lèi)方法的研究.pdf
- 動(dòng)態(tài)數(shù)據(jù)流分類(lèi)方法研究.pdf
- 基因序列數(shù)據(jù)挖掘若干方法研究.pdf
- 數(shù)據(jù)挖掘中的高速可伸縮分類(lèi)算法.pdf
- 數(shù)據(jù)層資源適應(yīng)型若干優(yōu)化實(shí)現(xiàn)方法及應(yīng)用研究(1)
- 面向不完備數(shù)據(jù)的分類(lèi)方法研究.pdf
評(píng)論
0/150
提交評(píng)論