可適應(yīng)不良數(shù)據(jù)的數(shù)據(jù)分類(lèi)若干方法研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩118頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、在對(duì)數(shù)據(jù)進(jìn)行分類(lèi)時(shí),數(shù)據(jù)本身所具有的某些不良特點(diǎn),如噪聲影響、簇間密度變差顯著、類(lèi)間不平衡和特征維方差各不相同等問(wèn)題都會(huì)影響分類(lèi)效果。因此,研究適應(yīng)不良數(shù)據(jù)特點(diǎn)的分類(lèi)算法,具有重要的理論和應(yīng)用價(jià)值。目前,雖然有DBSCAN,Trimmed k-means等算法也能處理一些不良特點(diǎn)的數(shù)據(jù),但是渴求一種通用的處理所有不良類(lèi)型數(shù)據(jù)的分類(lèi)算法是不現(xiàn)實(shí)的,根據(jù)數(shù)據(jù)的特點(diǎn)研究一些有針對(duì)性的抗干擾算法逐漸形成一種共識(shí)。
  本文受分子動(dòng)力學(xué)原理

2、的啟發(fā),在數(shù)據(jù)點(diǎn)之間引入引力和斥力的相互作用機(jī)制,并結(jié)合數(shù)據(jù)點(diǎn)在原始特征空間和迭代空間的距離、簇密度差和近鄰性等信息,提出了仿分子動(dòng)力學(xué)數(shù)據(jù)聚類(lèi)法;同樣考慮近鄰性和特征維方差等因素提出了橢球-平面分類(lèi)法,并改進(jìn)了基于核密度估計(jì)的數(shù)據(jù)分類(lèi)算法。新的聚類(lèi)方法除是對(duì)帶噪聲、簇間密度變差明顯的數(shù)據(jù)具有好的適應(yīng)力外,不需要預(yù)先設(shè)置簇個(gè)數(shù),可自動(dòng)發(fā)現(xiàn)數(shù)據(jù)中可能包含的簇,并解決了引力模型中的黑洞問(wèn)題。
  基于核密度估計(jì)的數(shù)據(jù)分類(lèi)法是實(shí)際應(yīng)用中

3、的常見(jiàn)分類(lèi)法,它在處理不平衡類(lèi)時(shí)可能出現(xiàn)諸如少數(shù)類(lèi)的數(shù)據(jù)點(diǎn)錯(cuò)分到多數(shù)類(lèi)的問(wèn)題。為了使該方法可處理不平衡類(lèi)帶來(lái)的影響,并在不平衡類(lèi)問(wèn)題嚴(yán)重時(shí)也能發(fā)揮好的效果,本文對(duì)其進(jìn)行了改進(jìn),在基于核密度估計(jì)的數(shù)據(jù)分類(lèi)法中引入具有較小搜索區(qū)間的平滑因子,增強(qiáng)了其對(duì)不平衡類(lèi)的適應(yīng)力。實(shí)驗(yàn)表明這種改進(jìn)是有效的,它提高了原方法對(duì)不平衡類(lèi)的適應(yīng)力。
  事實(shí)上,像基于核密度估計(jì)一類(lèi)的分類(lèi)方法在預(yù)測(cè)階段由于可能涉及整個(gè)樣本集的計(jì)算,當(dāng)數(shù)據(jù)集規(guī)模較大時(shí)其預(yù)測(cè)

4、開(kāi)銷(xiāo)可能會(huì)很大。為了達(dá)到減小預(yù)測(cè)開(kāi)銷(xiāo),同時(shí)又使模型兼?zhèn)浒瑪?shù)據(jù)在特征維上方差信息的特點(diǎn),本文提出了一種新的橢球-平面分類(lèi)法,它是一個(gè)兩階段的監(jiān)督型分類(lèi)方法。該方法利用橢球面和平面分類(lèi)參考面進(jìn)行分類(lèi),由于分類(lèi)時(shí)待測(cè)點(diǎn)只需與相應(yīng)的參考面進(jìn)行計(jì)算,使其時(shí)間開(kāi)銷(xiāo)小于基于距離的 k最近鄰點(diǎn)方法和基于核密度估計(jì)一類(lèi)的方法,并且強(qiáng)化了鄰近性原則。
  以上算法除理論分析外,基于標(biāo)準(zhǔn)數(shù)據(jù)集都與其他現(xiàn)有方法進(jìn)行了對(duì)比試驗(yàn),確認(rèn)了理論推導(dǎo)的正確性,為

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論