版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、組合分類器學(xué)習(xí)是機(jī)器學(xué)習(xí)、模式識(shí)別和數(shù)據(jù)挖掘中非?;钴S的研究領(lǐng)域。已有的研究表明,給定相同的訓(xùn)練信息,組合分類器往往表現(xiàn)出比單個(gè)分類器更好的泛化能力。然而,大部分組合分類器學(xué)習(xí)方法都存在共同的問題:傾向于構(gòu)建大量基分類器模型。大量基分類器不僅需要大量存儲(chǔ)空間而且增加了組合分類器預(yù)測(cè)響應(yīng)時(shí)間。另外,在組合分類器中,某些基分類器不僅無助于提高組合分類器的泛化能力,而且還可能降低組合分類器的分類準(zhǔn)確率。組合分類器剪枝是處理該問題的一種有效方法
2、,受到了廣泛關(guān)注。
組合分類器剪枝有兩種方法:一種方法是從給定的基分類器中選擇一個(gè)最優(yōu)或次最優(yōu)的子集,構(gòu)建組合分類器;另一種方法是從組合分類器整體考慮,直接對(duì)每個(gè)基分類器剪枝。關(guān)于基分類器的選擇,已經(jīng)提出了一些算法,但仍然需要進(jìn)一步研究,而第二種方法則很少有人涉及。由于兩種方法都面臨搜索指數(shù)級(jí)空間問題,因此窮舉搜索是計(jì)算不可行的。解決這些問題的關(guān)鍵是(1)構(gòu)建好的度量指標(biāo),評(píng)估基分類器選擇和基分類器剪枝,指導(dǎo)搜索過程;(2
3、)尋找合適的選擇和剪枝方法。本文針對(duì)以上問題,研究組合分類器的剪枝,并進(jìn)一步把剪枝的思想融入基于決策樹的組合分類器的構(gòu)建中,直接構(gòu)建更有效的組合分類器。本文主要貢獻(xiàn)和創(chuàng)新點(diǎn)如下:
1)提出了基于邊界的組合分類器剪枝方法。根據(jù)邊界理論,構(gòu)造了一種基于邊界的度量指標(biāo)(MBM,Margin-basedMeasure)用于評(píng)估基分類器相對(duì)于組合分類器的重要性。根據(jù)MBM,設(shè)計(jì)了一種基于邊界的貪心組合分類器剪枝算法(MBMEP,MB
4、M-basedEnsemblePruning),以降低組合分類器規(guī)模并提高它的分類準(zhǔn)確率。實(shí)驗(yàn)結(jié)果表明:即使直接使用訓(xùn)練實(shí)例集作為剪枝集,MBMEP也能顯著地降低組合分類器的規(guī)模并提高它的分類準(zhǔn)確率;與已有的組合分類器剪枝方法相比,MBMEP在大部分?jǐn)?shù)據(jù)集上都具有更好的泛化性能。
2)提出了基于置換策略的組合分類器剪枝方法(EPR,EnsemblePruningviabase-classifierReplacement)。
5、與傳統(tǒng)組合分類器剪枝方法不同,EPR初始化子組合分類器S為預(yù)定義大小,然后迭代地通過用較好的基分類器置換S中最差的基分類器,直到置換不能進(jìn)行。為了確定是否應(yīng)該進(jìn)行置換,本文提出一種基于差異性的度量指標(biāo),用于度量基分類器對(duì)組合分類器的貢獻(xiàn)。實(shí)驗(yàn)結(jié)果表明,EPR能夠有效地降低組合分類器規(guī)模并提高它的泛化能力。
3)提出了一種基于貢獻(xiàn)增益的森林剪枝方法FTCG(ForestTrimmingbasedonContributionG
6、ain)?;跊Q策樹的組合分類器可以被視為一個(gè)森林。與對(duì)每棵決策樹分別進(jìn)行剪枝的傳統(tǒng)剪枝方法不同,森林剪枝把所有的決策樹看作一個(gè)整體,更加關(guān)注剪掉決策樹的分枝對(duì)組合分類器性能的影響。為了確定森林的哪些分枝可以被剪枝,本文提出一種稱作貢獻(xiàn)增益的度量,評(píng)估剪掉決策樹的一棵子樹對(duì)組合分類器性能的影響。實(shí)驗(yàn)結(jié)果表明,無論森林是基于某種森林學(xué)習(xí)方法構(gòu)建的還是某種傳統(tǒng)組合分類器剪枝算法的結(jié)果,無論每棵決策樹是剪枝過的還是未剪枝的,F(xiàn)TCG都能進(jìn)一步
7、降低每棵決策樹的規(guī)模,并且在大部分?jǐn)?shù)據(jù)集上顯著地提高了的森林的分類準(zhǔn)確率。
4)提出了一種新的基于決策樹的組合分類器學(xué)習(xí)方法FL(Forest Learning)。與bagging和adaboost等傳統(tǒng)的組合分類器學(xué)習(xí)算法不同,F(xiàn)L不采用抽樣或加權(quán)抽樣,而是直接在訓(xùn)練集上學(xué)習(xí)一個(gè)森林,作為組合分類器。首先,使用傳統(tǒng)的方法構(gòu)建森林的第一棵;然后,逐一構(gòu)建新的決策樹添加到森林中。在構(gòu)建新的決策樹時(shí),結(jié)點(diǎn)的每次劃分都考慮對(duì)組合
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向類分布不平衡數(shù)據(jù)的組合分類器剪枝方法的研究.pdf
- 關(guān)于組合分類器修剪方法的研究.pdf
- 多分類器組合中的基分類器選取方法.pdf
- 遙感圖像多分類器組合方法研究.pdf
- 基于多分類器組合的網(wǎng)絡(luò)入侵檢測(cè)方法研究.pdf
- 決策樹分類及剪枝算法研究.pdf
- 基于組合多分類器的變壓器故障診斷方法研究.pdf
- 基于多分類器組合的濕地信息提取方法研究.pdf
- 多分類器組合及其遙感分類研究.pdf
- 基于組合分類器的數(shù)值型不確定性數(shù)據(jù)分類方法研究.pdf
- 剪枝和網(wǎng)格采樣相結(jié)合的非平衡數(shù)據(jù)集分類方法.pdf
- 適應(yīng)性組合分類器遙感分類研究.pdf
- 基于規(guī)則的組合分類器的研究.pdf
- 剪枝和網(wǎng)格采樣相結(jié)合的非平衡數(shù)據(jù)集分類方法
- 多分類器系統(tǒng)中的組合方法及差異性度量研究.pdf
- 基于決策樹的組合分類器的研究.pdf
- 基于鏈接分析的web組合分類器研究.pdf
- 超市商品組合和分類的方法
- 搜索方法中的剪枝優(yōu)化
- 分類器設(shè)計(jì)及組合技術(shù)研究.pdf
評(píng)論
0/150
提交評(píng)論