2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩187頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、為了充分利用并行分布式計(jì)算資源解決大規(guī)?,F(xiàn)實(shí)世界問題,并行處理技術(shù)和模塊化結(jié)構(gòu)已經(jīng)被廣泛地引入了模式識別領(lǐng)域中的分類器設(shè)計(jì)。本文研究了一種基于訓(xùn)練集劃分的問題分解方法和分類器組合過程,即最小最大模塊化(M3)分類器。 我們試圖回答這樣兩個(gè)問題,一個(gè)是如何進(jìn)行有效的問題分解和分類結(jié)果組合,另一個(gè)是如何獲得更好的分類效果。為此我們研究了兩個(gè)相關(guān)的過程,一個(gè)是多類問題到二類問題的分解和對應(yīng)的組合過程。一個(gè)是將二類問題進(jìn)一步分解為更小規(guī)

2、模的二類問題。本文的主要貢獻(xiàn)在以下幾個(gè)方面。 首次將模塊化過程引入k-NN算法,提出了M3-k-NN算法,拓寬了分類器組合算法的應(yīng)用領(lǐng)域。大規(guī)模文本分類的實(shí)驗(yàn)結(jié)果表明了這種處理的有效性。 對于二類問題的M3分解算法,針對測試過程,我們提出了一種對稱選擇算法,能夠?qū)y試中所調(diào)用的二類分類器的數(shù)量從二次復(fù)雜度降到線性復(fù)雜度。從而大大改善了分類器的測試性能。 對于二類問題分解中的訓(xùn)練集劃分,我們提出了四種簡單的劃分策超

3、平面切割、K均值算法、逆向K均值和擴(kuò)散抽取過程。實(shí)驗(yàn)表明,我們提出的劃分策略都可以在一定程度上保證劃分模塊增多時(shí)分類精度的穩(wěn)定性。 對于分解的二類問題,在使用一種簡化的對稱選擇算法的基礎(chǔ)上,我們提出了一種自重組學(xué)習(xí)算法,能夠在并行或者模塊化處理模式下同步完成訓(xùn)練集較為優(yōu)化的劃分和訓(xùn)練過程。該方法的任務(wù)分解策略繼承了傳統(tǒng)的最小最大模塊化分解的彈性,易于實(shí)現(xiàn)靈活分解和平衡化的學(xué)習(xí)。同時(shí)也能有效改善劃分效果,穩(wěn)步提升分類性能。

4、 對于多類問題,我們考察了“一對一”多類問題分解模式下的分類器組合,提出了一種一般意義下的組合策略,并證明,傳統(tǒng)的M3和最多類獲勝(循環(huán)賽規(guī)則學(xué)習(xí),R3)組合為這種一般過程的兩個(gè)極端情形。針對這種一般化過程,我們提出了一種一致的模塊選擇算法,能夠顯著提高測試效率。此外,針對M3多類組合的測試,我們提出了三種模塊選擇算法,并證明,這些選擇算法能夠?qū)y試效率由原來的二次復(fù)雜度,降低到線性復(fù)雜度。此外,我們證明,簡化的二叉樹選擇算法和DAG組

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論