版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、西南農(nóng)業(yè)大學(xué)碩士學(xué)位論文基于信息論的特征選擇和分類算法研究姓名:張隆申請學(xué)位級別:碩士專業(yè):農(nóng)業(yè)機械化工程指導(dǎo)教師:余建橋20050501析和判定冗余特征必然會使特征選擇算法的效率降低,因而這種方法是不適合商維度的特征選擇的在馬爾可夫毯過濾法中,我們通過抽取該方法的基本特性,分析該方法的主要組成部分并結(jié)合關(guān)聯(lián)量度RMI,推論并構(gòu)造了一個近似的馬爾可夫毯過濾法,并以此方法在相關(guān)特征集中進(jìn)行冗余特征分析。在近似的馬爾可夫毯過濾法中,特征與類
2、別之聞的關(guān)聯(lián)稱為c關(guān)聯(lián),兩個特征之問的關(guān)聯(lián)稱為F關(guān)聯(lián),沒有任何的近似的馬爾可夫毯的特征稱為優(yōu)越的特征。近似的馬爾可夫毯的基本工作原理是:如果特征x的c關(guān)聯(lián)大于特征Y的c一關(guān)聯(lián)且特征之間的F關(guān)聯(lián)大于特征Y的c關(guān)聯(lián),則特征Y是冗余的。由近似的馬爾可夫毯的基本工作原理可知其基本性質(zhì):具有晟大c關(guān)聯(lián)值的特征不存在近似的馬爾可夫毯,該特征是優(yōu)越的特征。利用該性質(zhì),在對相關(guān)特征的C。關(guān)聯(lián)值進(jìn)行排序后,可以從具有最大C關(guān)聯(lián)值的特征開始,逐步消除所有的
3、冗余特征,而保留優(yōu)越的特征,最后形成的特征集由所有優(yōu)越的特征組成。利用近似的馬爾可夫毯過濾法進(jìn)行相關(guān)性和冗余性分析,就是通過選擇所有的優(yōu)越特征并且除去剩余特征的方法。它使用c關(guān)聯(lián)和F關(guān)聯(lián)來確定特征冗余,而且結(jié)合前向序列選擇和除去冗余特征因此,它不但圍繞所有的特征對進(jìn)行F關(guān)聯(lián)分析。而且比純粹的前向序列選擇或后向消除法取得更高的效率。本文第5章提出了一個建立在相關(guān)特征集上的數(shù)據(jù)分類方法——MⅡN算法。該算法以信息論量度為基本工具通過條件互信
4、息評估各個相關(guān)特征在分類過程中的等級次序,產(chǎn)生簡潔的分類規(guī)則,并評估分類規(guī)則在分類過程中的重要程度?;バ畔⒕W(wǎng)絡(luò)(~lutual—InformationNetwork(MIN))是一種信息論方法,在拓樸結(jié)構(gòu)上類似于神經(jīng)網(wǎng)絡(luò),在預(yù)測方式上類似于決策樹。建立互信息網(wǎng)絡(luò)的原理是:在一個已知結(jié)點的條件下,如果一個特征與類別特征之間的條件互信息值最大,則該特征是此結(jié)點下最重要的特征,并由此分裂產(chǎn)生新的結(jié)點。在互信息網(wǎng)絡(luò)構(gòu)建過程中,對于任何給定的結(jié)點
5、Z,找出不屬于結(jié)點z分支的所有特征,并計算這些特征與類別之問的條件互信息取得使條件互信息值最大的特征,則該特征是在結(jié)點z的條件下對分類最重要的特征,將該特征按其特征值進(jìn)行結(jié)點分裂。如果沒有特征使得條件互信息顯著增加,則該結(jié)點為最終結(jié)點,將該結(jié)點與類別結(jié)點進(jìn)行連接,并計算結(jié)點與類別結(jié)點之間的權(quán)重,形成一條分類規(guī)則。通過條件互信息建立的互信息網(wǎng)絡(luò)分類模型具有如下優(yōu)點:在分類預(yù)測準(zhǔn)確率上比其它分類學(xué)習(xí)算法有所提高;由它產(chǎn)生的規(guī)則形式簡單;模型
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于信息論的特征選擇算法研究.pdf
- 特征選擇的信息論算法研究.pdf
- 基于稀疏和信息論的無監(jiān)督特征學(xué)習(xí)算法研究.pdf
- 基于信息論的文本分類模型與算法研究.pdf
- 基于信息論的特征加權(quán)和主題驅(qū)動協(xié)同聚類算法研究.pdf
- 基于信息論的數(shù)據(jù)挖掘算法.pdf
- 基于信息論的圖像分割算法研究.pdf
- 基于信息論準(zhǔn)則的變量選擇問題.pdf
- 基于特征選擇和特征加權(quán)算法的文本分類研究.pdf
- 基于信息論的加權(quán)Laplacian分類器設(shè)計.pdf
- 基于樣本和特征結(jié)構(gòu)信息的特征選擇算法研究.pdf
- 基于互信息特征選擇算法的文本自動分類研究.pdf
- 基于信息論的基因調(diào)控網(wǎng)絡(luò)構(gòu)建算法研究.pdf
- 文本分類中特征選擇和分類算法的研究.pdf
- 基于信息論的傳感器管理算法研究.pdf
- 基于搜索優(yōu)化的特征選擇和分類規(guī)則獲取算法研究.pdf
- 基于擴展網(wǎng)頁和公平特征選擇的網(wǎng)頁分類算法研究.pdf
- 基于特征選擇的多標(biāo)簽分類算法研究.pdf
- 基于信息理論的特征選擇算法研究.pdf
- 基于VSM模型和特征選擇算法的中文文本自動分類研究.pdf
評論
0/150
提交評論