2023年全國(guó)碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩92頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、聚類作為一種無監(jiān)督學(xué)習(xí)方法,一直是機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、模式識(shí)別等領(lǐng)域的一個(gè)重要、活躍的研究方向。Affinity Propagation(即AP)是一種新型的exemplar-based聚類算法,由Frey和Dueck在2007年提出,其將所有樣本點(diǎn)均看作潛在類代表點(diǎn),通過信息傳遞自動(dòng)確定完成聚類,避免初始聚類中心選取不當(dāng)造成的不良后果,在某些應(yīng)用方面相較于目前常用的聚類算法(例如K-means、K-medoids等)效果更好。該算法一

2、經(jīng)提出便得到廣泛的關(guān)注,目前已應(yīng)用于人臉分類、圖像分割、文本挖掘等領(lǐng)域,大量基于AP的改進(jìn)和擴(kuò)展算法也被相繼提出。作為一種新型聚類算法,AP算法仍有問題有待解決,其中一個(gè)比較關(guān)鍵的問題就是偏向參數(shù)P(P={pk},其各元素反映各點(diǎn)成為類代表點(diǎn)的偏向程度)的取值問題。偏向參數(shù)的大小直接影響聚類結(jié)果,在標(biāo)準(zhǔn)AP以及基于AP的算法中,pk一般被賦為一個(gè)相同的常數(shù),在聚類過程中保持不變。但對(duì)于某些實(shí)際問題,賦予所有樣本點(diǎn)以相同的偏向參數(shù)并不十分

3、恰當(dāng),忽視了數(shù)據(jù)本身蘊(yùn)含的一些信息,可能造成信息迭代更新過程中不必要的計(jì)算。
  本文針對(duì)AP的上述問題進(jìn)行了AP算法研究和改進(jìn)工作,并將所提出的改進(jìn)算法應(yīng)用于標(biāo)準(zhǔn)實(shí)測(cè)數(shù)據(jù)的聚類以及氣液兩相流流型辨識(shí)中。本文主要工作和創(chuàng)新點(diǎn)如下:
  1.提出一種新的AP算法——偏向參數(shù)自動(dòng)更新的AP(AdjustablePreference AP,APAP)算法。該算法針對(duì)目前AP算法存在的問題,從偏向參數(shù)的賦值和偏向參數(shù)的自動(dòng)更新兩個(gè)方

4、面進(jìn)行研究和改進(jìn)。首先,各點(diǎn)對(duì)應(yīng)的偏向參數(shù)初值由對(duì)應(yīng)近鄰相似度集合確定;其次,在聚類實(shí)施的信息更新過程中,增加類代表點(diǎn)相互作用約束條件,改變AP信息傳播的因子圖模型,使偏向參數(shù)根據(jù)類代表點(diǎn)的相互作用自動(dòng)調(diào)整。經(jīng)過人工數(shù)據(jù)集的實(shí)驗(yàn)測(cè)試研究發(fā)現(xiàn),APAP算法的四項(xiàng)有效性指標(biāo)——Classification Rate(CR)、Rand Index(RI)、Normalized Mutual Information(NMI)和Number of

5、 Interaction(NI)整體優(yōu)于AP算法。同時(shí),將所提出的APAP算法與多類代表點(diǎn)AP算法(MEAP算法)、自適應(yīng)AP算法(adAP算法)進(jìn)行對(duì)比。實(shí)驗(yàn)結(jié)果驗(yàn)證了所提出算法的可行性、有效性。
  2.將所提出的APAP算法應(yīng)用于實(shí)際測(cè)試數(shù)據(jù)中,選取加州大學(xué)歐文分校提供的標(biāo)準(zhǔn)測(cè)試數(shù)據(jù)庫(kù)(UCI機(jī)器學(xué)習(xí)庫(kù),the UC Irvine Machine LearningRepository)中的四類常用且具有代表性的實(shí)測(cè)數(shù)據(jù),進(jìn)行

6、了聚類應(yīng)用研究。結(jié)果表明,與AP算法相比APAP算法的聚類性能更好,利用APAP算法在四種代表性數(shù)據(jù)集上得到的多數(shù)有效性指標(biāo)(CR、RI、NMI和NI)均好于AP;與其他AP改進(jìn)型算法(MEAP算法、adAP算法)相比,APAP算法所需的迭代次數(shù)和時(shí)間更少,穩(wěn)定性更好。
  3.將所提出的APAP算法應(yīng)用于氣液兩相流流型辨識(shí)中,針對(duì)目前流型辨識(shí)中存在的問題,提出了一種基于APAP算法的流型辨識(shí)新方法。該方法首先對(duì)傳感器采集的數(shù)據(jù)提

7、取特征矢量,然后利用所提出的APAP算法對(duì)數(shù)據(jù)進(jìn)行聚類得到典型流型對(duì)應(yīng)的類代表點(diǎn),最后基于近鄰原則進(jìn)行流型辨識(shí)。本文分別利用兩種傳感器(12×6維的光電池陣列傳感器、徑向C4D(CapacitivelyCoupled Contactless Conductivity Detection)傳感器)對(duì)所提出的流型辨識(shí)方法進(jìn)行了實(shí)驗(yàn)研究。結(jié)果表明,APAP聚類結(jié)果符合實(shí)際流型分類,同時(shí)采用APAP聚類這種無監(jiān)督的流型辨識(shí)方法對(duì)三種典型流型(泡

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論