2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩128頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、聚類分析是數(shù)據(jù)挖掘(Data Mining,DM)重要方法之一,在圖像處理,環(huán)境預(yù)測(cè),天氣預(yù)報(bào)等許多領(lǐng)域有著廣泛應(yīng)用,也是進(jìn)行海洋颶風(fēng)和赤潮研究的一種新方法。
  針對(duì)目前海洋環(huán)境中的颶風(fēng)和赤潮的分析方法單一性和不完善性,本文采用聚類分析方法對(duì)這兩種現(xiàn)象進(jìn)行分析。傳統(tǒng)的颶風(fēng)研究方法依據(jù)氣象學(xué)或空氣動(dòng)力學(xué)的原理進(jìn)行分析,本文采用聚類方法,根據(jù)颶風(fēng)生成的移動(dòng)特征,把颶風(fēng)抽象為軌跡,并以此聚類。赤潮過(guò)程包含多個(gè)階段,各階段具有不確定性,

2、這是由赤潮理化因子的不同作用而引起的。傳統(tǒng)研究赤潮對(duì)所有影響因子數(shù)據(jù)統(tǒng)一處理,這種方法難以發(fā)現(xiàn)個(gè)體因子對(duì)赤潮的影響作用。針對(duì)這一不足之處以及赤潮過(guò)程多階段模糊的特點(diǎn),提出模糊聚類與權(quán)重值相結(jié)合的方法,并以此分析赤潮產(chǎn)生過(guò)程以及各階段的特征。影響赤潮發(fā)生的理化因子具有高維性,高維數(shù)據(jù)綜合分析,更適合采用模糊聚類分析方法。為了表明算法的有效性,本文構(gòu)造了一種新有效性評(píng)價(jià)指標(biāo),克服傳統(tǒng)依靠距離作為衡量標(biāo)準(zhǔn)的有效性指標(biāo)的不足。本文以提出的聚類創(chuàng)

3、新理論為研究重點(diǎn),以海洋環(huán)境領(lǐng)域中的應(yīng)用為背景,內(nèi)容涉及計(jì)算智能技術(shù)、海洋颶風(fēng)以及赤潮,屬于交叉學(xué)科的研究課題,具有十分重要的理論意義和實(shí)際應(yīng)用價(jià)值。論文的主要工作如下:
  1.研究了颶風(fēng)軌跡聚類算法。提出了一種基于相似子軌跡的聚類算法。該算法基于子軌跡的劃分,提出相似子軌跡的概念,利用相似子軌跡近似代表一個(gè)子軌跡聚類區(qū)域的空間特征,因此可以減少空間搜尋,算法能夠有效的降低時(shí)間復(fù)雜度和空間復(fù)雜度,提高了算法的執(zhí)行效率。
 

4、 2.研究了軌跡聚類算法輸入?yún)?shù)問題。針對(duì)軌跡聚類過(guò)程中對(duì)輸入?yún)?shù)ε和MinLns具有敏感性,提出了一種對(duì)輸入?yún)?shù)非敏感的軌跡聚類算法,算法根據(jù)軌跡劃分的子軌跡指定距離和可達(dá)距離概念,計(jì)算得到上一個(gè)參數(shù)化的簇排序,通過(guò)此排序序列表示軌跡數(shù)據(jù)內(nèi)在聚類結(jié)構(gòu),并且使用此排序序列聚類的結(jié)果等效于利用一個(gè)參數(shù)范圍實(shí)現(xiàn)軌跡聚類的結(jié)果。因此算法能夠避免由唯一參數(shù)值帶來(lái)聚類結(jié)果的不確定性,有效降低了聚類結(jié)果對(duì)輸入?yún)?shù)的敏感性。
  3.研究了赤潮

5、發(fā)生過(guò)程中各階段的模糊聚類。赤潮發(fā)生過(guò)程可以分為四個(gè)階段,這四個(gè)階段受多種理化因子制約,各階段之間難以區(qū)別,具有模糊性。某一理化因子在四個(gè)階段都有可能有相同的值,或者值變化非常大。因此不同理化因子在赤潮過(guò)程各個(gè)階段的作用大小并不相同。針對(duì)赤潮過(guò)程的模糊性和各因子對(duì)赤潮各階段影響的重要程度不同的特點(diǎn),提出一種基于權(quán)重的模糊聚類算法,為隸屬度函數(shù)和典型值函數(shù)分配不同的權(quán)值。算法克服了模糊可能性均值聚類算法(Fuzzy possibiliti

6、c C-Means,FPCM)中限制典型值的不足之處,也克服了可能性模糊聚類算法(Possibilitic Fuzzy C-Means,PFCM)中隨機(jī)確定參數(shù)的不合理性。算法運(yùn)用基于原型驅(qū)動(dòng)的學(xué)習(xí)方法確定權(quán)重參數(shù),使得權(quán)重參數(shù)計(jì)算更合理。實(shí)驗(yàn)結(jié)果表明該方法聚類效果明顯。
  4.研究了區(qū)間數(shù)據(jù)集的模糊聚類問題。隨著應(yīng)用的需要,使用區(qū)間值變量描述對(duì)象大量存在于實(shí)際生活中?;跉W氏距離的聚類方法雖然對(duì)點(diǎn)數(shù)據(jù)聚類效果明顯,但對(duì)區(qū)間數(shù)據(jù)

7、的處理歐氏距離度量方法則顯得不足,聚類效果不明顯。針對(duì)這一特點(diǎn),提出了區(qū)間數(shù)據(jù)集的三種二次型距離度量方法,在此基礎(chǔ)上修改目標(biāo)方程產(chǎn)生三種算法。在UCI數(shù)據(jù)集和海洋魚類數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,新算法能夠得到較好的聚類效果,并且有較低誤分率。
  5.研究了聚類有效性指標(biāo)。在未知數(shù)據(jù)集中如何確定最佳聚類數(shù)和如何確定真實(shí)聚類中心,以及如何度量類內(nèi)緊致度和類間分離度屬于聚類有效性研究的問題。目前許多有效性指標(biāo)算法的類內(nèi)和類間的度量方法都基

8、于歐氏距離方法,這種方法對(duì)于球狀數(shù)據(jù)能夠較好的發(fā)現(xiàn)最佳聚類數(shù),但對(duì)于重疊度較高的數(shù)據(jù)集和不規(guī)則數(shù)據(jù)集,效果不明顯。本文提出了一種非歐氏距離有效性指標(biāo)VI,指標(biāo)對(duì)類內(nèi)采用隸屬度表示數(shù)據(jù)集的緊致程度,而類間度量采用反貼近度方法,能夠有效克服采用歐氏距離作為重疊數(shù)據(jù)集和不規(guī)則數(shù)據(jù)集的度量指標(biāo)而引起的不準(zhǔn)確性。該方法既考慮了模糊劃分又結(jié)合了數(shù)據(jù)的分布特征,對(duì)聚類結(jié)果的評(píng)價(jià)更客觀,颶風(fēng)和赤潮以及其他數(shù)據(jù)集實(shí)驗(yàn)結(jié)果表明,該有效性指標(biāo)都能夠找出最佳聚

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論