版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、本論文主要研究了多指標面板數(shù)據(jù)系統(tǒng)聚類分析的兩大核心問題:一個是采用何種統(tǒng)計量來測定橫截面?zhèn)€體之間的相似程度或者說采用何種相似性指標,即聚類算法的問題;另一個是采用何種具體的系統(tǒng)聚類方法或者說采用何種準則確定類與類之間的相似性,即聚類過程的問題。Bonzo和Hermosilla(2002)提出了用“概率連接函數(shù)”來代替一般的平面距離作為橫截面?zhèn)€體間相似性指標,提出了新的聚類算法。與主成分分析法和指標距離進行求和作為橫截面?zhèn)€體間相似性指標
2、相比,這種概率連接函數(shù)的方法能夠保留面板數(shù)據(jù)的“概率性結(jié)構(gòu)”。本論文考慮概率連接函數(shù)作為多指標面板數(shù)據(jù)系統(tǒng)聚類的算法,并研究了基于概率連接函數(shù)的系統(tǒng)聚類分析。
本論文首先回顧了Bonzo和Hermosilla(2002)提出的“概率連接函數(shù)”,介紹了概率連接函數(shù)的定義,以及其作為度量多指標面板數(shù)據(jù)中橫截面?zhèn)€體間相似性指標所具有的優(yōu)良性質(zhì)。但是,Bonzo和Hermosilla(2002)僅考慮了在同一個類中不同橫截面?zhèn)€體間
3、的協(xié)方差矩陣等于其自身的方差矩陣。但是在實際情況中,在同一類中不同橫截面?zhèn)€體間的協(xié)方差矩陣不一定就等于其自身的方差矩陣。Zhao和Hang(2010)研究了在整個面板數(shù)據(jù)中橫截面?zhèn)€體互不相關(guān)情況下,概率連接函數(shù)的定義及其性質(zhì)。因此,本論文同時也介紹了Zhao和Hang(2010)提出的概率連接函數(shù)。
本論文從更加合理且更加符合實際的一般情況出發(fā)。本論文主要在Bonzo和Hermosilla(2002)以及Zhao和Hang
4、(2010)的研究基礎(chǔ)上,進一步考慮了更加一般情況下的概率連接函數(shù),即在同一類中橫截面?zhèn)€體間協(xié)方差矩陣不等于它們自身方差矩陣且橫截面?zhèn)€體相關(guān)的情況。本論文主要研究了在該情況下概率連接函數(shù)的定義及其估計,并且進一步分析了在該情況下概率連接函數(shù)的性質(zhì)。在本論文中,研究發(fā)現(xiàn)Zhao和Hang(2010)所研究的橫截面?zhèn)€體互不相關(guān)情況只是上述該情況的一個特例而已。
Bonzo和Hermosilla(2002)僅研究了多指標面板聚類
5、的算法即概率連接函數(shù),并沒有進一步研究在該算法基礎(chǔ)上的聚類過程。在研究面板數(shù)據(jù)中橫截面?zhèn)€體的分類時,他們沒有結(jié)合多元統(tǒng)計中的系統(tǒng)聚類方法,沒有在已有基礎(chǔ)上提出基于概率連接函數(shù)的多指標面板數(shù)據(jù)系統(tǒng)聚類方法。Zhao和Hang(2010)在研究橫截面?zhèn)€體互不相關(guān)情況下的概率連接函數(shù)時,提出了在該情況下基于概率連接函數(shù)的多指標面數(shù)據(jù)重心系統(tǒng)聚類法(簡稱為“重心法”)。因此,本論文也考慮了在橫截面?zhèn)€體相關(guān)情況下如何應(yīng)用概率連接函數(shù)進行系統(tǒng)聚類的
6、問題。本論文將橫截面?zhèn)€體相關(guān)的概率連接函數(shù)作為聚類算法,進一步研究了基于該算法的聚類過程。除了“重心法”外,本論文還提出了在基于概率連接函數(shù)的其他三種系統(tǒng)聚類方法:最短距離法、最長距離法和類平均法。
本論文還對上述基于概率連接函數(shù)的四種系統(tǒng)聚類方法,進行了Monte Carlo模擬研究,比較這四種方法的聚類效果。通過大量的模擬實驗發(fā)現(xiàn):重心法和類平均法在聚類時類的代表性較好,這兩種系統(tǒng)聚類方法在各種情況下聚類效果是穩(wěn)健且有
7、效的,而最短距離法和最長距離法由于在聚類時沒有考慮類中橫截面?zhèn)€體數(shù),類的代表性較差,聚類效果不太理想。
本論文最后對2000-2009年我國31個省市城鎮(zhèn)居民家庭平均每人全年消費性支出的面板數(shù)據(jù)進行了實證分析。本論文按照我國城鎮(zhèn)居民消費支出水平的不同,采用重心法對全國31個省市地區(qū)進行了系統(tǒng)聚類分析,聚類的結(jié)果較為滿意,基本與實際情況相符合。本論文同時還考慮了將全國31個省市地區(qū)分為了3個類,而且對這3類地區(qū)的各項目進行一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 面板數(shù)據(jù)綜合評價和聚類分析及應(yīng)用研究.pdf
- 基于混合多指標信息的聚類分析.pdf
- 高維數(shù)據(jù)的聚類分析方法研究及其應(yīng)用.pdf
- 基因表達數(shù)據(jù)聚類分析及其應(yīng)用研究.pdf
- 新能源汽車數(shù)據(jù)聚類分析及其應(yīng)用研究.pdf
- 面板數(shù)據(jù)的主成分分析及其應(yīng)用
- 面向證券行業(yè)數(shù)據(jù)的聚類分析及其應(yīng)用研究.pdf
- 聚類分析及其在基因表達數(shù)據(jù)中的應(yīng)用研究.pdf
- 聚類分析在數(shù)據(jù)挖掘中的應(yīng)用.pdf
- 聚類分析研究及其在生物數(shù)據(jù)分析中的應(yīng)用.pdf
- 聚類分析及其應(yīng)用研究.pdf
- 聚類分析數(shù)據(jù)挖掘方法的研究與應(yīng)用.pdf
- 交易數(shù)據(jù)的聚類分析.pdf
- 數(shù)據(jù)挖掘中聚類分析的研究與應(yīng)用.pdf
- 我國主要城市空氣質(zhì)量面板數(shù)據(jù)聚類分析
- 基于多源信息融合的基因表達數(shù)據(jù)聚類分析.pdf
- 聚類分析及其在移動通信企業(yè)數(shù)據(jù)挖掘分析中的應(yīng)用研究.pdf
- 數(shù)據(jù)挖掘中的聚類分析及其在控制中的應(yīng)用研究.pdf
- 數(shù)據(jù)場在聚類分析中的應(yīng)用研究.pdf
- 數(shù)據(jù)挖掘中聚類分析算法的研究與應(yīng)用.pdf
評論
0/150
提交評論