2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩104頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、風險決策中廣泛存在著具有如下特征的一類問題,即風險決策者首先需要建立歷史數(shù)據(jù)樣本與自然狀態(tài)之間的依賴關系,然后根據(jù)該依賴關系估計一個新的數(shù)據(jù)樣本所對應自然狀態(tài)的出現(xiàn)概率,最后建立風險決策模型,以最大化收益函數(shù)(或最小化風險損失函數(shù))為目標選擇最優(yōu)行動方案。從建立歷史數(shù)據(jù)樣本與自然狀態(tài)的依賴關系這一意義上,可以將這類風險決策問題歸納為數(shù)據(jù)挖掘中的分類問題,因而數(shù)據(jù)挖掘中的各種分類方法可以應用于該類風險決策問題。由于分類的高效性和準確性對于

2、風險決策具有關鍵性影響,因此分類方法及其在風險決策中的應用研究具有重要的理論和現(xiàn)實意義。 已有的相關研究主要從分類方法及其應用的角度考慮風險決策問題。事實上,在應用各種數(shù)據(jù)挖掘技術前,探索了解數(shù)據(jù)的特性將對挖掘結果有重要甚至關鍵性的影響。在分類問題中,特征變量異質性是一種重要的數(shù)據(jù)特性,對于分類方法的應用結果具有顯著影響。因此,本文主要研究考慮特征變量異質性的分類方法及其在風險決策問題中的應用。研究目的在于探索數(shù)據(jù)中存在的特征異

3、質性這一數(shù)據(jù)特性,并提出相應的解決方法以提高分類的準確性,使分類方法能夠更好地為風險決策提供支持。 本文從第一章到第六章的內(nèi)容安排如下: 第一章概述了本文的研究背景,回顧了分類方法及其在風險決策問題中的相關研究和分類問題中特征變量異質性的研究現(xiàn)狀,說明了本文的研究內(nèi)容和研究意義。 第二章首先對分類問題進行簡要介紹,然后概述分類問題中的特征變量相關性和特征變量選擇問題。在此基礎上,根據(jù)一系列理論和實際應用研究對特征

4、變量異質性的概念進行描述。由于特征變量異質性無法從數(shù)據(jù)樣本集合中直接觀察和測度,本章基于薈萃分析的基本思想,提出了一種利用全局特征變量選擇和數(shù)據(jù)樣本集合隨機劃分的方法來測度特征變量異質性的方法。在一系列基準數(shù)據(jù)集和人工構造的混合數(shù)據(jù)集上的實驗計算結果說明了該測度方法的有效性。 第三章主要考察特征變量異質性對分類方法效果的影響。本章首先對特征變量異質性的影響進行簡要分析,然后通過實證研究說明分類問題中存在的特征變量異質性對分類方法

5、的準確率具有較為顯著的影響。本章采用的分類方法為一種將logistic回歸與支持向量機集成的分類方法,該方法的主要思想是應用logistic回歸的輸出概率為支持向量機提供支持信息,以提高分類判別準確性。實證研究以企業(yè)財務困境預測這一風險管理和決策問題為背景,通過比較考慮特征變量異質性前后的分類預測準確率,說明了在存在特征變量異質性的分類問題中,考慮特征變量異質性有利于提高分類方法的準確率。 第四章提出了一種基于因子分析和聚類分析

6、的分類策略,該策略的基本思想是首先將原始的特征變量轉化為新的特征變量,使得新的特征變量能夠體現(xiàn)出原始特征變量在數(shù)據(jù)樣本空間中的異質性,然后通過聚類分析得到各個具有特征變量同質性的樣本子集,并在每個樣本子集中分別建立相應的分類模型,從而減小特征變量異質性對分類方法準確率的影響。對于一個未知類標記樣本,該分類策略首先將其轉化為因子得分向量,然后將該因子得分向量按照最近鄰規(guī)則劃分到與之最近的樣本子集合中,最后利用該樣本子集合中的分類模型進行分

7、類。在一系列基準數(shù)據(jù)集上的實驗計算結果說明了該分類策略的有效性。 第五章提出了一種考慮特征變量異質性且具有增量式學習特性的分類方法,可有效應用于一類具有特征變量異質性且需要決策者利用分類方法進行在線實時風險決策的問題。該方法首先利用基于網(wǎng)格的有指導聚類對數(shù)據(jù)樣本集合進行劃分,從而得到若干數(shù)據(jù)簇,且每個數(shù)據(jù)簇中數(shù)據(jù)樣本點的類標記相同。在去除異常數(shù)據(jù)點后,該方法計算各個數(shù)據(jù)簇的特征變量相關性,并將該相關性作為距離測度中各特征變量的權

8、重,應用最近鄰方法進行分類。本章最后將該分類方法應用于一系列基準數(shù)據(jù)集和市場營銷中的顧客確定問題,實證結果說明了該方法的有效性。 第六章總結本文的工作,歸納本文的主要創(chuàng)新點,指出目前本文研究的局限,并根據(jù)已取得的研究結果對未來進一步研究的問題進行思考。 本文工作的主要創(chuàng)新點如下: (1)提出了一種有效的特征變量異質性的測度方法,該方法可用于探索分類問題中存在的特征變量異質性,為解決分類問題提供策略性的信息。

9、 (2)提出了一種基于logistic回歸與支持向量機集成的分類方法,該方法利用logistic回歸得到的后驗概率信息對支持向量機的輸出結果進行修正,能夠有效提高傳統(tǒng)支持向量機的分類準確性。 (3)提出了一種有效的考慮特征變量異質性的分類策略,該策略將具有特征變量異質性的數(shù)據(jù)樣本集合劃分為若干同質性的子集合,然后通過在各個子集合中分別建立分類模型來提高分類的準確性。 (4)提出了一種具有增量式學習特性的分類方法,該方法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論