2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩69頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著市場競爭的日趨激烈,公司出現(xiàn)財務(wù)危機的風險也逐漸加大。對于公司的經(jīng)營者、投資者、債權(quán)人等利益相關(guān)者來說,能否有效地預測財務(wù)危機是他們最為關(guān)注的問題之一。財務(wù)危機預警已有八十多年的歷史,大致經(jīng)歷了統(tǒng)計分析和數(shù)據(jù)挖掘兩個階段。近年來,基于人工智能的支持向量機和人工神經(jīng)網(wǎng)絡(luò)在財務(wù)預警領(lǐng)域得到了廣泛的應(yīng)用,有效地提高了預警效率。但由于財務(wù)預警問題的不平衡性,以及數(shù)據(jù)噪聲和分布的復雜性等問題,使得這些方法難以達到令人滿意的結(jié)果。此外,這些方法

2、對模型的解釋能力不足,使模型的可信度大大降低。鑒于此,本文引入一種組合分類算法——隨機森林,該算法具有較好的噪聲魯棒性和泛化能力,且能很好地處理不平衡分類問題;同時該算法計算變量重要性的功能和提供的偏相關(guān)函數(shù)對于模型的理解有一定的幫助。
  本文首先回顧并總結(jié)了前人的研究成果,接著詳細介紹了隨機森林算法的原理和它的應(yīng)用及研究現(xiàn)狀。在此基礎(chǔ)上本文按照數(shù)據(jù)挖掘項目流程對制造業(yè)上市公司的財務(wù)預警問題進行研究,大致分為數(shù)據(jù)準備和模型構(gòu)建與

3、評估兩個階段。在數(shù)據(jù)準備階段討論了樣本和指標的選取原則,通過描述性的統(tǒng)計分析探索數(shù)據(jù)的分布,并對指標異常值進行了歸約;接著利用隨機森林產(chǎn)生的相似度矩陣診斷數(shù)據(jù)中的異常樣本并予以剔除,然后利用隨機森林對每個指標進行重要性評估,篩選出對財務(wù)預警模型貢獻最大的指標組合,并將該組合與傳統(tǒng)指標篩選方法得到的指標組合進行比較,實驗證明隨機森林篩選出來的最優(yōu)指標組合更有利于模型性能的提高。
  在模型構(gòu)建與評估階段,首先介紹了隨機森林兩大參數(shù)的

4、優(yōu)選方法,接著就隨機森林的容噪性進行了數(shù)據(jù)實驗,結(jié)果證明了其良好的噪聲魯棒性;然后針對財務(wù)預警問題的不平衡性,介紹了基于數(shù)據(jù)層面的過采樣和欠采樣方法與基于算法層面的平衡隨機森林和投票閾值調(diào)整隨機森林,實驗比較表明基于投票閾值調(diào)整的隨機森林表現(xiàn)最優(yōu);接著引入誤判成本函數(shù),比較了隨機森林、支持向量機、BP神經(jīng)網(wǎng)絡(luò)三類模型的性能,實驗結(jié)果表明隨機森林的誤判成本最低;最后利用偏相關(guān)函數(shù)對基于隨機森林的制造業(yè)上市公司財務(wù)預警模型進行解釋,并給出一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論