版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、嚳短狄學碩士學位論文學校代碼:10357密級:保密期隈:基于隨機森林的醫(yī)療行業(yè)供應商的等級評估模型TheRatingEvaluationModelofMedicalIndustrySupplierBasedonRandomForest學號姓名學位類別學科專業(yè)(工程領域)指導教師完成時間15301147康雅文應用統計碩士應用統計高文武2017年5月摘要lIlllllIlttlIllltLIIILIltllIlllLIttllllitIll
2、lY3215256目前,傳統的市場經濟環(huán)境正在發(fā)生著巨大的演變。企業(yè)現在所面臨的不僅僅是以往常見的企業(yè)間的競爭,而是轉變?yōu)槠髽I(yè)在供應鏈上的資源爭奪。而隨機森林算法成為現在在科學操作方面嶄新的一種使用方法。它主要被用來發(fā)掘大量數據中隱藏的那些可以使用的,能夠在現實中操作的信息。而本文就選擇隨機森林這種算法作為實驗的依據。首先,對論文的研究背景,意義和方法進行了簡單的描述。而目前來說,大多數企業(yè)在做供應商評估時都沒有一套科學的體系,都是評估
3、人員憑借著自己的經驗來進行。這種方法存在較強的主觀性,而建立合理的評估體系對企業(yè)降低成本,減少風險有著很大的好處。但是好的體系的建立需要選出那些具有代表性的指標。通過對國內外的文獻進行研究,選取指標時要能夠嚴格的契合研究的目的;指標體系的構建要滿足:完善性,合理性,易操作性。在第二章中對隨機森林算法模型進行了詳細的闡述。隨機森林是樹型分類組合器中的一種,對樣本數據的處理采用Bagging和隨機選擇特征的方式進行。而在使用Bagging的
4、方法進行抽樣時,會有一部分數據不會被抽中,這部分數據就可以用來估計模型的泛化誤差。同時,通過實驗證明得出,隨機森林模型的泛化誤差在樹的數目達到一定值時,其收斂于一個有限值,所以利用這個原理可以確定森林中樹的數目。而根據本文研究的目的,選擇了22個指標,由于隨機森林模型可以計算指標體系的重要性,借助于R軟件,通過實驗可以得到最終的指標體系。那么在最后一個章節(jié)就是根據得到的指標體系來建立隨機森林模型,并且通過隨機森林驗證了其對噪聲具有很好的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論