基于數(shù)據(jù)挖掘的P2P網(wǎng)貸獲貸結(jié)果影響因素及放貸決策模型研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩56頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、P2P網(wǎng)絡(luò)貸款指的是出借人與借款人之間通過(guò)網(wǎng)絡(luò)借貸平臺(tái)而不是金融機(jī)構(gòu)產(chǎn)生的無(wú)抵押貸款。從2015年起我國(guó)的P2P網(wǎng)絡(luò)貸款發(fā)展非常迅猛,《中國(guó)P2P網(wǎng)貸行業(yè)2015年年報(bào)簡(jiǎn)報(bào)》顯示,2015年全國(guó)的P2P網(wǎng)貸平臺(tái)數(shù)量從2918家增至5121家,年度累計(jì)成交量從2014年的2528億元增加到2015年的9823.04億元。然而,截止至2017年2月,全國(guó)累計(jì)成立的5882家P2P網(wǎng)絡(luò)貸款平臺(tái)中,已有3547家平臺(tái)停業(yè)或者出現(xiàn)問(wèn)題。由此可見(jiàn),

2、P2P網(wǎng)貸平臺(tái)的風(fēng)險(xiǎn)控制問(wèn)題刻不容緩。
  本文基于P2P網(wǎng)貸平臺(tái)“好貸網(wǎng)”的真實(shí)貸款數(shù)據(jù),從申請(qǐng)者的一系列特征變量中識(shí)別出影響其獲貸結(jié)果的顯著因素,并建立了有效的放貸決策模型判別申請(qǐng)者的獲貸結(jié)果。文章具體內(nèi)容如下:
  數(shù)據(jù)預(yù)處理部分,將原始數(shù)據(jù)的貸款申請(qǐng)表和申請(qǐng)者信息表用SQL.拼接成個(gè)人貸款分析表,通過(guò)邏輯處理刪除無(wú)效數(shù)據(jù),然后用KNN插值法對(duì)缺失值進(jìn)行插補(bǔ),再通過(guò)WOE分箱法處理離群值,最終得到3003條有效數(shù)據(jù),2

3、0個(gè)申請(qǐng)者特征變量。
  獲貸結(jié)果影響因素識(shí)別部分,首先通過(guò)計(jì)算20個(gè)變量的Ⅳ值篩選出對(duì)獲貸結(jié)果顯著的14個(gè)變量,接著用隨機(jī)森林模型計(jì)算每個(gè)顯著變量的Gini值平均減少量,平均減少量越大的變量對(duì)獲貸結(jié)果的影響越大。結(jié)果發(fā)現(xiàn),對(duì)獲貸結(jié)果影響最大的因素是申請(qǐng)者以往信用記錄,其次是其職業(yè)和資產(chǎn)情況,最后是貸款額度和貸款期限,而性別和婚姻狀況等個(gè)人基本特征的影響非常小。通過(guò)成敗比進(jìn)一步識(shí)別各因素對(duì)獲貸結(jié)果影響的具體方向和大小,發(fā)現(xiàn)有信用卡

4、比沒(méi)有信用卡的獲貸的成功率高20倍,單卡最高額度、開(kāi)卡時(shí)間、工資、工作年限、文化程度都與獲貸成功率顯著成正比。
  放貸決策模型建立部分,本文選用最常見(jiàn)的6種模型:統(tǒng)計(jì)模型中的Logistic回歸模型、非統(tǒng)計(jì)模型中的SVM模型和神經(jīng)網(wǎng)絡(luò)模型、組合模型中的AdaBoost模型、GDBT模型、XGBoost模型。首先對(duì)申請(qǐng)者用K-means聚類(lèi)法進(jìn)行分類(lèi),總結(jié)每類(lèi)申請(qǐng)者的特征,再對(duì)每類(lèi)申請(qǐng)者單獨(dú)建立模型并將每類(lèi)申請(qǐng)者的模型預(yù)測(cè)結(jié)果匯總

5、,將匯總結(jié)果與未分類(lèi)前所建立的模型結(jié)果進(jìn)行對(duì)比,發(fā)現(xiàn)聚類(lèi)后的模型準(zhǔn)確度、靈敏度、特異性分別有3.31%、17.39%、11.05%的顯著提高,這意味著聚類(lèi)后的模型與來(lái)聚類(lèi)相比能為P2P網(wǎng)貸平臺(tái)增加17.39%的業(yè)務(wù),降低11.05%的錯(cuò)判風(fēng)險(xiǎn)。從而得到如下結(jié)論:不同申請(qǐng)者之間存在較大差異,對(duì)申請(qǐng)者整體建模會(huì)忽略這些差異信息,造成模型精度下降。先用K-means聚類(lèi)法將申請(qǐng)者分類(lèi)再在各類(lèi)申請(qǐng)者中建立模型,能顯著增強(qiáng)模型捕捉不同類(lèi)申請(qǐng)者特征

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論