軟件成本估算建模數(shù)據(jù)集中缺失值的填補(bǔ)方法研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩60頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、軟件成本估算是軟件項(xiàng)目管理的核心問題之一,估算的準(zhǔn)確與否影響到項(xiàng)目的計(jì)劃和控制活動(dòng),估算偏差嚴(yán)重的甚至?xí)?dǎo)致一個(gè)項(xiàng)目的失敗。目前,大多數(shù)估算模型都是依據(jù)有效的軟件歷史項(xiàng)目數(shù)據(jù)而建立,如統(tǒng)計(jì)回歸模型等。然而,在實(shí)際的項(xiàng)目中,由于應(yīng)用了新的軟件開發(fā)技術(shù)等原因,導(dǎo)致收集到的歷史數(shù)據(jù)出現(xiàn)缺失值。因此,基于這些歷史數(shù)據(jù)所建立的估算模型不可避免地導(dǎo)致估算準(zhǔn)確度的降低。通常,軟件成本的數(shù)據(jù)集的規(guī)模都不大,如果在建模時(shí)直接忽略存在缺失值的數(shù)據(jù),一方面導(dǎo)

2、致數(shù)據(jù)集規(guī)模的縮小,另一方面浪費(fèi)了數(shù)據(jù)中所蘊(yùn)涵的有價(jià)值的信息。因此,研究如何對(duì)歷史數(shù)據(jù)中的缺失值進(jìn)行填補(bǔ),使填補(bǔ)值能更真實(shí)地反映缺失數(shù)據(jù)的本來面目,對(duì)提高估算模型的估算準(zhǔn)確度有重要意義。 本文研究用k近鄰(kNN)方法對(duì)歷史數(shù)據(jù)集的缺失值進(jìn)行填補(bǔ)。傳統(tǒng)的kNN算法通常以歐式距離作為選取k個(gè)鄰居的度量指標(biāo),由于歐式距離沒有考慮到各變量間的相關(guān)性,而軟件成本數(shù)據(jù)的不同屬性之間往往都存在一定的相關(guān)性,此時(shí)使用歐式距離顯然不合適。針對(duì)這

3、個(gè)問題,本文采用以馬氏距離替代歐式距離的kNN缺失值填補(bǔ)算法(MkNNI),并采用兩個(gè)軟件成本數(shù)據(jù)集Desharnais和Albrecht進(jìn)行實(shí)驗(yàn),本文還引進(jìn)三種方法:傳統(tǒng)的kNN缺失值填補(bǔ)法(kNNI)、平均值填補(bǔ)法(MI)和回歸替換法(RI)進(jìn)行實(shí)驗(yàn)分析比較。實(shí)驗(yàn)結(jié)果表明:在缺失率≤30%時(shí),在四種算法中,MkNNI的填補(bǔ)誤差最小,它的缺失值填補(bǔ)準(zhǔn)確率最高,由此可見,MkNNI算法適宜作為軟件項(xiàng)目成本數(shù)據(jù)集有效的缺失值填補(bǔ)方法。對(duì)于

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論