2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩184頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著生物統(tǒng)計學方法學的發(fā)展進步以及臨床研究對于統(tǒng)計方法的依賴性日益增強,越來越多的統(tǒng)計模型被廣泛地應用于臨床研究的各個方面,如篩選影響因素、診斷試驗、預后評價以及個體化治療等。列線圖預測模型能夠通過整合多個預后變量信息從而計算個體生存率,并以人機友好的形式將結(jié)合了生物學信息以及臨床學信息的復雜模型表現(xiàn)出來,是個體化醫(yī)療中不可或缺的方法學工具,已經(jīng)開始廣泛應用于臨床各個領(lǐng)域。在構(gòu)建列線圖預測模型時最廣泛應用變量選擇方法為逐步回歸法,但是越

2、來越多的統(tǒng)計學家認為應用傳統(tǒng)的逐步回歸法所構(gòu)建的預測模型存在著一定的缺陷,如計算的R2偏大,P值偏小,未校正模型的不確定性,容易發(fā)生過度擬合的情況等等,并且這種方法太過于注重變量與事件的聯(lián)系,而并沒有考慮到模型的構(gòu)建過程。隨著貝葉斯學派的興起,貝葉斯模型平均法也開始越來越受到統(tǒng)計學家們的重視。貝葉斯模型平均法將模型的不確定性考慮在內(nèi),通過貝葉斯算法計算變量以及模型的后驗概率將模型科學地加權(quán)平均,從而推導變量與事件之間的效應以及選擇正確合

3、適的模型形式。但是貝葉斯模型平均法在國內(nèi)外預測模型的建立中還處于初步探索階段,尤其是在生存數(shù)據(jù)中和傳統(tǒng)的逐步回歸法以及新興的懲罰類方法Lasso相比較的優(yōu)劣以及適用條件尚不明確,有待進一步研究。
  研究目的:
  本研究通過模擬研究探索貝葉斯模型平均法的基本性質(zhì)和適用條件,同時比較在不同樣本量、不同殘差項以及不同的數(shù)據(jù)情境中貝葉斯模型平均法構(gòu)建模型的準確性和穩(wěn)定性,并和傳統(tǒng)的逐步回歸法以及Lasso法相比較,探索不同情境下

4、模型的最佳構(gòu)建方法。最后,將以上幾種方法同時應用于實例數(shù)據(jù)中,以驗證模擬研究結(jié)果,提高建立列線圖預測模型的穩(wěn)定性。
  研究方法:
  本研究采用Bender算法模擬縱向生存數(shù)據(jù)集,并考慮樣本量,殘差項以及模型的復雜性建立不同的數(shù)據(jù)情境,對于貝葉斯模型平均法通過設(shè)置均衡先驗信息來獲取自變量的后驗信息,將閾值設(shè)置為50%和95%分別構(gòu)建模型,對于Lasso法則根據(jù)交叉驗證法來選取最佳調(diào)整參數(shù),從而調(diào)整收縮系數(shù)選擇變量并構(gòu)建模型

5、,逐步回歸法則以P值小于0.05作為進入標準0.15作為排除標準,在各種數(shù)據(jù)條件下全面比較三種變量選擇方法建立模型的優(yōu)劣,并將貝葉斯模型平均法應用到晚期肝癌實例數(shù)據(jù)中,探索穩(wěn)定的模型構(gòu)建形式。
  研究結(jié)果:
  當樣本量較小時,以50%作為后驗概率閾值的貝葉斯模型平均法在選擇真實變量,剔除混雜變量以及構(gòu)建模型上和逐步回歸法并沒有明顯的區(qū)別,而相應的,當以95%作為后驗概率閾值時,貝葉斯模型平均法由于選擇變量標準過于嚴格其表

6、現(xiàn)要略差于逐步回歸法和Lasso法,但是當樣本量較小時三種方法所構(gòu)建的模型都有比較嚴重的過度擬合,模型的實際應用價值都有待商榷。
  當樣本量較大時,貝葉斯模型平均法在選擇變量、估計參數(shù)及構(gòu)建模型中都要明顯優(yōu)于其余兩種方法。首先,貝葉斯模型平均法在校正了模型的不確定性后,以95%作為后驗概率閾值時所選擇變量幾乎不可能為無關(guān)變量,即使將閾值下調(diào)到50%,貝葉斯模型平均法剔除無關(guān)變量的頻率也在70%以上,而逐步回歸法和Lasso法則分

7、別為60%和70%左右。其次,雖然貝葉斯模型平均法、Lasso法和逐步回歸法在選擇真實變量的能力上并沒有明顯的區(qū)別,但是由于貝葉斯模型平均法識別無關(guān)變量的能力較強,其選擇到真實模型的頻率也遠遠超過了其余兩種方法。而在參數(shù)估計方面,貝葉斯模型平均法對真實變量回歸系數(shù)估計的偏倚較小,覆蓋率也明顯優(yōu)于逐步回歸法和Lasso法,在參數(shù)估計的準確性上有明顯的優(yōu)勢。最后,貝葉斯模型平均法所建立的模型更為穩(wěn)定,較好的避免了模型過度擬合的問題,而逐步回

8、歸法和Lasso法則均有不同程度的過度擬合。
  但是,貝葉斯模型平均法也存在著一定的缺陷,由于其選擇變量標準較為嚴格,因此,當樣本量較小或者殘差項較大時,貝葉斯模型平均法難以發(fā)現(xiàn)真實變量和事件之間的關(guān)聯(lián),并且估計參數(shù)的準確性以及模型的穩(wěn)定性都有一定程度的下降,另外貝葉斯模型平均法難以處理具有真實變量間具有組內(nèi)相關(guān)效應的數(shù)據(jù),而Lasso法在這一方面則有明顯改善。
  實例數(shù)據(jù)分析中,貝葉斯模型平均法所建立的模型相對于其他兩

9、種方法更為穩(wěn)健,并且所選擇的晚期肝癌患者的危險因素也更具有可信度和臨床意義,而Lasso法和逐步回歸法都不同程度的納入了無關(guān)變量,并且建立的模型都有不同程度的過度擬合。
  研究結(jié)論:
  當樣本量比較充分數(shù)據(jù)質(zhì)量較好,且對危險因素有一定的前期探索,未知的危險因素較少的情況下,貝葉斯模型平均法所構(gòu)建的預測模型比較穩(wěn)健,參數(shù)估計也更為準確,基于貝葉斯模型平均法構(gòu)建列線圖預測模型對于個體化治療以及臨床實踐中治療方法的決策具有很高

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論