基于邏輯回歸關聯(lián)規(guī)則的疾病預警模型.pdf_第1頁
已閱讀1頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、醫(yī)學數(shù)據(jù)挖掘的意義在于:通過現(xiàn)有病人數(shù)據(jù)信息的分析挖掘與整理,建立模型,對一些疾病的發(fā)生發(fā)展作出預測,從而在疾病出現(xiàn)危險因素時對其進行預防工作,更好的防止病情惡化或是挽救病人的生命。提高診療時效和醫(yī)院服務患者的水平。
  文章以山東省某醫(yī)院所有住院患者真實病例數(shù)據(jù)為依據(jù),以患者是否發(fā)生深靜脈血栓疾病為研究對象進行實證分析,建立模型。進而對未來的患者進行實時監(jiān)控,預測其發(fā)病概率,縮小高??梢扇巳悍秶卺t(yī)院對該類患者作出特殊對待。

2、
  進行該實證分析的意義,一方面是深靜脈血栓形成對人體危害較大,可能危及生命,而且通過預防是可以有效控制其發(fā)生的。另一方面它代表的是一類問題,疾病預警模型研究,它是一個探索性的工作,可以為其他疾病的建模提供依據(jù)和經(jīng)驗。
  數(shù)據(jù)是由患者具有的特征癥狀及其是否發(fā)生深靜脈血栓等字段信息組成。取自八個月的住院患者數(shù)據(jù),共69779條記錄,108例患者發(fā)病。提取了患者病歷的65個特征字段作為預測變量。預測患者發(fā)生深靜脈血栓的可能性

3、。
  該研究屬于二分類數(shù)據(jù)建模問題。建模工具眾多,有的只能給出分類結果;有的則可以給出一個評分機制,這樣的結果信息量更大,更具有實用價值。所以本次模型開發(fā)過程中以神經(jīng)網(wǎng)絡、支持向量機、Logistic回歸為主要建模工具,他們均能給出相應的預測評分機制。Logistic回歸模型在建立過程中,采用了逐步回歸法并結合醫(yī)學結論綜合判斷進行變量的選擇。此外,考慮到了變量間的交互效應可能對結果也會有影響,所以文中借助關聯(lián)規(guī)則進行交互效應的篩

4、選和構造并且作為待選變量加入到模型中。神經(jīng)網(wǎng)絡采用的BP三層感知器模型,支持向量機采用的是支持向量ε-回歸機模型。
  對于建模樣本采取了兩種選擇方法,一種是以前四個月數(shù)據(jù)(大樣本)作為建模樣本。另一種是將前四個月數(shù)據(jù)中的沒有得深靜脈血栓患者案例隨機去掉一部分(小樣本),以提高樣本中發(fā)病案例的比例,建立模型。檢驗樣本均為后四個月的數(shù)據(jù)。在多數(shù)情況下,大樣本模型在樣本外的預測能力略優(yōu)于小樣本。
  這三種模型,從樣本外預測能力

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論