貝葉斯網(wǎng)絡(luò)在臨床及微陣列數(shù)據(jù)分析中的應(yīng)用.pdf_第1頁
已閱讀1頁,還剩81頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、近年大量研究表明癌癥是多因素的疾病,不僅與病人所處的環(huán)境和自身體征有關(guān),它還是多基因參與的一種漸進積累轉(zhuǎn)化性疾病,疾病的變化首先就發(fā)生在基因水平上。因此結(jié)合臨床資料與基因表達譜數(shù)據(jù)對癌癥進行綜合分析,將從宏觀與微觀兩個角度發(fā)現(xiàn)癌癥診斷與治療的相關(guān)因素,從而為癌癥的預(yù)測、療效分析和制定預(yù)防措施提供依據(jù)。本文將貝葉斯網(wǎng)絡(luò)引入臨床和微陣列數(shù)據(jù)的分析,從概率角度定量描述各因素間的影響,揭示多指標(biāo)之間,多層次的多重因果關(guān)系。 首先本文介紹

2、了貝葉斯網(wǎng)絡(luò)的基本概念及其分類情況,詳細(xì)闡述了貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)的原理,以及與決策樹算法相結(jié)合的優(yōu)化算法,并運用Matlab7.0的FullBNT工具箱實現(xiàn)了貝葉斯網(wǎng)絡(luò)模型的構(gòu)建。 在實例分析中,本文首先分析了包含1441個肝癌病人的臨床資料,建立了一個包含48個變量,71條有向弧的貝葉斯網(wǎng)絡(luò)模型。此模型揭示了包含患者的年齡、性別、有無肝癌家族史等一般情況和治療前理化檢查、手術(shù)及治療前情況、術(shù)后治療、復(fù)發(fā)后治療5個方

3、面的各項指標(biāo)的影響關(guān)系。在網(wǎng)絡(luò)學(xué)習(xí)過程中,筆者討論了最大父結(jié)點數(shù)的設(shè)置和貝葉斯網(wǎng)絡(luò)對小概率事件發(fā)生率的估計能力,并于數(shù)據(jù)中隨機設(shè)置1/5的缺失值,探討貝葉斯參數(shù)估計的EM算法對于含缺失值的數(shù)據(jù)的處理能力。 在對胃癌臨床資料的分析中,本文探討了運用卡方檢驗篩選變量對構(gòu)建貝葉斯網(wǎng)絡(luò)的影響,分析了包含122個胃癌病人的臨床資料,建立了一個包含4個變量,5條有向弧的貝葉斯網(wǎng)絡(luò)模型。闡述了胃癌分期、淋巴結(jié)轉(zhuǎn)移、腹膜擴散以及浸潤深度這幾個變

4、量之間的相互關(guān)系,探討了如何依據(jù)模型進行疾病診斷。 從微觀角度,本文詳細(xì)描述了微陣列數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)模型構(gòu)建的整個流程。微陣列雜交實驗的操作過程中不可避免地會造成基因表達譜數(shù)據(jù)的缺失,同樣的本文引用的胃癌基因表達譜數(shù)據(jù)也存在大量缺失值,本文運用KNN算法對缺失值進行了填充?;虮磉_譜數(shù)據(jù)往往都是連續(xù)型數(shù)據(jù),在貝葉斯網(wǎng)絡(luò)雖然也能使用連續(xù)型數(shù)據(jù),但是連續(xù)數(shù)據(jù)的實際意義往往無法明確,且數(shù)據(jù)離散化后能夠明顯提高網(wǎng)絡(luò)學(xué)習(xí)精度,因此本文將基

5、因表達數(shù)據(jù)進行μ±σ的三值離散化后再進行貝葉斯網(wǎng)絡(luò)的構(gòu)建。最終,本文構(gòu)建了一個包含37條基因,35條有向弧的貝葉斯網(wǎng)絡(luò)模型,并例分析了有較多子結(jié)點的兩條基因的在網(wǎng)絡(luò)中的作用與影響。 通過以上試驗比較,本研究的主要結(jié)論有:①對臨床資料及微陣列數(shù)據(jù)進行貝葉斯網(wǎng)絡(luò)分析是可行的,它能夠從概率角度描述各變量間的相互作用,從而揭示多指標(biāo)間多層次的,多因多果的相互影響關(guān)系,可用于指導(dǎo)臨床診斷與治療方案的選擇;②貝葉斯網(wǎng)絡(luò)具有較強的缺失值的處理

6、能力,能通過對含有缺失值的數(shù)據(jù)的學(xué)習(xí),得到較為精確的網(wǎng)絡(luò)參數(shù);③對貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)算法進行了探討,結(jié)合決策樹對網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)算法進行優(yōu)化,解決結(jié)點排序問題,提高結(jié)構(gòu)學(xué)習(xí)效率;④建立了微陣列數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)模型的構(gòu)建流程,運用KNN算法進行缺失值的填充,進而運用μ±σ三值離散法,對表達譜數(shù)據(jù)進行離散,從而提高貝葉斯網(wǎng)絡(luò)學(xué)習(xí)的速度與實際解釋能力。⑤貝葉斯網(wǎng)絡(luò)對小概率事件的發(fā)生率估計能力有所不足,因此在建立分類指標(biāo)時不宜過細(xì)。 綜上所

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論