基于人血漿microRNAs的數(shù)據(jù)挖掘技術(shù)構(gòu)建肺癌預(yù)測系統(tǒng).pdf_第1頁
已閱讀1頁,還剩88頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、肺癌位居中國惡性腫瘤發(fā)病率和死亡率首位,肺癌預(yù)防的重要手段是開展早期發(fā)現(xiàn)、早期診斷和早期治療,有必要研究高敏感性和特異性的腫瘤生物標(biāo)志物。microRNAs(miRNAs)可調(diào)控基因參與細(xì)胞的生長、增殖、分化和凋亡等過程,大量的研究表明循環(huán)miRNAs和多種腫瘤的發(fā)生和發(fā)展有關(guān),具有作為包括肺癌在內(nèi)的疾病診斷生物標(biāo)志物的潛力。
  目的:
  該研究應(yīng)用決策樹(Decision Tree,DT)、人工神經(jīng)網(wǎng)絡(luò)(Artific

2、ial Neual Networks,ANN)和支持向量機(jī)(SupportVector Machines,SVM)等數(shù)據(jù)挖掘方法聯(lián)合血漿miRNA生物標(biāo)志、流行病學(xué)參數(shù)和臨床癥狀資料建立肺癌預(yù)測模型。
  對象和方法:
  1.研究對象:肺癌組為2016年6月至2017年2月取自鄭州大學(xué)第一附屬醫(yī)院呼吸內(nèi)科、河南省腫瘤醫(yī)院胸外科、河南省胸科醫(yī)院呼吸內(nèi)科和胸外科的148例初診的原發(fā)性肺癌患者;對照組為2016年7月取自淇縣疾病

3、預(yù)防控制中心體檢的148例健康人群。經(jīng)知情同意后收集研究對象的信息和血液標(biāo)本。
  2.實驗方法:血漿miRNAs(miR-16、miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、miR-197、miR-30a、miR-30d、miR-25)表達(dá)水平的檢測采用實時熒光定量PCR法。
  3.數(shù)據(jù)挖掘:采用SPSS Clementine21.0軟件?;趩我蛩胤治鼋Y(jié)果和Logisti

4、c回歸分析優(yōu)化結(jié)果,先將數(shù)據(jù)預(yù)處理,按3:1的比例將所有樣本隨機(jī)分成訓(xùn)練集和預(yù)測集,用訓(xùn)練好的模型對預(yù)測集進(jìn)行預(yù)測,應(yīng)用Fisher判別分析、DT C5.0、ANN和SVM算法分別建立模型,并采用診斷試驗評價指標(biāo)比較模型的預(yù)測結(jié)果。
  4.統(tǒng)計學(xué)分析:Excel2010建立數(shù)據(jù)庫,采用SPSS21.0軟件進(jìn)行統(tǒng)計分析。定量資料分析符合正態(tài)分布時采用兩獨(dú)立樣本 t檢驗,不符合正態(tài)分布時采用Mann-Whitney U檢驗;定性資料

5、間的比較采用χ2檢驗;肺癌的影響因素采用二分類Logistic回歸分析。檢驗水準(zhǔn)為α=0.05。
  結(jié)果:
  1.血漿miRNAs表達(dá)水平檢測結(jié)果:肺癌組的10種血漿miRNAs(miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、miR-197、miR-30a、miR-30d、miR-25)的表達(dá)水平高于對照組,差異有統(tǒng)計學(xué)意義(P<0.05)。
  11種血漿miRNA

6、s(miR-16、miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、miR-197、miR-30a、miR-30d、miR-25)的表達(dá)水平與年齡、肺癌的組織學(xué)類型無關(guān)(P>0.05);血漿中miR-30a和 miR-21表達(dá)水平與性別有關(guān)(P<0.05);血漿中miR-21和miR-25表達(dá)水平與吸煙程度、飲酒有關(guān)(P<0.05)。血漿中miR-210的表達(dá)水平和肺癌的分期有關(guān)(P<0.05

7、);血漿中miR-126的表達(dá)水平和肺癌淋巴結(jié)轉(zhuǎn)移有關(guān)(P<0.05)。
  2.肺癌影響因素分析結(jié)果:單因素分析結(jié)果顯示肺癌組和對照組間的流行病學(xué)參數(shù)和臨床癥狀(吸煙程度、發(fā)熱、胸悶胸痛、咳嗽、痰中帶血、咯血)的分布的差異和10種血漿miRNAs(miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、miR-197、miR-30a、miR-30d、miR-25)的表達(dá)水平的差異有統(tǒng)計學(xué)意義

8、(P<0.05);多因素Logistic回歸分析結(jié)果顯示,發(fā)熱、胸悶胸痛、咳嗽、血漿中miR-20a(P=0.016)和miR-223(P=0.001)相對表達(dá)量升高可能是肺癌的危險因素。
  3.數(shù)據(jù)挖掘模型的評價結(jié)果:由吸煙程度、發(fā)熱、胸悶胸痛、咳嗽、痰中帶血、咯血、10種血漿miRNAs(miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、miR-197、miR-30a、miR-30

9、d、miR-25)的表達(dá)水平這16個變量建立的16項DT C5.0模型和由發(fā)熱、胸悶胸痛、咳嗽、痰中帶血、咯血、血漿中miR-20a和miR-223表達(dá)水平建立的優(yōu)化DT C5.0模型的準(zhǔn)確度分別為98.78%和87.80%,AUC分別為0.985和0.883;16項SVM模型和優(yōu)化SVM模型的準(zhǔn)確度分別為98.78%和89.02%,AUC分別為0.985和0.893;16項ANN模型和優(yōu)化ANN模型的準(zhǔn)確度分別為87.80%和84.1

10、5%,AUC分別為0.879和0.835;16項Fisher判別分析模型和優(yōu)化Fisher判別分析模型的準(zhǔn)確度分別為82.93%和82.93%,AUC分別為0.828和0.824。16項DT C5.0模型和16項SVM模型的AUC均優(yōu)于其他6種模型(P<0.05);其他6種模型的AUC之間的差異沒有統(tǒng)計學(xué)意義(P>0.05)。
  結(jié)論:
  1.人血漿中10種miRNAs(miR-21、miR-20a、miR-210、mi

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論