版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、研究背景及目的:DNA甲基化是目前最為常見與重要的表觀遺傳學(xué)特征,與腫瘤的發(fā)生發(fā)展有密切關(guān)系,在腫瘤形成的初期就已經(jīng)具有明顯的特征[1]。腫瘤基因組的甲基化水平除了與正?;蚪M相比發(fā)生劇烈變化外,不同腫瘤類型之間也存在著較大差異。因此甲基化水平的變化可作為特異性的分子標(biāo)記用以區(qū)分腫瘤類型。目前在臨床方面多采用一些特定的蛋白分子標(biāo)記、CT影像等病理指標(biāo)區(qū)分腫瘤類型。但這些方法準(zhǔn)確性并不高,并且有些腫瘤在形成的初期,很難通過病理指標(biāo)檢測(cè)出來
2、。目前對(duì)于早期腫瘤診斷的研究多集中在血漿中游離的腫瘤DNA(ctDNA)的檢測(cè)[2],但目前這些技術(shù)尚不成熟,而且成本相對(duì)較高,公開的測(cè)序數(shù)據(jù)也較少。在基因組學(xué)分析方面,盡管測(cè)序技術(shù)日漸成熟,許多腫瘤發(fā)生機(jī)制在分子生物學(xué)領(lǐng)域得到解釋,但對(duì)于腫瘤基因組,目前的研究大多關(guān)注于一些原癌基因以及抑癌基因區(qū)域位點(diǎn)的突變以及啟動(dòng)子區(qū)域甲基化狀態(tài)改變[3],對(duì)于多種腫瘤類型的區(qū)分及早期腫瘤的預(yù)測(cè)并沒有非常有效的生物信息學(xué)方法。因此尋找一種對(duì)腫瘤類型的
3、區(qū)分與早期腫瘤預(yù)測(cè)提供幫助的方法就顯得尤為重要。
研究方法及結(jié)果:本課題使用的數(shù)據(jù)為TCGA數(shù)據(jù)庫中包含24種腫瘤類型的Illumina450K數(shù)據(jù),GE0數(shù)據(jù)庫和Roadmap Epigenomics數(shù)據(jù)庫中的WGBS的數(shù)據(jù)以及模擬數(shù)據(jù)。對(duì)于Illumina450K的數(shù)據(jù),使用其提供的計(jì)算好的β值作為甲基化水平;對(duì)于WGBS數(shù)據(jù),使用序列比對(duì)軟件比對(duì)到參考基因組上,通過校正CpG位點(diǎn)的堿基突變以及使用高斯函數(shù)對(duì)數(shù)據(jù)的進(jìn)一步處
4、理,消除了堿基突變以及相近CpG位點(diǎn)的影響,得到較為準(zhǔn)確的甲基化水平。經(jīng)過計(jì)算兩種類型的數(shù)據(jù)同種組織相同位點(diǎn)甲基化狀態(tài)的相關(guān)性系數(shù),可得出兩種數(shù)據(jù)有非常高的相關(guān)性,能夠共同使用。數(shù)據(jù)經(jīng)過前期處理后,使用統(tǒng)計(jì)學(xué)方法去除了在各種腫瘤組織之間表現(xiàn)相似甲基化狀態(tài)的位點(diǎn)、與對(duì)應(yīng)正常組織相比沒有明顯甲基化狀態(tài)變化的位點(diǎn)以及未落在基因組有明確功能區(qū)域的位點(diǎn)后,共得到1894個(gè)有明顯甲基化狀態(tài)差異的位點(diǎn)。將最后得到的CpG位點(diǎn)作為特征值,構(gòu)建深度神經(jīng)網(wǎng)
5、絡(luò)模型的訓(xùn)練集。對(duì)于腫瘤類型的區(qū)分和早期腫瘤預(yù)測(cè)分別構(gòu)建了不同的深度神經(jīng)網(wǎng)絡(luò)模型(DNN),這兩個(gè)模型的整體結(jié)構(gòu)相同,均包含一個(gè)輸入層,五個(gè)隱藏層以及一個(gè)輸出層,選用Sigmoid函數(shù)作為激活函數(shù),使用克羅內(nèi)克符號(hào)構(gòu)建標(biāo)記矩陣。不同的是,早期腫瘤預(yù)測(cè)模型其輸入的特征值、每一層的神經(jīng)元數(shù)量以及學(xué)習(xí)效率與腫瘤類型的區(qū)分模型存在差異。其輸入特征值除了去除沒有WGBS數(shù)據(jù)的組織外,還將去除白細(xì)胞和白血病這兩個(gè)組織的特異性位點(diǎn)。之所以采取這樣的策
6、略是因?yàn)槲覀兊哪M數(shù)據(jù)將采用各類腫瘤組織數(shù)據(jù)與正常的白細(xì)胞數(shù)據(jù)按一定比例混合的方式生成,為了盡可能真實(shí)的模擬數(shù)據(jù),混合時(shí)腫瘤組織所占比例較小,因此需要去除這兩個(gè)組織的特異性位點(diǎn)的影響。兩個(gè)模型經(jīng)過多次迭代訓(xùn)練,校正并且與已有的模型包括K最近鄰,樸實(shí)貝葉斯,logistic回歸,支持向量機(jī),隨機(jī)森林比較,表現(xiàn)出了更為理想的準(zhǔn)確率。
研究結(jié)論:本課題通過使用數(shù)據(jù)庫中大量的數(shù)據(jù),通過生物信息學(xué)數(shù)據(jù)分析技術(shù),發(fā)現(xiàn)腫瘤基因組甲基化存在劇
7、烈變化,通過校正CpG位點(diǎn)的堿基突變,以及使用高斯函數(shù)對(duì)WGBS數(shù)據(jù)處理,消除了堿基突變以及相近CpG位點(diǎn)的影響后,提取各種腫瘤的甲基化狀態(tài)特異的位點(diǎn),以傳統(tǒng)統(tǒng)計(jì)學(xué)與深度神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法構(gòu)建深度神經(jīng)網(wǎng)絡(luò)(DNN)模型,通過大量真實(shí)數(shù)據(jù)的訓(xùn)練,校正、驗(yàn)證以及與現(xiàn)有模型性能比較。得到準(zhǔn)確性較高的兩個(gè)深度神經(jīng)網(wǎng)絡(luò)模型,分別為腫瘤類型區(qū)分模型(TTR_DNN)和早期腫瘤預(yù)測(cè)模型(ETP_DNN),對(duì)腫瘤類型的區(qū)分與早期腫瘤預(yù)測(cè)提供了一定幫助
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像分類模型的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于深度神經(jīng)網(wǎng)絡(luò)的人車分類算法.pdf
- 基于深度卷積神經(jīng)網(wǎng)絡(luò)的場(chǎng)景分類研究.pdf
- 基于深度神經(jīng)網(wǎng)絡(luò)的場(chǎng)景分類方法研究.pdf
- 基于神經(jīng)網(wǎng)絡(luò)的全基因組DNA甲基化預(yù)測(cè)研究.pdf
- 基于深度神經(jīng)網(wǎng)絡(luò)的文本表示與分類研究.pdf
- 基于深度神經(jīng)網(wǎng)絡(luò)的語音識(shí)別模型研究.pdf
- 甲基化與腫瘤
- 基于BP神經(jīng)網(wǎng)絡(luò)的腫瘤數(shù)據(jù)分類方法研究.pdf
- 基于稀疏表示和深度神經(jīng)網(wǎng)絡(luò)模型的西洋樂器自動(dòng)分類方法.pdf
- 基于深度神經(jīng)網(wǎng)絡(luò)補(bǔ)償模型的軌道預(yù)報(bào)技術(shù).pdf
- 基于循環(huán)神經(jīng)網(wǎng)絡(luò)模型的文本分類.pdf
- 基于深度脊波神經(jīng)網(wǎng)絡(luò)的極化SAR影像地物分類.pdf
- 基于深度神經(jīng)網(wǎng)絡(luò)與稀疏學(xué)習(xí)的極化SAR圖像分類.pdf
- 基于深度神經(jīng)網(wǎng)絡(luò)的回歸模型及其應(yīng)用研究.pdf
- 基于LVQ神經(jīng)網(wǎng)絡(luò)分層模型的遙感影像分類.pdf
- 基于深度神經(jīng)網(wǎng)絡(luò)的心電圖自動(dòng)分類方法研究與實(shí)現(xiàn).pdf
- 基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像分類方法研究及應(yīng)用.pdf
- 基于深度SVM和深度小波神經(jīng)網(wǎng)絡(luò)的極化SAR影像地物分類.pdf
- 基于深度神經(jīng)網(wǎng)絡(luò)的統(tǒng)計(jì)機(jī)器翻譯模型研究.pdf
評(píng)論
0/150
提交評(píng)論