2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩50頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、研究背景及目的:DNA甲基化是目前最為常見(jiàn)與重要的表觀遺傳學(xué)特征,與腫瘤的發(fā)生發(fā)展有密切關(guān)系,在腫瘤形成的初期就已經(jīng)具有明顯的特征[1]。腫瘤基因組的甲基化水平除了與正?;蚪M相比發(fā)生劇烈變化外,不同腫瘤類(lèi)型之間也存在著較大差異。因此甲基化水平的變化可作為特異性的分子標(biāo)記用以區(qū)分腫瘤類(lèi)型。目前在臨床方面多采用一些特定的蛋白分子標(biāo)記、CT影像等病理指標(biāo)區(qū)分腫瘤類(lèi)型。但這些方法準(zhǔn)確性并不高,并且有些腫瘤在形成的初期,很難通過(guò)病理指標(biāo)檢測(cè)出來(lái)

2、。目前對(duì)于早期腫瘤診斷的研究多集中在血漿中游離的腫瘤DNA(ctDNA)的檢測(cè)[2],但目前這些技術(shù)尚不成熟,而且成本相對(duì)較高,公開(kāi)的測(cè)序數(shù)據(jù)也較少。在基因組學(xué)分析方面,盡管測(cè)序技術(shù)日漸成熟,許多腫瘤發(fā)生機(jī)制在分子生物學(xué)領(lǐng)域得到解釋?zhuān)珜?duì)于腫瘤基因組,目前的研究大多關(guān)注于一些原癌基因以及抑癌基因區(qū)域位點(diǎn)的突變以及啟動(dòng)子區(qū)域甲基化狀態(tài)改變[3],對(duì)于多種腫瘤類(lèi)型的區(qū)分及早期腫瘤的預(yù)測(cè)并沒(méi)有非常有效的生物信息學(xué)方法。因此尋找一種對(duì)腫瘤類(lèi)型的

3、區(qū)分與早期腫瘤預(yù)測(cè)提供幫助的方法就顯得尤為重要。
  研究方法及結(jié)果:本課題使用的數(shù)據(jù)為T(mén)CGA數(shù)據(jù)庫(kù)中包含24種腫瘤類(lèi)型的Illumina450K數(shù)據(jù),GE0數(shù)據(jù)庫(kù)和Roadmap Epigenomics數(shù)據(jù)庫(kù)中的WGBS的數(shù)據(jù)以及模擬數(shù)據(jù)。對(duì)于Illumina450K的數(shù)據(jù),使用其提供的計(jì)算好的β值作為甲基化水平;對(duì)于WGBS數(shù)據(jù),使用序列比對(duì)軟件比對(duì)到參考基因組上,通過(guò)校正CpG位點(diǎn)的堿基突變以及使用高斯函數(shù)對(duì)數(shù)據(jù)的進(jìn)一步處

4、理,消除了堿基突變以及相近CpG位點(diǎn)的影響,得到較為準(zhǔn)確的甲基化水平。經(jīng)過(guò)計(jì)算兩種類(lèi)型的數(shù)據(jù)同種組織相同位點(diǎn)甲基化狀態(tài)的相關(guān)性系數(shù),可得出兩種數(shù)據(jù)有非常高的相關(guān)性,能夠共同使用。數(shù)據(jù)經(jīng)過(guò)前期處理后,使用統(tǒng)計(jì)學(xué)方法去除了在各種腫瘤組織之間表現(xiàn)相似甲基化狀態(tài)的位點(diǎn)、與對(duì)應(yīng)正常組織相比沒(méi)有明顯甲基化狀態(tài)變化的位點(diǎn)以及未落在基因組有明確功能區(qū)域的位點(diǎn)后,共得到1894個(gè)有明顯甲基化狀態(tài)差異的位點(diǎn)。將最后得到的CpG位點(diǎn)作為特征值,構(gòu)建深度神經(jīng)網(wǎng)

5、絡(luò)模型的訓(xùn)練集。對(duì)于腫瘤類(lèi)型的區(qū)分和早期腫瘤預(yù)測(cè)分別構(gòu)建了不同的深度神經(jīng)網(wǎng)絡(luò)模型(DNN),這兩個(gè)模型的整體結(jié)構(gòu)相同,均包含一個(gè)輸入層,五個(gè)隱藏層以及一個(gè)輸出層,選用Sigmoid函數(shù)作為激活函數(shù),使用克羅內(nèi)克符號(hào)構(gòu)建標(biāo)記矩陣。不同的是,早期腫瘤預(yù)測(cè)模型其輸入的特征值、每一層的神經(jīng)元數(shù)量以及學(xué)習(xí)效率與腫瘤類(lèi)型的區(qū)分模型存在差異。其輸入特征值除了去除沒(méi)有WGBS數(shù)據(jù)的組織外,還將去除白細(xì)胞和白血病這兩個(gè)組織的特異性位點(diǎn)。之所以采取這樣的策

6、略是因?yàn)槲覀兊哪M數(shù)據(jù)將采用各類(lèi)腫瘤組織數(shù)據(jù)與正常的白細(xì)胞數(shù)據(jù)按一定比例混合的方式生成,為了盡可能真實(shí)的模擬數(shù)據(jù),混合時(shí)腫瘤組織所占比例較小,因此需要去除這兩個(gè)組織的特異性位點(diǎn)的影響。兩個(gè)模型經(jīng)過(guò)多次迭代訓(xùn)練,校正并且與已有的模型包括K最近鄰,樸實(shí)貝葉斯,logistic回歸,支持向量機(jī),隨機(jī)森林比較,表現(xiàn)出了更為理想的準(zhǔn)確率。
  研究結(jié)論:本課題通過(guò)使用數(shù)據(jù)庫(kù)中大量的數(shù)據(jù),通過(guò)生物信息學(xué)數(shù)據(jù)分析技術(shù),發(fā)現(xiàn)腫瘤基因組甲基化存在劇

7、烈變化,通過(guò)校正CpG位點(diǎn)的堿基突變,以及使用高斯函數(shù)對(duì)WGBS數(shù)據(jù)處理,消除了堿基突變以及相近CpG位點(diǎn)的影響后,提取各種腫瘤的甲基化狀態(tài)特異的位點(diǎn),以傳統(tǒng)統(tǒng)計(jì)學(xué)與深度神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法構(gòu)建深度神經(jīng)網(wǎng)絡(luò)(DNN)模型,通過(guò)大量真實(shí)數(shù)據(jù)的訓(xùn)練,校正、驗(yàn)證以及與現(xiàn)有模型性能比較。得到準(zhǔn)確性較高的兩個(gè)深度神經(jīng)網(wǎng)絡(luò)模型,分別為腫瘤類(lèi)型區(qū)分模型(TTR_DNN)和早期腫瘤預(yù)測(cè)模型(ETP_DNN),對(duì)腫瘤類(lèi)型的區(qū)分與早期腫瘤預(yù)測(cè)提供了一定幫助

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論