2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩275頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、目的:
  前列腺癌是歐美等發(fā)達國家和地區(qū)最常見的男性惡性腫瘤之一,其死亡率已居各種癌癥的第二位。前列腺癌的發(fā)生是多種調(diào)控因子共同作用的結(jié)果,然而前列腺癌的發(fā)生機制至今尚未明確。那么如何尋找治療前列腺癌的有效靶點成為了亟待解決的問題。隨著生物大規(guī)模分型技術(shù)的發(fā)展使全基因組范圍尋找前列腺癌風險靶點成為可能,如單核苷酸多態(tài)性(SingleNucleotidePolymorphism,SNP)位點分型。在這項研究中,全基因組關(guān)聯(lián)研究(G

2、enome-WideAssociationStudies,GWAS)通過大量比較疾病患者(病例,case)和相同條件下的無該疾病的人(對照,control)的SNP-表型關(guān)聯(lián)來尋找疾病的潛在風險靶點。另外一種方法是通過基因芯片技術(shù)大規(guī)模篩選前列腺癌的差異表達基因,然后通過基因本體、通路富集分析或基因網(wǎng)絡(luò)分析對這些差異表達基因進一步篩選以獲得潛在的基因治療靶點。但以上兩種研究方法都具有一定的局限性。雖然全基因組關(guān)聯(lián)研究發(fā)現(xiàn)了大量的疾病風險

3、SNPs,但相對全基因組SNPs來說仍然只是極小的一部分。而且研究發(fā)現(xiàn)絕大部分報導的SNPs都不處于基因編碼區(qū),這就意味著如何來解釋這些SNPs的功能是整個研究最大的難題。另外,基因差異表達篩選旨在尋找單個或多個最具可能的致病基因,然而這些基因的致病機制卻沒有得到有效的闡明,如在整個疾病的生物學過程中這些基因之間或與其他基因是否有相互作用,是如何相互作用的?
  方法:
  一、前列腺癌風險位點的后GWAS功能分析
 

4、 1.提取GWASCatalog數(shù)據(jù)庫報導的前列腺癌的風險SNPs,通過連鎖不平衡(linkagedisequilibrium,LD)獲得所有可能的風險SNPs;從文獻及公共數(shù)據(jù)庫搜集淋巴細胞系(lymphoblastoidcelllines,LCLs)相關(guān)的表達數(shù)量性狀座(expressionQuantitativeTraitLoci,eQTL)數(shù)據(jù);
  2.使用ANNOVAR軟件對所有SNPs進行注釋分析;使用UCSC數(shù)據(jù)庫

5、現(xiàn)有的已知調(diào)控數(shù)據(jù)對所有SNPs進行注釋分析;使用eQTL對非編碼區(qū)的SNPs進行注釋分析;獲得前列腺癌關(guān)聯(lián)基因;
  3.對前列腺癌關(guān)聯(lián)基因進行基因本體(GeneOntology,GO)、通路富集分析;建立并分析前列腺癌特有的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)。
  二、前列腺癌關(guān)聯(lián)SNPs顯著富集在cis-eQTL和轉(zhuǎn)錄因子結(jié)合位點(transcriptionfactorbindingsites,TFBS)
  1.定義前列腺癌GWAS

6、中p<10-3的SNPs為高關(guān)聯(lián)SNPs;從美國國家生物技術(shù)信息中心(NationalCenterforBiotechnologyInformation,NCBI)dbGaP數(shù)據(jù)庫下載GWAS數(shù)據(jù):TheCancerGeneticMarkersofSusceptibility(CGEMS)和TheMultiethnicCohort(MEC);從公共數(shù)據(jù)庫seeQTL和RegulomeDB中分別提取eQTL和TFBS數(shù)據(jù);
  2.

7、分別使用randomization和permutation方法檢驗高關(guān)聯(lián)SNPs是否顯著富集于eQTL和/或TFBS;
  3.從GWASCatalog數(shù)據(jù)庫提取報導的癌癥關(guān)聯(lián)SNPs,使用randomization檢驗這些SNPs的eQTL和TFBS富集情況;
  4.對eQTL和TFBS的富集結(jié)果進行整合分析,獲得潛在功能SNPs靶點。
  三、基于GO的前列腺癌基因共表達模塊
  1.從前列腺癌基因表達芯片

8、數(shù)據(jù)和GO中生物過程(biologicalprocess,GO_BP)基因集(term)出發(fā),構(gòu)建每個term的基因表達矩陣;
  2.利用WGCNA計算每個GO_BPterm在兩個獨立前列腺癌基因表達矩陣間的保守程度;
  3.利用WGCNA對每個保守的BP_term建立共表達scale-free網(wǎng)絡(luò)并進行聚類分析,獲得共表達模塊;
  4.計算共表達模塊的顯著性:1)計算每個共表達模塊的eigengene表達,并判

9、斷模塊是否在疾病-對照(case-control)組間存在差異表達,2)如果模塊存在差異表達,則進一步計算模塊的保守程度;
  5.對4中得到的重要模塊進行基因富集分析,如eQTL、拷貝數(shù)變異(CopyNumberVariation,CNV)和突變(Mutation)基因集;
  6.如果模塊在顯著富集eQTL基因的前提下,也能在CNV和/或Mutation基因集中顯著富集,這個模塊將被定義為前列腺癌風險性模塊。我們進一步對

10、這些風險性模塊進行轉(zhuǎn)錄因子(transcriptionfactor,TF)和小RNA(microRNA,miRNA)富集,獲得能調(diào)控這些模塊的TF和miRNA。同時我們也檢驗了這些富集的TF基因的差異表達情況。
  結(jié)果:
  一、前列腺癌風險位點的后GWAS功能分析
  從GWASCatalog中我們一共提取了49個SNPs,經(jīng)過LD計算一共獲得1828個前列腺癌潛在風險SNPs。ANNOVAR注釋表明有8,599,

11、377,4,12,6和10個SNPs分別位于外顯子,內(nèi)含子,剪切位點,非編碼RNA,3’UTR,5’UTR,基因上游,基因下游區(qū)域,而其余的852個SNPs則位于非基因區(qū)。UCSC注釋結(jié)果表明1828個SNPs中,有284個SNPs位于UCSC定義的調(diào)控區(qū)域內(nèi),而這284個SNPs僅包含了86個非基因區(qū)的SNPs。對所有非基因區(qū)SNPs而言,eQTL比對解釋了其中138個SNPs。綜合ANNOVAR注釋,eQTL比對結(jié)果及GWASCat

12、alog本身報導的基因,我們共得到了205個前列腺癌風險基因,其中41個來自ANNOVAR注釋,151個來自于eQTL比對,33個來自GWAS文獻報導。通過GO及通路富集,我們發(fā)現(xiàn)這些基因能有效的富集在癌癥相關(guān)的通路上,如細胞死亡調(diào)控,細胞凋亡,細胞增殖等。通過分析前列腺癌調(diào)控網(wǎng)絡(luò),我們發(fā)現(xiàn)了一些重要的癌癥調(diào)控因子,如IGF-1/IGF-2受體,SP1,CREB1,AR等轉(zhuǎn)錄因子。
  二、前列腺癌關(guān)聯(lián)SNPs顯著富集在cis-e

13、QTL和轉(zhuǎn)錄因子結(jié)合位點(transcriptionfactorbindingsites,TFBS)
  通過randomization和permutation計算結(jié)果對比,我們發(fā)現(xiàn)在前列腺癌GWASSNPs含有相對較少eQTLSNPs(eSNPs)情況下,randomization會導致假陰性,permutation則更為準確。富集分析發(fā)現(xiàn)白種人群的GWASSNPs顯著地富集在cis-eQTL和TFBS,但在美國黑人和日本人群中

14、,我們卻并沒有發(fā)現(xiàn)這種顯著的富集模式。同時我們對GWASCatalog的SNPs進行分析,也發(fā)現(xiàn)了這一種群差異性的富集模式。另外對CGEMS數(shù)據(jù)的整合分析我們發(fā)現(xiàn)了2個并沒有在GWAS平臺中出現(xiàn)的功能SNPs,rs2861405和rs4766642,可以通過eQTL和TFBS行駛調(diào)控功能。
  三、基于GO的前列腺癌基因共表達模塊
  首先我們發(fā)現(xiàn)了118個GO_BPterms在兩個數(shù)據(jù)集間(GSE17951,GSE6956

15、)具有較高的保守性(Zsummary>5)。利用這118個term的基因表達矩陣,我們共建立了548個共表達模塊,其中有294個模塊和前列腺癌有顯著關(guān)聯(lián)(p<0.05)。對這294個模塊進一步分析,我們發(fā)現(xiàn)有55個模塊在GSE17951和GSE6956間具有很好的保守性(Zsummary>5)。然后我們使用eQTL、CNV和Mutation基因集對這55個模塊進行富集分析,并發(fā)現(xiàn)了5個前列腺癌風險模塊M1~M5。TF富集分析結(jié)果表明M1

16、和M5模塊主要被NFAT調(diào)控,M2,M3和M4模塊主要被SP1調(diào)控;miRNA富集分析表明M1和M3被has-miR-19a調(diào)控,M4和M5被has-miR-15a調(diào)控,M2被has-miR-200b調(diào)控。
  結(jié)論:
  一、我們建立了系統(tǒng)生物學水平上前列腺癌GWASSNPs的整合分析。通過注釋、GO/通路富集和調(diào)控網(wǎng)絡(luò)構(gòu)建能有效闡明SNPs的作用機制,特別是那些位于非基因區(qū)的SNPs的調(diào)控功能。
  二、前列腺癌關(guān)

17、聯(lián)SNPs的調(diào)控機制具有種群差異性,即白種人群的關(guān)聯(lián)SNPs主要通過eQTL和TFBS這兩種方法來調(diào)控基因的表達,而美國黑人或日本人群的關(guān)聯(lián)SNPs可能通過其他方法來進行調(diào)控。
  三、通過建立及分析基于GO的前列腺癌共表達模塊,我們回答了(1)哪些GO項與前列腺癌潛在相關(guān),(2)GO項的哪些基因的可以形成共表達模塊,(3)哪些共表達模塊與前列腺癌相關(guān),(4)哪些共表達模塊能顯著富集癌基因的信號以及最終發(fā)現(xiàn)的共表達模塊又是由什么遺

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論