頭頸部鱗癌放射敏感性的文本挖掘和基因表達(dá)數(shù)據(jù)分析.pdf_第1頁(yè)
已閱讀1頁(yè),還剩116頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、目的:頭頸部癌是全球常見(jiàn)的腫瘤之一,涉及頸部、耳鼻喉以及口腔頜面三大部位,其原發(fā)部位之多居全身腫瘤之首。鱗狀細(xì)胞癌(以下簡(jiǎn)稱頭頸部鱗癌)是頭頸部癌的主要病理組織學(xué)類型,占比超過(guò)90%。并且,在全世界范圍內(nèi),頭頸部鱗癌約占每年新診斷腫瘤病例的8%。來(lái)自不同部位的頭頸部鱗癌具有相似的流行病學(xué)特征及臨床治療策略,其中放射治療是頭頸部鱗癌重要的治療方式之一。
  但在臨床實(shí)踐中,不是所有的頭頸部鱗癌患者都對(duì)放療比較敏感。即使在臨床期別、病

2、理分級(jí)、腫瘤體積、淋巴轉(zhuǎn)移等臨床病理因素等都相同的條件下,頭頸部鱗癌患者之間的放療效果也存在較大差別,仍有相當(dāng)數(shù)量的患者在放療后出現(xiàn)殘?jiān)睢⒕植繌?fù)發(fā)和遠(yuǎn)處轉(zhuǎn)移等疾病進(jìn)展,預(yù)后不良。這表明不同個(gè)體頭頸部鱗癌的放射敏感性存在顯著不同,可能因腫瘤細(xì)胞內(nèi)源性放射抵抗所致。近年來(lái),全球的研究人員開(kāi)展了較多的頭頸部鱗癌放射敏感性相關(guān)研究,獲得的研究發(fā)現(xiàn)增進(jìn)了人們對(duì)其分子機(jī)制的理解,但有些結(jié)果仍然存在爭(zhēng)議,關(guān)于頭頸部鱗癌放射敏感性的具體機(jī)制仍不清楚。因

3、此有必要從新的視角進(jìn)一步詳細(xì)研究,探討頭頸部鱗癌的放射抵抗分子機(jī)制。
  本研究通過(guò)文本挖掘技術(shù)和基因表達(dá)分析技術(shù)對(duì)頭頸部鱗癌的放射敏感性進(jìn)行生物信息學(xué)分析,抽取文獻(xiàn)中的相關(guān)基因,預(yù)測(cè)新的候選基因,篩選放射抵抗和放射敏感組頭頸部鱗癌細(xì)胞系基因芯片的差異表達(dá)基因,構(gòu)建蛋白質(zhì)相互作用網(wǎng)絡(luò),并進(jìn)行基因功能富集,以識(shí)別出頭頸部鱗癌放射敏感性相關(guān)的重要基因,闡明相關(guān)的分子機(jī)制,為進(jìn)一步開(kāi)展頭頸部鱗癌放射敏感性研究及開(kāi)發(fā)與應(yīng)用靶向放射增敏藥物

4、提供新思路。
  研究方法:本研究從文本挖掘和基因表達(dá)芯片數(shù)據(jù)分析兩個(gè)方面對(duì)人類頭頸部鱗癌放射敏感性開(kāi)展生物信息學(xué)分析。
  (1)利用文獻(xiàn)挖掘人類頭頸部鱗癌放射敏感性相關(guān)基因:首先,利用PubMed數(shù)據(jù)庫(kù)檢索人類頭頸部鱗癌放射敏感性相關(guān)基因的文獻(xiàn)。應(yīng)用PubTator工具對(duì)題目文摘中的基因進(jìn)行標(biāo)識(shí)后,利用自編的R程序提取標(biāo)識(shí)后的基因和相應(yīng)文獻(xiàn)的PMID號(hào);另一方面,對(duì)利用高通量技術(shù)進(jìn)行研究的文獻(xiàn),將其全文相關(guān)表格中的基因進(jìn)

5、行人工抽取。應(yīng)用HPRD和BioGRID數(shù)據(jù)庫(kù)查詢抽取基因編碼的蛋白質(zhì)間相互作用關(guān)系對(duì),導(dǎo)入Cytoscape軟件中構(gòu)建基因編碼蛋白質(zhì)相互作用網(wǎng)絡(luò),根據(jù)CentiScaPe2.1插件計(jì)算網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)參數(shù),分析網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),根據(jù)4個(gè)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)度量指標(biāo)(度、介數(shù)、接近中心性、特征向量中心性)找出編碼網(wǎng)絡(luò)中重要節(jié)點(diǎn)蛋白質(zhì)的關(guān)鍵基因;采用DAVID在線工具對(duì)提取的全部相關(guān)基因和關(guān)鍵基因分別進(jìn)行GO功能和KEGG通路富集分析。將提取的頭頸部鱗癌

6、放射敏感性相關(guān)基因編碼蛋白質(zhì)作為種子,根據(jù)最近鄰居擴(kuò)增法,構(gòu)建蛋白質(zhì)相互作用網(wǎng)絡(luò),挖掘新的頭頸部鱗癌放射敏感性候選基因,對(duì)通過(guò)擴(kuò)大的網(wǎng)絡(luò)預(yù)測(cè)得到的排秩靠前的候選基因進(jìn)行GO功能和KEGG通路富集分析研究,來(lái)進(jìn)一步考證其與頭頸部鱗癌放射敏感性的相關(guān)性。
  (2)對(duì)人類頭頸部鱗癌細(xì)胞系放射敏感性基因表達(dá)芯片進(jìn)行整合分析:在GEO數(shù)據(jù)庫(kù)中檢索人類頭頸部鱗癌細(xì)胞系放射敏感性基因表達(dá)芯片研究系列,下載數(shù)據(jù)集。本研究共納入4個(gè)數(shù)據(jù)集(GSE

7、9712、GSE9713、GSE9714和GSE48501),涉及兩種芯片平臺(tái)、SCC-61和CNE2兩個(gè)細(xì)胞系。用R軟件affy包的MAS5算法對(duì)原始芯片進(jìn)行預(yù)處理,獲得基因探針的原始表達(dá)值,然后進(jìn)行以2為底的對(duì)數(shù)轉(zhuǎn)換。因本研究納入了不同平臺(tái)的芯片數(shù)據(jù),故對(duì)每個(gè)基因探針經(jīng)對(duì)數(shù)轉(zhuǎn)化的表達(dá)值進(jìn)行全局標(biāo)準(zhǔn)化,分別在各個(gè)研究數(shù)據(jù)集中將其轉(zhuǎn)化為z-分?jǐn)?shù)。對(duì)放射抵抗組和放射敏感組的頭頸部鱗癌樣本的每個(gè)基因的z-分?jǐn)?shù)執(zhí)行t檢驗(yàn),選取Benjamin

8、i andHochberg法校正后P值<0.05為顯著性閾值,識(shí)別差異表達(dá)基因。在R軟件中使用pheatmap程序包繪制差異表達(dá)基因z-分?jǐn)?shù)—樣本的雙聚類熱圖,可視化樣本被差異表達(dá)基因分類的效果。應(yīng)用HPRD和BioGRID數(shù)據(jù)庫(kù),一方面篩選差異基因編碼蛋白質(zhì)間的相互作用關(guān)系對(duì),另一方面篩選差異基因編碼蛋白質(zhì)與整個(gè)基因組范圍內(nèi)蛋白質(zhì)間的相互作用關(guān)系對(duì)。用Cytoscape構(gòu)建差異基因編碼蛋白質(zhì)相互作用網(wǎng)絡(luò)圖,找到重要的節(jié)點(diǎn)基因;構(gòu)建差異

9、基因編碼蛋白質(zhì)相關(guān)的蛋白質(zhì)相互作用網(wǎng)絡(luò),并利用Cytoscape的插件ClusterONE進(jìn)行模塊聚類分析,獲得重要的功能模塊及中心基因。采用DAVID工具對(duì)差異表達(dá)基因以及顯著功能模塊的基因分別進(jìn)行GO功能和KEGG通路富集分析,理解基因的作用機(jī)制。
  結(jié)果:(1)本研究共納入551篇人類頭頸部鱗癌放射敏感性基因研究的文獻(xiàn),抽取到534個(gè)頭頸部鱗癌放射敏感性基因。這些基因編碼蛋白質(zhì)相互作用網(wǎng)絡(luò)圖共包含457個(gè)節(jié)點(diǎn),3198個(gè)邊

10、,發(fā)現(xiàn)了TP53、HSP90AA1、EGFR、EP300、BRCA1等39個(gè)關(guān)鍵基因,通過(guò)富集分析發(fā)現(xiàn)涉及PI3K-Akt信號(hào)通路、HIF-1信號(hào)通路、局部粘附等生物學(xué)通路和功能術(shù)語(yǔ)。此外,通過(guò)擴(kuò)展的蛋白質(zhì)相互作用網(wǎng)絡(luò)分析,新挖掘出NTRK1、ELAVL1、ESR1、APP、NR3C1等139個(gè)候選基因。(2)通過(guò)對(duì)GEO數(shù)據(jù)庫(kù)的4個(gè)頭頸部鱗癌細(xì)胞系放射敏感性基因表達(dá)數(shù)據(jù)集的整合分析,獲得STC2、NMI、LIMCH1、STAT1、DC

11、N、NR3C1等175個(gè)差異表達(dá)基因,聚類熱圖顯示這些基因可以明顯地將樣本劃分為放射抵抗和放射敏感兩個(gè)組別。其中DCN、FAS、STAT1、AREG等11個(gè)(6.29%)差異表達(dá)基因已有文獻(xiàn)報(bào)道;5個(gè)(2.86%)差異表達(dá)基因也是通過(guò)文本挖掘預(yù)測(cè)出的新基因,具體為NR3C1、YWHAB、CAND1、HNRNPD、SMARCA4。通過(guò)差異表達(dá)基因編碼蛋白相互作用網(wǎng)絡(luò)發(fā)現(xiàn),STAT1是連通度最高的蛋白質(zhì)編碼基因。構(gòu)建的差異表達(dá)基因相關(guān)的蛋白

12、質(zhì)相互作用網(wǎng)絡(luò)共含3641個(gè)節(jié)點(diǎn)、5587條邊,模塊聚類后,選取前10個(gè)顯著的功能子模塊進(jìn)行分析,模塊內(nèi)中心節(jié)點(diǎn)基因依次為NMI、RCHY1、DCN、PDCD6、NR3C1、DNM1、TAB2、AP3S1、AFF4、MPDZ。差異表達(dá)基因及功能模塊內(nèi)基因富集的GO術(shù)語(yǔ)和KEGG通路主要與局部粘附、自噬調(diào)節(jié)、細(xì)胞凋亡等有關(guān)。
  結(jié)論:(1)利用文本挖掘技術(shù)從PubMed數(shù)據(jù)庫(kù)已發(fā)表文獻(xiàn)中抽取基因,全面展示了現(xiàn)有頭頸部鱗癌放射敏感性

13、相關(guān)基因的研究現(xiàn)狀,確定了39個(gè)關(guān)鍵基因,并挖掘出了新的候選基因。(2)對(duì)GEO數(shù)據(jù)庫(kù)多個(gè)數(shù)據(jù)集和不同芯片平臺(tái)的頭頸部鱗癌細(xì)胞系放射敏感性基因表達(dá)數(shù)據(jù)的整合分析,識(shí)別出了放射抵抗和放射敏感組間的差異表達(dá)基因,并通過(guò)蛋白質(zhì)相互作用網(wǎng)絡(luò)聚類分析獲得了重要的功能模塊和中心節(jié)點(diǎn)基因。(3)將文獻(xiàn)數(shù)據(jù)和基因表達(dá)數(shù)據(jù)分析結(jié)果相結(jié)合,有助于系統(tǒng)探究和深入剖析頭頸部鱗癌共同的放射抵抗機(jī)制,發(fā)現(xiàn)了STAT1、DCN等基因是重要的差異表達(dá)基因,預(yù)測(cè)出NMI

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論