腫瘤Biomarker的計算系統(tǒng)生物學研究及生物網(wǎng)絡可視化軟件的開發(fā).pdf_第1頁
已閱讀1頁,還剩165頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、背景和目的
   近年來,大規(guī)模的生物分子相互作用數(shù)據(jù),特別是利用高通量手段研究并整理的蛋白質相互作用(Protein-protein interaction,PPI)數(shù)據(jù)庫和海量數(shù)據(jù)的發(fā)布,對于疾病,特別是腫瘤的研究著眼于在病理狀態(tài)下整個分子系統(tǒng)網(wǎng)絡的動態(tài)變化;同時,開始從系統(tǒng)、全局的角度出發(fā),研究疾病臨床綜合癥群和內在的生物分子網(wǎng)絡之間的關系,進一步改進疾病的分類標準,重新對疾病進行更準確的定義。
   腫瘤蛋白分子

2、標記(Protein Biomarker)的應用對腫瘤的診斷、預后和靶向治療有重要的作用;也為疾病的分類提供了有效依據(jù)。然而,由于腫瘤發(fā)生和發(fā)展過程中復雜病理機制,腫瘤Biomarker發(fā)掘的過程非常艱巨;到目前為止,只有9個腫瘤相關蛋白通過FDA認證,作為臨床檢測Biomarker用于癌癥的診斷檢測。在系統(tǒng)生物學蓬勃發(fā)展的背景下,作為候選的Biomarker應該從系統(tǒng)水平上進行研究,需要大規(guī)模收集數(shù)據(jù),探討腫瘤發(fā)生過程中關鍵的致病基因

3、和其下游的效應基因,選擇有效的診斷和治療Biomarker,盡量避免Biomarker選擇中高假陽性和假陰性等一系列問題。
   本課題,我們從系統(tǒng)生物學角度,探討了腫瘤蛋白Biomarker發(fā)掘的一系列問題。1)首次,從人類分子相互作用網(wǎng)絡、基因組、蛋白質組學,以及癌癥的疾病臨床綜合癥群的宏觀角度,分析1000多個經(jīng)驗型腫瘤蛋白Biomarker的性質,為腫瘤蛋白Biomarker發(fā)掘計算模型的構建,提供了生物學依據(jù);2)探討

4、腫瘤蛋白Biomarker發(fā)掘的算法,利用人類全局PPI網(wǎng)絡的信息和疾病表型關聯(lián)網(wǎng)絡的信息,進行模型構建,較傳統(tǒng)的有效的計算方法,效率進一步提高;3)以原發(fā)性肝細胞癌(HCC)和其重要的蛋白Biomarker-甲胎蛋白(AFP)為例,深入探討AFP在HCC發(fā)生和發(fā)展中的關系,比較AFP陽性、陰性HCC臨床樣本中基因表達差異并推斷了相關的分子機制;4)設計和研發(fā)面向多級(Muti-scale)生物網(wǎng)絡的可視化數(shù)據(jù)發(fā)掘工具--ProteoL

5、ens,通過兼容SQL語句,改進了傳統(tǒng)可視化工具的兼容性差,不能方便、有效的處理多樣的系統(tǒng)生物學數(shù)據(jù)的弱點;能夠更加有效的建立包含豐富注解信息的和多級生物學網(wǎng)絡,來理解復雜的生物學網(wǎng)絡的結構,從中挖掘有效的信息。我們的研究,旨在溝通生物學基礎研究和臨床醫(yī)學研究;并構架計算分析的平臺,使計算生物學家也能夠有效的參與腫瘤的診斷和治療這一重大問題中來。主要研究方法
   1、數(shù)據(jù)的收集和整理
   1)疾病基因,癌癥基因,腫瘤

6、蛋白Biomarker,必要基因,藥物靶分子基因;
   2)PPI網(wǎng)絡,TF-基因調節(jié)網(wǎng)絡,Pathway,基因共表達網(wǎng)絡;
   3)組織特異性數(shù)據(jù),組織表達數(shù)據(jù),Gene Ontology數(shù)據(jù),健康人血漿蛋白肽的圖譜數(shù)據(jù);
   4)分子ID映射,疾病術語,分子注解信息;
   2、腫瘤蛋白Biomarker的性質分析
   1)PPI網(wǎng)絡中拓撲性質比較;
   2)組織特異性比較;

7、
   3)表達范圍比較;
   4)Gene Ontology關鍵詞比較;
   5)Co-Pathway統(tǒng)計;
   6)共表達統(tǒng)計;
   3、癌癥表型特異性分子網(wǎng)絡的構建
   1)PPI網(wǎng)絡子網(wǎng);
   2)TF-基因調節(jié)子網(wǎng);
   4、腫瘤表型關聯(lián)網(wǎng)絡的定義與比較
   1)腫瘤疾病基因定義的疾病表型關聯(lián)網(wǎng)絡;
   2)腫瘤蛋白Biomark

8、er定義的疾病表型關聯(lián)網(wǎng)絡;
   3)GWAS疾病相關位點定義的疾病表型關聯(lián)網(wǎng)絡;
   4)網(wǎng)絡間通過構建相似性得分和鄰接矩陣聚類進行比較;
   5、SW-RWR算法設計和評估
   1)覆蓋率:
   2)敏感性;
   3)準確度;
   6、AFP分子演化的分析
   1)進化樹構建;
   2)結構域分析;
   3)基因調節(jié)區(qū)序列分析;

9、>   7、AFP+/-原發(fā)性肝細胞癌臨床樣本的基因表達差異分析
   1)肝細胞癌表達譜數(shù)據(jù)收集與整理;
   2)Meta-analysis;
   3)貝葉斯網(wǎng)絡和PPI網(wǎng)絡比較;
   4)基因功能分析;
   8、網(wǎng)絡可視化軟件ProteoLens的設計和實現(xiàn)
   1)基礎框架;
   2)Java編程實現(xiàn);
   3)系統(tǒng)生物學研究示例。
   研究

10、結果
   第一部分
   腫瘤蛋白Biomarker的性質分析
   為評估腫瘤蛋白Biomarker的特性,我們選擇疾病基因、癌癥基因、藥物靶蛋白和必要基因作為參照。
   1)各個功能集合之間的重疊的基因數(shù)目較少;
   2)腫瘤Biomarker在PPI網(wǎng)絡中的節(jié)點的平均度數(shù)小于癌癥基因和必要基因在PPI網(wǎng)絡中節(jié)點的平均度數(shù),但高于疾病基因和藥物靶蛋白的平均數(shù);
   3)腫瘤蛋白

11、Biomarker包含較多的組織特異性基因;
   4)腫瘤蛋白Biomarker中基因平均表達的組織數(shù)目甚至多于必要基因集合中的平均水平;
   5)腫瘤蛋白Biomarker集中共有385個顯著的GO術語,包括26個細胞模塊術語,0個分子功能術語和359個生物過程術語;
   6)腫瘤蛋白Biomarker在以疾病基因為種子擴張的PPI和PPI-TF-調節(jié)基因網(wǎng)絡中的分布:當選擇更加精確的的種子蛋白(接近癌癥

12、基因的時候)進行PPI和PPI-TF-調節(jié)基因網(wǎng)絡構建,與腫瘤蛋白Biomarker的交集占總腫瘤蛋白Biomarker集的比率顯著增大;
   7)腫瘤蛋白Biomarker和相應表型的疾病基因易于共表達并參與同一Pathway。
   構建基于腫瘤蛋白Biomarker疾病表型網(wǎng)絡(DBN)
   762個腫瘤蛋白Biomarker對應于59類不同的癌癥表型中,包含820個“Biomarker-疾病表型”關聯(lián)

13、,平均兩個癌癥表型有8個相同的Biomarer;每個Biomarker出現(xiàn)在13個癌癥表型中。所有59個結點,連接成一個聯(lián)通圖,沒有孤立結點或子網(wǎng)。
   比較DBN和基于疾病基因的疾病表型網(wǎng)絡(DAN)
   疾病基因和蛋白Biomarker描述的腫瘤表型之間關系具有等效性。
   第二部分
   SW-RWR算法
   是在隨機行走算法(Random Walks Ranking,RWR)的基礎

14、上,利用腫瘤表型關聯(lián)網(wǎng)絡的先驗知識,指導PPI網(wǎng)絡中隨機行走策略。SW-RWR是為解決腫瘤蛋白Biomarker發(fā)掘的問題對RWR算法的改進。
   SW-RWR算法對白血病蛋白Biomarker的排序
   1)從基于腫瘤Biomarker的表型關聯(lián)網(wǎng)絡中,依據(jù)相似性得分提取白血病相關的疾病表型;
   2)分析白血病與選擇的表型之間的相關性:與白血病相關聯(lián)的這5個癌癥表型,其疾病基因與白血病疾病基因之間通過蛋

15、白質相互作用緊密關聯(lián);
   3)SW-RWR選擇的20個蛋白的生物學意義分析,顯示出與白血病分子機制的強相關性;
   4)通過敏感性和準確率(使用陽性預測值,PPV)評估對白血病蛋白Biomarker的預測效力:SW-RWR優(yōu)于ZRWR。
   SW-RWR算法對肺癌蛋白Biomarker的排序
   1)建立基于GWAS的疾病表型關聯(lián)網(wǎng)絡:分別創(chuàng)建了3個疾病相關網(wǎng)絡(DAN),網(wǎng)絡結點為疾病表型,網(wǎng)

16、絡關聯(lián)分別定義為:疾病表型之間有相同的SNP位點(DAS)-DAN1,相同的DAS對應基因-DAN2,或相同的DAs對應的染色體區(qū)域-DAN3。共包含85個不同的節(jié)點,代表85個獨立疾病表型。
   2)DAN中抽取與肺癌關聯(lián)的子網(wǎng):確定5個肺癌相關的疾病表型,這5個疾病和肺癌在遺傳學上有相同的異?;?;這些疾病基因之間通過直接或間接地PPI相互連接,表示了疾病之間的分子機制的內在關聯(lián);同時,在病理研究上,這5個疾病也有與肺癌關

17、聯(lián)緊密的證據(jù)。
   3)SW-RWR選擇的20個蛋白的生物學意義分析;
   4)通過敏感性和準確率評估對肺癌蛋白Biomarker的預測效力:SW-RWR優(yōu)于RWR。
   第三部分
   AFP以及類自蛋白家族分子演化分析
   1)進化樹顯示,蛋白的進化與物種的進化是一致的,就AFP分支來看,雞較人、狗、大鼠、小鼠同源性較低,而更相似于其旁系同源物--雞ALB;大鼠與小鼠之間AFP同源性較

18、高,人與狗之間AFP同源性較高。類白蛋白家族成員,在魚類只存在一個,兩棲類有兩個,鳥類有三個,哺乳類有四個。
   2)結構域分析。在七鰓鰻中發(fā)現(xiàn)了具有多個結構域的白蛋白,由此可以推測,在原索動物或無脊椎動物中存在單個的類似白蛋白結構域的蛋白。來自于同一個蛋白的不同白蛋白結構域之間較與其直系同源蛋白對應的白蛋白結構域差別較大,可以推測,基因復制事件是以蛋白為單位的。類白蛋白家族成員,第一和第二結構域較第三結構域更為相似,可推斷最

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論