版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、本論文的主要貢獻:1.建立了復旦大學蛋白質(zhì)組研究中心實驗平臺的數(shù)據(jù)模板,并應用于人類肝臟蛋白質(zhì)組計劃(Human Liver Proteome aroject,HLPP)的數(shù)據(jù)交流和管理,為大規(guī)模實驗數(shù)據(jù)管理和交流的標準化提供了實際經(jīng)驗和實現(xiàn)思路;2.基于2-DE(二維電泳)-MALDI-TOF/TOF(基質(zhì)輔助激光解析飛行時間質(zhì)譜)及類似的以蛋白質(zhì)為最終分離單元的組學實驗,提出了一種優(yōu)化的搜索策略,避免了因共享質(zhì)荷比所產(chǎn)生的假陽性結果
2、,同時采用迭代搜索全面反映單元內(nèi)的蛋白存在;3.針對MALDI-TOF/TOF的相關數(shù)據(jù),通過圖譜特征變量的提取和線性判別分析(Linear Discriminant Analysis,LDA),建立了PMF(PeptideMass Fingerprint)和PFF(Peptide Fragment Fingerprint)圖譜的評價模型,并應用于檢索質(zhì)量控制研究中;4.為配合人類肝臟蛋白質(zhì)組的數(shù)據(jù)分析,構建了四個參考數(shù)據(jù)集:人類及小鼠
3、肝臟蛋白質(zhì)組數(shù)據(jù)集、健康人血漿蛋白質(zhì)組數(shù)據(jù)集、健康人心臟蛋白質(zhì)組學數(shù)據(jù)集以及肝病相關基因及蛋白質(zhì)數(shù)據(jù)集;5.應用液相等電聚焦預富集方法(Liquid-phase Isoelectric Focusing,LIEF)對小鼠肝臟蛋白質(zhì)組進行分析,證明了LIEF和多實驗路線結合的策略在復雜樣本蛋白質(zhì)組學研究中的優(yōu)勢。
在復雜的生命過程中,蛋白質(zhì)是各種生命活動的具體實現(xiàn)者。1994年Williams正式提出了蛋白質(zhì)組的概念,199
4、5年Willkins正式提出了“Proteome(蛋白質(zhì)組)”的專業(yè)術語及其定義。十余年來,蛋白質(zhì)組學蓬勃發(fā)展,已成為生命科學、化學、信息科學等領域研究的重點與交叉的熱點,被廣泛地應用于各類模式生物和人類的探索之中。隨著生物質(zhì)譜技術的成熟,尤其是電噴霧(ESI)和基質(zhì)輔助激光解吸(MALDI)等接口技術在20世紀后期的突破性發(fā)展,質(zhì)譜檢測滿足了高通量、高分辨率的要求,逐漸替代了先前的Edman測序等生物化學手段進而成為蛋白質(zhì)組鑒定的首選
5、平臺。但從蛋白質(zhì)組學的發(fā)展現(xiàn)況來看,由于分離和檢測過程還存在諸多的不完善,實驗結果往往受蛋白質(zhì)分離效果、豐度、化學特性等因素的影響;而各類檢索算法也或多或少的存在缺陷。它們導致檢索結果中常伴隨有假陽性(False Positive)和假陰性(False Negative)的問題。而其解決需要實驗科學和信息科學雙方面的努力,其中除實驗技術不斷改進和發(fā)展外,數(shù)據(jù)處理流程的優(yōu)化及檢索質(zhì)量的控制至關重要,但至今仍缺乏公認的理想數(shù)據(jù)處理范本。本文
6、基于復旦大學蛋白質(zhì)組研究中心的生物質(zhì)譜平臺,對目前蛋白質(zhì)組數(shù)據(jù)處理流程中所涉及的數(shù)據(jù)標準化管理、檢索策略的優(yōu)化和質(zhì)量控制等重要方面,進行了系列嘗試,為進一步提高蛋白質(zhì)鑒定的可靠性,以及更精確地展示生物樣本的蛋白質(zhì)組提供了理論依據(jù)和實現(xiàn)思路。
論文共分六章,內(nèi)容摘要如下:
第一章:前言。概述了蛋白質(zhì)組學的發(fā)展歷程,對目前主要的技術體系和發(fā)展方向進行了評述。其中對蛋白質(zhì)組學研究中所涉及的數(shù)據(jù)處理方法,進行了詳細的
7、綜述,主要包括:數(shù)據(jù)處理流程、數(shù)據(jù)檢索軟件的分類及簡介、數(shù)據(jù)處理所面臨的挑戰(zhàn)和目前研究的熱點等。基于這些總結和評述,提出了本文的研究方向和思路。
第二章:蛋白質(zhì)組實驗流程及數(shù)據(jù)標準化管理初探。針對HLPP中復旦大學相關儀器設備與產(chǎn)出數(shù)據(jù)的特點,基于PSI(The Proteomics Standards Initiative)原則,對實驗流程和數(shù)據(jù)產(chǎn)出進行了信息抽提,并建立了相關的數(shù)據(jù)模板。其中,所涉及的實驗流程包含了目前
8、主流的實驗平臺,數(shù)字化地反映了雙向凝膠電泳(2-DE)、多維液相(MDLC)等分離技術及MALDI、ESI質(zhì)譜的實驗參數(shù)和數(shù)據(jù)參數(shù)。模板已應用于HLPP實際的數(shù)據(jù)交流和管理中,并為標準化管理大規(guī)模實驗數(shù)據(jù)提供了實際經(jīng)驗。
第三章:大規(guī)模質(zhì)譜數(shù)據(jù)分析中的非同質(zhì)荷比迭代檢索規(guī)則。由于目前分離過程尚無法保證每一分離單元只含一種蛋白質(zhì),因而常影響到后續(xù)的搜索過程,并產(chǎn)生假陽性或假陰性的匹配結果。在本章工作中,通過數(shù)據(jù)庫統(tǒng)計和對實驗
9、數(shù)據(jù)的模擬匹配,發(fā)現(xiàn)檢索結果之間質(zhì)荷比的共享是產(chǎn)生假陽性的重要原因。因此,本文提出了一種優(yōu)化的檢索策略,首先以改進的半小數(shù)規(guī)則和頻度限制對質(zhì)譜進行去噪處理,然后以匹配分數(shù)高低及是否包含共享質(zhì)荷比作為可信結果的評判標準,再將質(zhì)譜文件中己匹配的質(zhì)荷比進行過濾,產(chǎn)生新的質(zhì)譜搜索文件并進行迭代搜索,直到?jīng)]有可信結果產(chǎn)出為止。為進一步保證結果的可信度,反轉(zhuǎn)數(shù)據(jù)庫方法也被用于其中。在標準蛋白實驗和法國人肝蛋白質(zhì)組實驗中的應用顯示,非同質(zhì)荷比迭代規(guī)則
10、和反轉(zhuǎn)數(shù)據(jù)庫方法的結合可以更全面地反映蛋白質(zhì)組的組分,同時賦予了檢索結果更好的可信度。至此,為2-DE—MALDI TOF/TOF及類似實驗平臺,提供了一套系統(tǒng)可信的數(shù)據(jù)分析方法。
第四章:MALDI TOF/TOF質(zhì)譜圖譜的質(zhì)量評價及其在檢索質(zhì)量控制研究中的應用。作為生物質(zhì)譜數(shù)據(jù)分析的根本,質(zhì)譜圖譜的質(zhì)量與檢索結果之間息息相關,但目前相關研究所涉及的數(shù)據(jù)基本來源于離子阱質(zhì)譜(主要為LTQ,LCQ)的串級數(shù)據(jù),對于PMF圖
11、譜及基于MALDI TOF/TOF的串級數(shù)據(jù)的評價則非常少見。本文基于MALDI TOF/TOF所產(chǎn)生的大規(guī)模數(shù)據(jù),通過圖譜特征變量的提取和線性判別分析,建立了相應的PMF和PFF數(shù)據(jù)的評價模型。在評價模型的基礎上,通過反轉(zhuǎn)庫分析方法,進一步討論了PMF圖譜與相關PFF圖譜質(zhì)量之間的影響關系、圖譜質(zhì)量與蛋白質(zhì)檢索鑒定之間的關系,最終定義了WellQuality指數(shù),對源于同一分離單元的PMF和PFF的質(zhì)量進行了統(tǒng)一的評價。結果顯示,質(zhì)譜
12、質(zhì)量是決定蛋白質(zhì)匹配是否成功的決定性因素,好的圖譜往往是高質(zhì)量匹配的先決條件。Well Quality指數(shù)可以很好地反映分離單元質(zhì)譜檢測的優(yōu)劣,其指數(shù)與鑒定成功率和得分之間存在著明顯的線性關系。此外,對于質(zhì)量較好的圖譜,隨機匹配的可能性也在增加,因此本文同時采用了一種新的分數(shù)背景扣除方式進行質(zhì)量控制,取得了良好的效果。MALDI TOF/TOF圖譜的質(zhì)量評價為蛋白質(zhì)鑒定的質(zhì)量控制提供了新的思路,同時也對蛋白質(zhì)組學實驗優(yōu)化和機理研究提供了
13、新的途徑。
第五章:肝臟蛋白質(zhì)組參考數(shù)據(jù)集的建立及初步分析。對于組織樣本的大規(guī)模蛋白質(zhì)組研究方興未艾,所產(chǎn)生的數(shù)據(jù)量極其可觀。本章針對肝臟、血漿、心臟的蛋白質(zhì)組和肝病相關基因及蛋白質(zhì)的研究,建立了相關的參考數(shù)據(jù)集,并進行了初步分析。為保證數(shù)據(jù)的完備性和可靠性,基于NCBI PubMed醫(yī)學文獻數(shù)據(jù)庫,采用人工搜索和判讀的方式,對近年發(fā)表在國際知名雜志上的相關研究成果進行了遍歷查詢,并盡可能提取蛋白質(zhì)組研究的相關參數(shù)。最終構
14、建成四個參考數(shù)據(jù)集:人及小鼠肝臟蛋白質(zhì)組數(shù)據(jù)集、健康人血漿蛋白質(zhì)組數(shù)據(jù)集、健康人心臟蛋白質(zhì)組學數(shù)據(jù)集以及肝病相關基因及蛋白質(zhì)數(shù)據(jù)集。數(shù)據(jù)集的初步分析表明:各數(shù)據(jù)集的蛋白質(zhì)存在一定的交互,而HLPP數(shù)據(jù)集對各參考數(shù)據(jù)集的覆蓋均非常大。這樣的重疊很可能反映了機體內(nèi)各組織器官間的一些共性。同時作為機體最為重要的代謝器官,肝臟合成了很大部分的血漿蛋白,數(shù)據(jù)集間的高度交蓋暗示了肝臟對于人體的重要性。這些數(shù)據(jù)的收集和整理對相關科學研究提供了系統(tǒng)可信
15、的數(shù)據(jù)參考,有助于相關研究的深入和發(fā)展。
第六章基于液相等電聚焦預富集方法(LIEF)的小鼠肝臟蛋白質(zhì)組研究及數(shù)據(jù)分析。預分離技術已被證明可大大促進蛋白質(zhì)的鑒定效果,對低豐度蛋白尤其明顯。本章通過LIEF技術對小鼠肝臟中的蛋白質(zhì)進行了預富集,并結合二維凝膠電泳(2-DE)和一維反相色譜(SDS-PAGE RPLC)分析策略對富集的蛋白質(zhì)進行了分析。結果表明:LIEF技術可大大增加后續(xù)2-DE分析中蛋白質(zhì)斑點的數(shù)目,同時大幅
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于生物質(zhì)譜的糖蛋白質(zhì)組學研究.pdf
- 蛋白質(zhì)組學質(zhì)譜數(shù)據(jù)預處理新策略研究及應用.pdf
- 30186.蛋白質(zhì)質(zhì)譜數(shù)據(jù)處理方法的研究
- 基于生物質(zhì)譜的糖蛋白質(zhì)組學新技術新方法研究.pdf
- 生物質(zhì)譜技術研究及其在蛋白質(zhì)組學中的應用.pdf
- 基于生物質(zhì)譜的蛋白質(zhì)組學新方法研究磷酸化和糖基化修飾蛋白質(zhì).pdf
- 蛋白質(zhì)組表達譜基本生物信息學研究及全蛋白質(zhì)組等電點分布研究.pdf
- 基于串聯(lián)質(zhì)譜數(shù)據(jù)的蛋白質(zhì)-基因組學方法研究.pdf
- 蛋白質(zhì)組學質(zhì)譜數(shù)據(jù)深度解析關鍵問題研究.pdf
- 基于質(zhì)譜技術的蛋白質(zhì)組學方法對食品蛋白質(zhì)糖基化的研究.pdf
- 生物質(zhì)譜新技術及其在疾病蛋白質(zhì)組研究中的應用.pdf
- 人睪丸蛋白質(zhì)表達譜的構建及精子發(fā)生相關蛋白質(zhì)組學研究.pdf
- 蛋白質(zhì)組學質(zhì)譜數(shù)據(jù)分析的新方法研究開發(fā).pdf
- 蛋白質(zhì)組質(zhì)譜平臺實驗數(shù)據(jù)仿真生成研究.pdf
- 利用蛋白質(zhì)組學研究腎臟蛋白處理功能.pdf
- 生物質(zhì)譜新技術與新方法及其在蛋白質(zhì)組學中的應用研究.pdf
- 蛋白質(zhì)組肽段鑒定質(zhì)量控制方法的研究與應用.pdf
- 金屬標記結合生物質(zhì)譜的蛋白質(zhì)組相對定量及絕對定量新方法研究.pdf
- 建立基于富集指數(shù)的蛋白質(zhì)組學數(shù)據(jù)分析方法研究分泌蛋白質(zhì)組—小鼠樹突狀肉瘤細胞分泌蛋白質(zhì)組;正常人尿蛋白質(zhì)組動態(tài)變化過程中穩(wěn)定表達蛋白質(zhì)組作為潛在的生物標志物資源.pdf
- 蛋白質(zhì)組學proteomics
評論
0/150
提交評論