版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、人類基因組研究為我們提供了人類基因組圖譜,但基因組圖譜所能提供的基因組內(nèi)蘊(yùn)含的功能信息非常有限。為了系統(tǒng)闡釋其編碼基因的功能,以及其間的相互關(guān)系等,蛋白質(zhì)組研究日益受到關(guān)注。 蛋白質(zhì)組研究最根本的目標(biāo)是建立生物體組織或器官的蛋白質(zhì)組表達(dá)譜,以及隨后系統(tǒng)地闡明表達(dá)譜的生物學(xué)意義。至今,蛋白質(zhì)組的多種鑒定儀器已經(jīng)能以較高的通量進(jìn)行蛋白質(zhì)鑒定,這些技術(shù)為大規(guī)模的蛋白質(zhì)組表達(dá)譜研究奠定了基礎(chǔ)。然而,與高速發(fā)展的儀器相比較,適合于大規(guī)模
2、蛋白質(zhì)組表達(dá)譜研究的數(shù)據(jù)處理、整合及分析方法明顯滯后。雖然個別表達(dá)譜研究也建立了部分?jǐn)?shù)據(jù)處理、整合的方法,但至今仍然沒有一個系統(tǒng)、全面的數(shù)據(jù)處理、整合體系。蛋白質(zhì)鑒定的可靠性依然是蛋白質(zhì)質(zhì)譜鑒定的難點;而且,在質(zhì)譜產(chǎn)出數(shù)據(jù)和最終表達(dá)譜的系統(tǒng)生物學(xué)意義分析之間仍然存在著難以跨越的鴻溝。 為進(jìn)一步提高蛋白質(zhì)鑒定的可靠性,并填補(bǔ)蛋白質(zhì)質(zhì)譜鑒定和表達(dá)譜分析之間的鴻溝,為最終鑒定蛋白質(zhì)的生物學(xué)分析提供便利,本文在對現(xiàn)有研究的充分調(diào)研以及
3、對蛋白質(zhì)組表達(dá)譜需求詳細(xì)分析的基礎(chǔ)上,建立了多種策略以加強(qiáng)鑒定結(jié)果的可靠性,并為隨后的生物學(xué)分析提供了鑒定蛋白質(zhì)的基本注釋信息。 對于基因組序列已知的生物,數(shù)據(jù)庫搜索策略是最經(jīng)濟(jì)、最有效的蛋白質(zhì)鑒定方法。為獲得盡可能多高可靠性的鑒定結(jié)果,采用了分步搜索的策略:首先通過對一個質(zhì)量相對較高、覆蓋率較大的非冗余數(shù)據(jù)庫的搜索完成基本鑒定;其次,為了充分利用質(zhì)譜數(shù)據(jù),我們建立了用其它數(shù)據(jù)庫(包括蛋白質(zhì)數(shù)據(jù)庫和核酸數(shù)據(jù)庫)進(jìn)行分步搜索的策
4、略,完成了質(zhì)譜數(shù)據(jù)的補(bǔ)充鑒定和新蛋白質(zhì)挖掘。 由于數(shù)據(jù)庫搜索屬于一種模式匹配的策略,所用的質(zhì)譜鑒定結(jié)果往往不是特別精確,而且數(shù)據(jù)庫中也存在大量的相似蛋白質(zhì)或肽段,有時一個質(zhì)譜鑒定結(jié)果可能匹配不止一個蛋白質(zhì)或肽段。為了充分利用這些質(zhì)譜數(shù)據(jù),并準(zhǔn)確地描述肽段和蛋白質(zhì)鑒定的不精確性,建立了肽段和蛋白質(zhì)鑒定的Group模型。 對于肽質(zhì)量指紋譜的結(jié)果,針對其數(shù)據(jù)的特殊性,首先利用統(tǒng)計方法獲得樣品和儀器產(chǎn)生的噪音數(shù)據(jù),并通過Ho
5、ugh轉(zhuǎn)換獲得偏差較大的結(jié)果。通過對這些結(jié)果的去除,有效地排除了肽質(zhì)量指紋譜鑒定結(jié)果的不可靠肽段。此外,通過對同一個PMF鑒定結(jié)果聚類的方法解決了爭執(zhí)良久的MALDI-TOF/TOF結(jié)果中一個PMF結(jié)果鑒定多個蛋白質(zhì)時數(shù)據(jù)取舍的問題。 在上述盡量提高蛋白質(zhì)質(zhì)譜鑒定可靠性的基礎(chǔ)上,仍然需要對最終結(jié)果進(jìn)行可靠性評估。在現(xiàn)有可靠性評估方法的基礎(chǔ)上,建立了一種比現(xiàn)有方法更準(zhǔn)確估算鑒定結(jié)果的陽性(正確鑒定結(jié)果)和陰性(隨機(jī)匹配結(jié)果)分布
6、及比例的方法,即利用混合數(shù)據(jù)庫(正向數(shù)據(jù)庫+反向數(shù)據(jù)庫)和正向數(shù)據(jù)庫搜索結(jié)果結(jié)合進(jìn)行差減運算的方法。 最后,為了有效銜接蛋白質(zhì)質(zhì)譜鑒定結(jié)果和最終表達(dá)譜數(shù)據(jù)的生物學(xué)分析,建立了質(zhì)譜數(shù)據(jù)處理、整合和注釋系統(tǒng)。數(shù)據(jù)的處理首先用Group模型獲得鑒定結(jié)果的Group,隨后利用集合運算的方法進(jìn)行數(shù)據(jù)的整合:即先對有交叉蛋白質(zhì)的鑒定Group取并集,而后對屬于一個并集的所有Group進(jìn)行交集運算。最后獲得鑒定結(jié)果的Cluster(同一個并
7、集的所有Group)和Uniquegroup(交集的結(jié)果)。此外,為了展示Cluster內(nèi)部各Uniquegroup間的關(guān)系,借鑒進(jìn)化樹繪制的方法建立了Uniquegroup間樹形關(guān)系圖表示法。 這些數(shù)據(jù)處理和整合體系將獲得盡量可靠的鑒定蛋白質(zhì)列表。為便于最終的表達(dá)譜數(shù)據(jù)分析,在EBI和NCBI提供的核酸和蛋白質(zhì)相關(guān)信息的基礎(chǔ)上,建立了鑒定蛋白質(zhì)的注釋體系,為隨后的蛋白質(zhì)組表達(dá)譜分析提供了必要的信息。 上述多種策略是
8、在本實驗室人胎肝蛋白質(zhì)組表達(dá)譜研究、HLPP表達(dá)譜研究及CNHLPP標(biāo)準(zhǔn)蛋白的數(shù)據(jù)分析過程中逐步建立的,并在這些研究中得到了應(yīng)用,實踐證明,這些策略是行之有效的。 本研究能為大規(guī)模蛋白質(zhì)組表達(dá)譜研究獲得高可靠性的蛋白質(zhì)鑒定結(jié)果提供了較嚴(yán)格的數(shù)據(jù)處理、整合方法,有望在某種程度上降低蛋白質(zhì)鑒定的假陽性率。同時,這些方法也對小規(guī)模的蛋白質(zhì)鑒定等研究有一定的借鑒意義。 此外,本論文還包含了對全蛋白質(zhì)組等電點多峰分布現(xiàn)象的研究
9、。早在1988年,就有研究發(fā)現(xiàn)等電點近中性的蛋白質(zhì)非常缺乏。隨后的研究表明,等電點可能呈現(xiàn)雙峰或三峰的分布現(xiàn)象,并且這些峰可能和亞細(xì)胞定位有關(guān)系。為了驗證此結(jié)論,作者對多種不同生物全基因組編碼蛋白質(zhì)組及隨機(jī)蛋白質(zhì)組的等電點分布進(jìn)行仔細(xì)研究,發(fā)現(xiàn)這種多峰分布是不同生物蛋白質(zhì)組等電點分布的普遍現(xiàn)象,而且人類隨機(jī)蛋白質(zhì)組和全基因組編碼蛋白質(zhì)組的等電點分布非常相似。全蛋白質(zhì)組模擬2DE圖表明,多峰分布的根源在于低分子量區(qū)域等電點分布的不連續(xù)性。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 蛋白質(zhì)組學(xué)proteomics
- 蛋白質(zhì)組學(xué)題庫
- 蛋白質(zhì)組學(xué)技術(shù)
- 生物信息學(xué)方法研究蛋白質(zhì)相互作用.pdf
- 人睪丸蛋白質(zhì)表達(dá)譜的構(gòu)建及精子發(fā)生相關(guān)蛋白質(zhì)組學(xué)研究.pdf
- 植物磷酸化蛋白質(zhì)組的生物信息學(xué)分析.pdf
- 基于結(jié)構(gòu)生物信息學(xué)的蛋白質(zhì)設(shè)計.pdf
- 蛋白質(zhì)等電點測定
- IgA腎病組織蛋白質(zhì)組和尿液蛋白質(zhì)組研究.pdf
- 基于生物質(zhì)譜的糖蛋白質(zhì)組學(xué)研究.pdf
- 兒童惡性血液病血清蛋白質(zhì)組學(xué)研究及生物信息學(xué)分析.pdf
- 細(xì)粒棘球絳蟲原頭蚴蛋白質(zhì)組學(xué)研究及生物信息學(xué)分析.pdf
- 人附睪蛋白質(zhì)組學(xué)研究——技術(shù)平臺的建立和生物信息學(xué)分析.pdf
- 蛋白質(zhì)組化
- 2447.蛋白質(zhì)羥基化的生物信息學(xué)方法研究
- 鹽芥蛋白質(zhì)組學(xué)研究.pdf
- 冠心病蛋白質(zhì)組學(xué)研究.pdf
- 建立基于富集指數(shù)的蛋白質(zhì)組學(xué)數(shù)據(jù)分析方法研究分泌蛋白質(zhì)組—小鼠樹突狀肉瘤細(xì)胞分泌蛋白質(zhì)組;正常人尿蛋白質(zhì)組動態(tài)變化過程中穩(wěn)定表達(dá)蛋白質(zhì)組作為潛在的生物標(biāo)志物資源.pdf
- 小鼠卵巢蛋白質(zhì)表達(dá)譜的構(gòu)建及多囊卵巢綜合癥相關(guān)蛋白質(zhì)組學(xué)研究.pdf
- 蛋白質(zhì)泛素化的生物信息學(xué)分析.pdf
評論
0/150
提交評論