版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、當前蛋白質(zhì)鑒定的研究中,通過串聯(lián)質(zhì)譜鑒定多肽序列從而鑒定蛋白質(zhì)是最廣泛使用的技術(shù)。實驗中,從色譜中分離出來的多肽經(jīng)過CID過程被裂解成碎片離子,這些離子的質(zhì)量/電荷比值(m/z)被質(zhì)譜儀器檢測到,形成串聯(lián)質(zhì)譜。采用數(shù)據(jù)庫搜索方法或者De novo從頭解序方法,可從這些碎片離子的m/z值中鑒定出多肽的序列來。 然而,不管采用什么計算方法進行多肽序列的鑒定,高分辨率串聯(lián)質(zhì)譜數(shù)據(jù)的特點決定了其在計算上的困難。質(zhì)譜中大量的物理噪聲和
2、離子的同位素峰,增加了多肽序列鑒定過程的計算量,而且使得隨機匹配的可能性增高,從而導致鑒定的結(jié)果可靠性降低。此外,質(zhì)譜中數(shù)據(jù)中的質(zhì)量測量誤差直接影響多肽鑒定結(jié)果。因此,在進行多肽序列鑒定之前,對質(zhì)譜數(shù)據(jù)進行預處理非常關(guān)鍵。 本文從理論、算法和應用三個層次來討論對串聯(lián)質(zhì)譜數(shù)據(jù)的預處理技術(shù),實現(xiàn)對質(zhì)譜數(shù)據(jù)的多種預處理,包括過濾質(zhì)譜中的物理噪聲、過濾同位素峰、預測離子對應的分子式、識別質(zhì)譜的測量誤差等。通過這些預處理,最終降低序列
3、鑒定過程的計算量、提高單個質(zhì)譜的鑒定可靠性、以及提高能能鑒定出多肽的質(zhì)譜個數(shù),從而提高蛋白質(zhì)鑒定的可靠性。 本文首先提出一個關(guān)鍵的同位素模式概念,可以定量地刻畫離子的一系列同位素在質(zhì)量、豐度上的特征;并給出了計算離子的理論和實驗同位素模式的公式,在此基礎上可進行多種討論,比如區(qū)分質(zhì)譜中離子和噪聲對應的譜峰、預測離子的分子式、估計質(zhì)譜質(zhì)量測量誤差等。 基于同位素模式概念,本文提出了從質(zhì)譜中挑選潛在的離子單同位素峰的
4、算法PeakSelect。本文從理論上討論了噪聲和離子譜峰的本質(zhì)區(qū)別以及質(zhì)譜中離子同位素峰重疊的分布情況,并討論了噪聲譜峰在強度上的分布。在此基礎上,本文提出多個有效的特征來區(qū)別噪聲、孤立的離子譜峰、重疊的離子譜峰,并建立譜峰分類的決策樹,從質(zhì)譜中挑選潛在的離子的單同位素峰。實驗結(jié)果表明PeakSelect能準確地挑選質(zhì)譜中的離子單同位素譜峰,不僅能夠大大縮短鑒定軟件在多肽序列鑒定上所需的計算時間,并且能大大增加可靠鑒定出的多肽的個數(shù),
5、提高了質(zhì)譜的利用率,也提高了所鑒定的蛋白質(zhì)序列的覆蓋率,從而提高了鑒定結(jié)果的可靠性。此外,本算法性能較之現(xiàn)有的商用軟件,比如ProteinLynx<'TM>Global Server對質(zhì)譜有效峰選取的預處理效果更好。 在估計質(zhì)譜質(zhì)量誤差之前,本文先提出了預測離子分子式的算法FFP。FFP通過比較分子式對應的理論同位素模式與質(zhì)譜中實際出現(xiàn)的實驗同位素模式間的差異來預測離子的分子式,并將分子式預測問題轉(zhuǎn)化為優(yōu)化問題。結(jié)合優(yōu)化建模
6、和統(tǒng)計分析,F(xiàn)FP對小質(zhì)量段內(nèi)的離子分子式預測的五選正確率達95%以上。在此基礎上,本文提出了估計質(zhì)譜質(zhì)量測量誤差的算法QPMass,并將QMass應用到Q-TOF數(shù)據(jù)上。 質(zhì)譜的質(zhì)量測量誤差包含兩個部分,一是隨機誤差,二是系統(tǒng)誤差。隨機誤差服從正態(tài)分布,而根據(jù)儀器的測量原理,可以得到系統(tǒng)誤差的理論分布函數(shù),比如,TOF儀器的測量誤差與離子理論質(zhì)量近似成線性關(guān)系。對一個具體的質(zhì)譜分析其測量誤差就是要得到這個系統(tǒng)誤差的分布函數(shù)
7、的具體參數(shù)。QMass借助FFP的預測結(jié)果可得到一些準確的測量誤差樣本點。并且,QMass還通過計算質(zhì)譜中各種潛在的連續(xù)或同源離子譜峰間的質(zhì)量差的理論值與實驗值之間的差異而得到相應的測量誤差樣本點。在這些樣本點數(shù)據(jù)上QMass通過估計誤差分布函數(shù)的參數(shù)從而得到整個質(zhì)譜的質(zhì)量測量誤差估計。實驗結(jié)果表明,95%以上的質(zhì)譜誤差估計值與實際的誤差值相差不超過40ppm。據(jù)我們所知,Qmass是第一個不依賴于內(nèi)標或外標參考,也不依賴數(shù)據(jù)庫搜索結(jié)果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于串聯(lián)質(zhì)譜的蛋白質(zhì)鑒定算法研究.pdf
- 蛋白質(zhì)組學質(zhì)譜數(shù)據(jù)預處理新策略研究及應用.pdf
- 串聯(lián)質(zhì)譜數(shù)據(jù)的預處理方法研究.pdf
- 基于串聯(lián)質(zhì)譜數(shù)據(jù)進行蛋白質(zhì)序列庫搜索算法初探.pdf
- 質(zhì)譜蛋白質(zhì)組中肽段及其修飾鑒定算法研究.pdf
- 一種基于串聯(lián)質(zhì)譜鑒定蛋白質(zhì)突變和翻譯后修飾的算法.pdf
- 30186.蛋白質(zhì)質(zhì)譜數(shù)據(jù)處理方法的研究
- 基于優(yōu)化算法的蛋白質(zhì)質(zhì)譜數(shù)據(jù)分析.pdf
- 基于串聯(lián)質(zhì)譜數(shù)據(jù)的蛋白質(zhì)-基因組學方法研究.pdf
- 基于質(zhì)譜數(shù)據(jù)的蛋白質(zhì)直接鑒定系統(tǒng)設計與實現(xiàn).pdf
- 色譜質(zhì)譜聯(lián)用技術(shù)在蛋白質(zhì)分析鑒定中的應用.pdf
- 基于質(zhì)譜數(shù)據(jù)的蛋白質(zhì)識別系統(tǒng).pdf
- 蛋白質(zhì)組質(zhì)譜平臺實驗數(shù)據(jù)仿真生成研究.pdf
- 基于稀疏表示的蛋白質(zhì)質(zhì)譜數(shù)據(jù)分析.pdf
- 43220.信息度量的蛋白質(zhì)序列、結(jié)構(gòu)、質(zhì)譜數(shù)據(jù)研究
- 基于聚類分析的蛋白質(zhì)質(zhì)譜數(shù)據(jù)分析研究.pdf
- 蛋白質(zhì)組學質(zhì)譜數(shù)據(jù)深度解析關(guān)鍵問題研究.pdf
- 原位蛋白質(zhì)質(zhì)譜的開發(fā)和應用.pdf
- 宮頸癌蛋白質(zhì)質(zhì)譜變化研究.pdf
- 368.基于正反庫特征信息匹配的蛋白質(zhì)二級質(zhì)譜鑒定算法
評論
0/150
提交評論