分子生物學系統(tǒng)建模及蛋白質(zhì)功能預測相關問題研究.pdf_第1頁
已閱讀1頁,還剩158頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、生命科學是研究生命活動規(guī)律、生命本質(zhì)、生命發(fā)育規(guī)律,以及各種生物之間和生物與環(huán)境之間相互關系的科學。進入21世紀后,生命科學蓬勃發(fā)展,取得了重大突破。生命科學的廣闊應用前景備受矚目,其不僅有助于揭示生命活動的基本規(guī)律,而且為疾病的診斷和治療提供重要的理論基礎。DNA雙螺旋結(jié)構(gòu)模型的建立使分子生物學成為生命科學領域的重要分支學科,開創(chuàng)了在分子水平上研究生命現(xiàn)象的新紀元?;虮磉_是分子生物學的理論基石,是遺傳信息從DNA傳向蛋白質(zhì)的過程?;?/p>

2、因表達生物學機理的研究為DNA計算的誕生奠定了理論基礎。自20世紀以來,分子生物學發(fā)展迅速。然而,生物化學實驗研究方法的成本相對較高。因此,建立有效的分子生物學系統(tǒng)模型并進行分析和預測,揭示生命過程所蘊含的奧秘,已經(jīng)成為本領域亟待解決的問題。
  蛋白質(zhì)是生命活動的物質(zhì)基礎和最終執(zhí)行者,直接表征人體的生命現(xiàn)象和生理機能。對蛋白質(zhì)進行功能預測將有助于在分子、細胞和生物體等多個層次上全面揭示生命現(xiàn)象的本質(zhì),為疾病發(fā)生機制的探究、藥物的

3、研發(fā)開辟全新的途徑。除此之外,蛋白質(zhì)功能預測對于食品、農(nóng)業(yè)生產(chǎn)、環(huán)境監(jiān)控等領域具有巨大的推動作用。上世紀80年代以來,基因組測序計劃的持續(xù)開展累積了海量的蛋白質(zhì)序列,且其增長速度日益加快。實驗測定的蛋白質(zhì)功能遠遠落后于新發(fā)現(xiàn)的蛋白質(zhì)序列的增長速度,單純依靠實驗研究已不能滿足全基因組范圍內(nèi)對蛋白質(zhì)功能進行注釋的需要。如何縮小已知序列的蛋白質(zhì)數(shù)量和已測定功能的蛋白質(zhì)數(shù)量之間的差距已經(jīng)成為分子生物學的一個重要研究課題。開發(fā)先進高效的計算方法輔

4、助實驗技術,建立蛋白質(zhì)功能的預測模型及在線預測平臺,勢在必行。
  雖然分子生物學系統(tǒng)建模和蛋白質(zhì)功能預測相關研究問題在過去的十多年中取得了很大的進展,但依然存在很大的探索空間。基于基礎數(shù)學理論和機器學習理論,本學位論文研究了分子生物學系統(tǒng)建模和蛋白質(zhì)功能預測相關問題,具體研究工作概述如下:
  (1)目前對于遺傳密碼的生物學機理、生物特征及生物學意義的研究,已較為深入。然而,受限于遺傳密碼精確數(shù)學模型的缺失,對密碼子與其它

5、生命體或生物過程的關系研究很難進一步展開。基于群模型在刻畫對稱、互補等特性的優(yōu)勢,在復平面上建模了遺傳密碼,并建立了遺傳密碼、氨基酸與群元素的對應關系,得到了一些有價值的命題,尤其定義了同一類氨基酸的不同編碼密碼子之間的函數(shù)關系。上述模型將為定量分析和理解基因表達過程提供參考,同時有助于分析基因突變對蛋白質(zhì)合成的影響,進而揭示復雜生物系統(tǒng)的運行機制。
  (2) DNA計算具有廣闊的應用前景。為降低實驗的開銷,有必要首先針對DNA

6、計算算法進行計算機仿真,然后再開展相應的DNA計算實驗工作。數(shù)學模型具有提煉生物學特征、刻畫生物學過程、計算生物學系統(tǒng)動態(tài)演化過程的潛質(zhì)?;谠g數(shù)學理論,建模了DNA計算求解哈密爾頓路徑問題的實驗過程,從數(shù)學角度給出了節(jié)點的編碼規(guī)則,得到了適用于求解多節(jié)點哈密爾頓路徑問題的推廣元間模型。上述模型可作為一種求解哈米爾頓路徑問題的仿生計算方法,有助于將DNA計算與計算機仿真相結(jié)合,為先仿真再實驗的DNA計算技術研究方法提供模型基礎。

7、>  (3)細胞外基質(zhì)蛋白的多樣性是細胞外基質(zhì)在組織形態(tài)發(fā)生、分化和體內(nèi)平衡等多個生物過程中發(fā)揮調(diào)控作用的基礎??箖龅鞍孜降奖У谋砻娌⒁种票У纳L是越冬生物在嚴寒環(huán)境中生存的前提。蛋白質(zhì)類別預測是蛋白質(zhì)功能預測領域的重要研究分支。細胞外基質(zhì)蛋白的預測將有助于理解相關的生物過程和藥物開發(fā)??箖龅鞍椎念A測將為揭示AFP與冰晶的相互作用機制提供重要線索。現(xiàn)有的細胞外基質(zhì)蛋白和抗凍蛋白預測系統(tǒng)基于單分類器預測算法,在一定程度上限制了其預測

8、性能。為此,基于集成學習算法,分別構(gòu)建了細胞外基質(zhì)蛋白和抗凍蛋白預測系統(tǒng)。實驗結(jié)果表明,上述預測系統(tǒng)遠遠優(yōu)于同類其它方法。
  (4)高爾基體主要負責蛋白質(zhì)的存儲、包裝和分發(fā)。高爾基蛋白類型通常分為順面膜囊蛋白和反面膜囊蛋白,使蛋白質(zhì)有序的進出高爾基體。高爾基體蛋白的功能障礙會導致營養(yǎng)不良、糖尿病、癌癥和其它遺傳疾病。正確預測高爾基體蛋白質(zhì)類型將有助于闡明高爾基體在有關生物學過程的功能,并為理解疾病的發(fā)作機制提供重要線索。基于共空

9、間模式(Common Spatial Patterns,CSP)的概念,開發(fā)了一種用于區(qū)分順面膜囊蛋白和反面膜囊蛋白的預測模型。實驗結(jié)果顯示,CSP方法的性能稍差于傳統(tǒng)方法,特征維數(shù)卻是傳統(tǒng)方法的1/20,極大地降低了計算復雜度。綜合考慮預測性能和特征維數(shù),CSP是一種有效的特征提取方法。通過少數(shù)類過采樣算法,解決了數(shù)據(jù)集不平衡問題。利用遞歸搜索的方法排除了冗余的特征,進一步提高了預測性能。通過與現(xiàn)存方法進行比較,證實了該方法的強大預測

10、能力。
  (5)蛋白質(zhì)表面與其它生物分子發(fā)生相互作用的結(jié)合位點,對于蛋白質(zhì)功能的實現(xiàn)非常重要。蛋白質(zhì)功能預測的另一重要研究方向是區(qū)分結(jié)合位點與蛋白質(zhì)其它表面區(qū)域。以黃素腺嘌呤二核苷酸(Flavin Adenine Dinucleotide,F(xiàn)AD)相互作用殘基為研究對象,通過多種特征提取策略,構(gòu)建了蛋白質(zhì)結(jié)合位點預測模型。鑒于鄰接殘基的相互依賴關系,在提取進化信息時對位置特異性打分矩陣(Position Specific Sco

11、ring Matrix,PSSM)進行了平滑。為進一步深入理解FAD相互作用殘基(FAD-Interacting Residues,F(xiàn)IRs)形成的機制,對各種類型的特征進行了定量分析。結(jié)果表明,所提取的特征對于FIRs和non-FIRs具有較好的區(qū)分能力。為降低計算復雜度并提高預測模型的精度,利用特征選擇技術有效地選取了最優(yōu)特征集合,并對最優(yōu)特征進行了分析,在一定程度上揭示了FAD與蛋白質(zhì)發(fā)生相互作用的機制。訓練集上的交叉驗證結(jié)果顯示

12、,該方法的預測效果明顯優(yōu)于現(xiàn)有其它方法。
  (6) PSSM廣泛應用于蛋白質(zhì)序列進化信息的提取?,F(xiàn)已有很多用于提取蛋白質(zhì)序列信息的網(wǎng)絡服務器,然而,還缺乏利用PSSM提取進化信息的網(wǎng)絡服務器,極大地限制了其實際應用價值?;谏鲜鲈?,首先把從PSSM進行特征提取的方法劃分為3類;然后,基于各類特征提取方法,搭建了用于提取蛋白質(zhì)序列進化特征的網(wǎng)絡服務器——PSSM-PROREP;最后闡明了網(wǎng)絡服務器的用法。PSSM-PROREP的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論