版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、動物、植物等真核生物的蛋白質(zhì)學(xué)、蛋白質(zhì)組學(xué)方面的研究在后基因組時代變得越來越重要,由于多種生物(包括果樹中的蘋果、葡萄在內(nèi))基因測序工程的完成,研究的重心開始向確定基因的蛋白質(zhì)產(chǎn)物功能方向移動。果樹蛋白質(zhì)亞細(xì)胞定位是果樹蛋白質(zhì)組學(xué)、果樹細(xì)胞生物學(xué)和果樹分子生物信息學(xué)的重要研究內(nèi)容。果樹蛋白質(zhì)分子生物功能的實現(xiàn)一方面與代謝、信號傳導(dǎo)等果樹生物過程緊密相關(guān),另一方面果樹蛋白質(zhì)分子必須處于特定的亞細(xì)胞區(qū)域才能行使其生物功能。對于未知功能的果樹
2、蛋白質(zhì)獲取其亞細(xì)胞的位置信息對進(jìn)一步研究該蛋白質(zhì)的分子功能是十分必要的。通過生物實驗技術(shù)手段獲取一個果樹蛋白質(zhì)亞細(xì)胞定位信息是通常的做法,但是這種做法消耗時間較長且實驗成本較高,同時由于果樹蛋白質(zhì)序列的快速增長,在短時間內(nèi)獲取規(guī)?;鞍踪|(zhì)亞細(xì)胞定位信息(例如:蘋果全基因組蛋白質(zhì)亞細(xì)胞定位信息)只能依靠生物信息技術(shù)手段來完成。另一方面,從生物數(shù)據(jù)角度來看生物信息學(xué)主要可以分為三個研究領(lǐng)域:大量生物序列數(shù)據(jù)的生成與管理、生物數(shù)據(jù)的使用與分析
3、、生物數(shù)據(jù)分析平臺工具的研究與開發(fā)。由于生物信息數(shù)據(jù)大量的產(chǎn)生以及生命科學(xué)研究的迅猛發(fā)展,無論是從科學(xué)研究還是生產(chǎn)實踐,人們急需能滿足需求的生物數(shù)據(jù)分析平臺工具,在一些研究課題中生物數(shù)據(jù)分析平臺工具甚至成為制約深入研究的瓶頸問題。同時,由于生物數(shù)據(jù)分析平臺工具研究與開發(fā)往往需要來自生物、數(shù)學(xué)、物理、化學(xué)、信息科學(xué)等多領(lǐng)域的知識,這也增加生物數(shù)據(jù)分析平臺工具研究與開發(fā)的復(fù)雜性。所以在果樹生物數(shù)據(jù)分析平臺工具方面開展深入的研究是十分必要的,
4、并且也具有重要的實踐應(yīng)用價值,這也是我們研究工作的目的之一。
本文以量子算法為主,針對PCD相關(guān)蛋白質(zhì)亞細(xì)胞定位預(yù)測中的生物信息技術(shù)問題和蘋果蛋白質(zhì)亞細(xì)胞定位預(yù)測的實現(xiàn)問題進(jìn)行了深入的分析與研究,結(jié)合生物物理和物理的知識,提出了具體的解決辦法和實現(xiàn)方案。本文的主要工作和創(chuàng)新之處概括如下:
1.從蛋白質(zhì)氨基酸序列的組成出發(fā),利用物理學(xué)中粒度的思想,提出了蛋白質(zhì)氨基酸序列的粒度概念,結(jié)合具體氨基酸序列片段詳細(xì)闡述
5、了蛋白粒度的構(gòu)成。使用蛋白粒度對氨基酸序列進(jìn)行分析,進(jìn)一步給出了蛋白粒度的階、蛋白粒度的界、蛋白粒度的極限、蛋白粒度增量等概念。在深入的研究時發(fā)現(xiàn):蛋白粒度沿序列不均勻分布;每條蛋白序列都有各自的蛋白粒度的極限;對于所有蛋白來講,蛋白的各階粒度都有共同的界。如果從蛋白預(yù)測的應(yīng)用來講,還可以得出:蛋白粒度包含了氨基酸序列的組成信息,包含了氨基酸序列的排列信息,還包含了同種氨基酸的互鄰信息,同時蛋白粒度增量自然包含了氨基酸序列的長度信息。對
6、于如何利用蛋白粒度的理論和知識來構(gòu)造蛋白序列的特征向量,本文給出了一種具體的構(gòu)造方法并對有關(guān)參數(shù)進(jìn)行了詳細(xì)的說明。根據(jù)蛋白粒度增量的信息對標(biāo)準(zhǔn)數(shù)據(jù)集的蛋白質(zhì)二級結(jié)構(gòu)類以及植物蛋白亞葉綠體定位進(jìn)行預(yù)測,得到比前人更好的結(jié)果,這些進(jìn)一步說明了蛋白粒度是反映蛋白質(zhì)屬性的非常有用的指標(biāo)。
2.選擇ZD98、ZW225、CL317凋亡蛋白標(biāo)準(zhǔn)數(shù)據(jù)集,利用蛋白粒度對凋亡蛋白序列進(jìn)行特征提取,得到38維蛋白序列特征向量,對量子神經(jīng)網(wǎng)絡(luò)算
7、法(QNN)進(jìn)行改進(jìn)后,對凋亡蛋白進(jìn)行亞細(xì)胞定位預(yù)測,分別獲得了87.8%、83.1%、85.5%的總體預(yù)測精度,這些預(yù)測精度等于或高于原作者的預(yù)測精度,說明蛋白粒度與QNN結(jié)合的方法在凋亡蛋白亞細(xì)胞定位預(yù)測上是有效的。
3.利用已經(jīng)公布的蘋果全基因組蛋白序列,對蘋果全基因組蛋白序列進(jìn)行粒度等特征提取,分別得到蘋果全基因組蛋白二階粒度組成、三階粒度組成、粒度多空間融合等特征向量,然后根據(jù)量子力學(xué)中波函數(shù)的疊加思想研制了新的
8、量子算法(QSVM),對蘋果全基因組蛋白63541條氨基酸序列進(jìn)行了亞細(xì)胞定位預(yù)測,獲得了相應(yīng)的定位信息,并形成了蘋果全基因組蛋白亞細(xì)胞位點數(shù)據(jù)庫1。
4.在Chou構(gòu)造的一個高質(zhì)量的植物蛋白細(xì)胞多定位基準(zhǔn)數(shù)據(jù)集的基礎(chǔ)之上,本文提出分別處理的預(yù)測模式,對多標(biāo)簽蛋白和單標(biāo)簽蛋白分別進(jìn)行預(yù)測,同時利用GO注釋對蛋白序列進(jìn)行特征提取,取得了較高的預(yù)測精度,為蛋白的多定位預(yù)測找到了一種新的方法。
5.在蘋果全基因組蛋
9、白數(shù)據(jù)集的基礎(chǔ)上,對有GO注釋的蘋果蛋白進(jìn)行了GO注釋特征提取,結(jié)合本文提出的蛋白粒度的有關(guān)理論和知識,再進(jìn)行蛋白粒度特征提取,研制了新的量子算法(SQSVM),對在蘋果全基因組上篩選出來的含GO注釋的15297條蛋白氨基酸序列進(jìn)行了亞細(xì)胞定位預(yù)測,給出了相應(yīng)的定位結(jié)果,在此基礎(chǔ)之上構(gòu)建了蘋果全基因組蛋白亞細(xì)胞位點數(shù)據(jù)庫2。
6.作為生物數(shù)據(jù)分析平臺具體體現(xiàn)的亞細(xì)胞定位網(wǎng)站——蘋果蛋白亞細(xì)胞定位系統(tǒng)網(wǎng)站和植物蛋白亞細(xì)胞多定
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于圖像的蛋白質(zhì)亞細(xì)胞定位.pdf
- 基于機(jī)器學(xué)習(xí)的蛋白亞細(xì)胞定位預(yù)測.pdf
- 基于機(jī)器學(xué)習(xí)的凋亡蛋白亞細(xì)胞定位預(yù)測研究.pdf
- 蛋白質(zhì)亞細(xì)胞定位特征表達(dá)與分類算法研究.pdf
- P18蛋白的亞細(xì)胞定位及其對細(xì)胞骨架相關(guān)蛋白的影響.pdf
- 核蛋白的亞核定位和植物、非植物及小鼠蛋白質(zhì)的亞細(xì)胞定位預(yù)測研究.pdf
- 基于熒光顯微圖像的亞細(xì)胞定位算法.pdf
- 基于混合編碼的蛋白質(zhì)亞細(xì)胞定位研究.pdf
- 蛋白質(zhì)亞細(xì)胞定位的序列分析和理論預(yù)測算法研究.pdf
- 基于融合特征的蛋白質(zhì)亞細(xì)胞定位預(yù)測.pdf
- 基于機(jī)器學(xué)習(xí)的多定位點蛋白質(zhì)亞細(xì)胞定位預(yù)測方法研究.pdf
- 蛋白質(zhì)亞細(xì)胞定位的識別.pdf
- 基于序列編碼的蛋白質(zhì)亞細(xì)胞定位及相互作用研究.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的亞細(xì)胞定位點預(yù)測算法研究.pdf
- 36520.中心體復(fù)制調(diào)控相關(guān)蛋白亞細(xì)胞結(jié)構(gòu)定位的研究
- 蛋白質(zhì)亞細(xì)胞定位預(yù)測方法研究.pdf
- 基于相關(guān)法的多重成像亞像素定位算法的研究與實現(xiàn).pdf
- 基于直推學(xué)習(xí)的蛋白質(zhì)亞細(xì)胞定位預(yù)測.pdf
- 基于序列裂解位點的凋亡蛋白亞細(xì)胞定位方法研究.pdf
- 基于離散特征的蛋白質(zhì)亞細(xì)胞定位預(yù)測方法研究.pdf
評論
0/150
提交評論