版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、目的: 1、為了更好地對瘧原蟲蛋白家族進行比較基因組學(xué)和功能基因組學(xué)方面的研究,構(gòu)建瘧原蟲蛋白家族數(shù)據(jù)庫; 2、開發(fā)一個功能齊全、高度整合的生物信息學(xué)分析平臺,為瘧疾研究及相關(guān)科研工作者提供良好的數(shù)據(jù)分析工具和平臺。 方法: 1、對六個現(xiàn)有的瘧原蟲基因組蛋白序列數(shù)據(jù)進行All-against-All BLAST搜索,再用TribeMCL軟件包中Mclblastline程序進行蛋白家族聚類,再用PERL程序
2、提取蛋白家族信息以用于蛋白家族數(shù)據(jù)庫構(gòu)建; 2、用瘧原蟲蛋白序列對PDB、Swiss-Prot和RefSeq三個數(shù)據(jù)庫進行BLAST同源搜索,所得結(jié)果分別用PERL程序進行提取,以用于構(gòu)建數(shù)據(jù)庫; 3、用HMMER軟件包中的Hmmpfam程序?qū)fam數(shù)據(jù)庫進行蛋白結(jié)構(gòu)域搜索,輸出結(jié)果用PERL程序提取,以用于數(shù)據(jù)庫構(gòu)建; 4、用BLAST序列相似性程序?qū)EGG Ortholog(KO)數(shù)據(jù)庫進行搜索,用PER
3、L程序提取輸出結(jié)果,然后用統(tǒng)計學(xué)方法推測各家族的功能,并對其進行注釋; 5、以Linux為服務(wù)器,MySQL為數(shù)據(jù)庫管理軟件,根據(jù)以上各步所得數(shù)據(jù)設(shè)計數(shù)據(jù)表,采用BigDump和phpMyAdmin等軟件把數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫,構(gòu)建成蛋白家族數(shù)據(jù)庫; 6、以Apache為網(wǎng)絡(luò)服務(wù)器,使用Dreamweaver、UltraEdit、Photoshop、Activeperl等軟件,以PHP、HTML、JavaScript、Ajax
4、、PERL等語言進行編程構(gòu)建生物信息學(xué)數(shù)據(jù)分析平臺。 結(jié)果: 1、六個瘧原蟲基因組總共含有40,273條蛋白基因序列,同源聚類分析得到了8,089個蛋白家族,總共有50種大小的家族,其中最大家族有1,107個成員,最小的家族只有1個成員; 2、按家族大小來分,家族個數(shù)最多是1個成員的家族,有3,203個,其次是6個成員的,有1,094個,家族大多集中有12個成員以下家族大小段,17個成員以上的家族比較稀少;
5、 3、按物種基因分布看,P. berghei、P. chabaudi、P. falciparum三個物種在各種大小家族中分布比較均勻;P. knowlesi和P. vivax兩個物種在小于12個成員的家族中占優(yōu)勢;而P.yoelii在多于12個成員的家族中相對占優(yōu)勢; 4、家族大小分別為98和178的兩個家族中的所有成員都來自P. falciparum,其中可能存在物種特意性的基因擴增; 5、構(gòu)建了蛋白家族數(shù)據(jù)庫Pla
6、smoGF,并以其為基礎(chǔ)構(gòu)建了功能齊全的生物信息學(xué)分析平臺(http://www.bioinformatics.zj.cn/pgf/)。該平臺包含了文本和BLAST數(shù)據(jù)庫搜索、多序列比對、進化樹構(gòu)建等數(shù)據(jù)操作板塊,并開發(fā)了數(shù)據(jù)工作集Work-Set作為用戶數(shù)據(jù)存儲的容器,并作為各步數(shù)據(jù)操作的紐帶。 結(jié)論: 1、成功構(gòu)建了國際上第一個瘧原蟲蛋白家族數(shù)據(jù)庫PlasmoGF,經(jīng)人工評估,其數(shù)據(jù)比較可靠,可作為瘧疾研究工作者研究
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- microRNA生物標(biāo)志物的數(shù)據(jù)庫構(gòu)建及生物信息學(xué)分析.pdf
- 生物信息學(xué)數(shù)據(jù)庫及其利用方法
- 水稻AGO基因家族的生物信息學(xué)分析.pdf
- 肺癌相關(guān)MAGE家族的生物信息學(xué)分析.pdf
- 地黃RAPD-SCAR標(biāo)記及其生物信息學(xué)分析.pdf
- 神經(jīng)退化疾病相關(guān)氨基酸變異數(shù)據(jù)庫構(gòu)建及生物信息學(xué)分析.pdf
- 多能干細胞誘導(dǎo)因子及其家族蛋白的生物信息學(xué)分析.pdf
- 水稻Rho家族OsRacD及其5種潛在互作蛋白的生物信息學(xué)分析.pdf
- 楊樹富含亮氨酸受體蛋白激酶家族生物信息學(xué)分析.pdf
- 煙草碳酸酐酶基因的克隆及其生物信息學(xué)分析.pdf
- LncRNA-基因調(diào)控關(guān)系的生物信息學(xué)數(shù)據(jù)庫構(gòu)建及分析預(yù)測.pdf
- 番茄DWD家族的生物信息學(xué)分析及生化特征.pdf
- 細胞周期蛋白生物信息學(xué)分析.pdf
- 耐熱木聚糖酶的體外分子進化及其生物信息學(xué)分析.pdf
- 蛋白質(zhì)泛素化的生物信息學(xué)分析.pdf
- myc基因的生物信息學(xué)分析
- 2生物信息學(xué)-生物信息數(shù)據(jù)庫完美版
- 桑樹DREB基因家族生物信息學(xué)分析及功能研究.pdf
- 基于Web頁面的生物信息學(xué)分析平臺的建立及其應(yīng)用.pdf
- 棉花纖維發(fā)育相關(guān)基因時空表達及其生物信息學(xué)分析.pdf
評論
0/150
提交評論