版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、棉花作為纖維的重要來源,是世界范圍內(nèi)最重要的纖維經(jīng)濟作物。隨著測序技術和生物信息學的快速發(fā)展,GenBank等重要生物數(shù)據(jù)庫中登陸的棉屬序列也快速增長,截至2009年2月,NCBI、EMBL和DDBJ3大數(shù)據(jù)庫收錄的棉花EST有375,374條,利用生物信息學手段對棉花ESTs數(shù)據(jù)進行大規(guī)模分析顯得日益重要.
本文以生物信息學理論為基礎,利用Phred/Phrap/Consed、phd2fasta、CrossMatch、R
2、epeatMasker、cap3、BLAST、BLAST2GO、SSR locator等軟件包以及自主基于perl、python平臺開發(fā)的程序,在Linux操作系統(tǒng)中構建了棉屬ESTs數(shù)據(jù)生物信息分析平臺,完成了從測序峰圖判讀、序列轉換、載體序列的去除、重復序列分析、鑲嵌克隆去除、序列聚類和組裝、ESTs序列功能注釋與功能分類以及基于EST的SSR、SNP分子標記的發(fā)掘。同時,通過使用Perl語言編寫的腳本程序使分析過程自動化,加速對大
3、規(guī)模測序數(shù)據(jù)的分析和利用。此外,為了加快分析速度和避免網(wǎng)絡局限性,運用自行編寫的程序?qū)γ迣俚鞍住⒑怂?、ESTs等網(wǎng)絡數(shù)據(jù)資源進行了本地化集成。
基于EST-SSR挖掘系統(tǒng),利用海7124-3~6和6~24DPA的胚珠和纖維為材料構建的兩個cDNA文庫隨機測序ESTs序列21,073條、運用腳本程序從Genbank dbEST數(shù)據(jù)庫抽取海島棉ESTs1,023條,預處理后共計22.087條海島棉(Gossypiumbarba
4、dense)ESTs序列進行EST-SSRs標記挖掘及特征分析。海島棉ESTs序列剔除冗余序列,得到非冗余序列9,697條。在非冗余序列中發(fā)現(xiàn)含不同重復基元SSRs的EST序列有595條,共617個EST-SSRs,EST-SSRs序列的頻率是6,13%,平均相隔10.8kb出現(xiàn)一個SSR。在2-6bp的重復基元中,三核苷酸重復基元的SSRs出現(xiàn)頻率最高(27.2%),其次是五核苷酸(26.O%)、六核苷酸(26,3%).統(tǒng)計所有的重復
5、基元類型,所占比例最大的是AAG/CTT(8.09%),其次是AG/CT(7.15%).利用Prime3及virtual PCR程序,并去除CMD收錄的已發(fā)布的SSR引物冗余后,開發(fā)了297對新的SSR引物。對本實驗四倍體作圖親本陸地棉TM-1和海島棉海7124進行多態(tài)性檢測后,其中60對有多態(tài)性,多態(tài)性頻率為20.2%。這些EST-SSRs可有效用于不同棉種間的分布特征比較及染色體定位等方面研究。
使用本地BLASTx程
6、序?qū)琒SR的ESTs序列與nr(non-redundant)蛋白數(shù)據(jù)庫本地數(shù)據(jù)庫進行同源性比較,595條ESTs序列中,457條(76.81%)ESTs序列發(fā)現(xiàn)有同源性蛋白,而138條(23,19%)沒有任何命中( nohits)。同時,同源蛋白中,142條(23.87%)為推測性或假設性蛋白。
使用BLAST2GO軟件包對包含SSR的ESTs序列進行基因本體學GO分析(GeneOntology)及KEGG代謝途徑功能
7、分類。GO分成生物過程(Biological Process)、細胞組分(Cellular Component)和分子功能(Molecular Function)3個類型。細胞組分中所占比例最大的是細胞cell/cell part(30.42%),其次是細胞器organelle(22.01%);生物過程中所占比例最大的是細胞過程cellular process(33.25%),其次是代謝過程metabolic process(30.38
8、%);分子功能中所占比例最大的兩個是催化活性catalyticactivity(49.44%)和結合binding(37.45%)。此外,KEGG代謝途徑分類中,主要分布在代謝途徑類Metabolism(31.36%),而代謝途徑分類中,大多數(shù)集中在碳水化合物代謝Carbohydrate Metabolism的42.02%。這些為相關基因的克隆和下一步的表達和功能分析提供了序列依據(jù)。
總之,基于本地化的生物信息學綜合分析體
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 海島棉再生體系的建立.pdf
- 海島棉產(chǎn)量性狀的配合力分析
- 煙草EST-SSR標記的建立及其應用.pdf
- 海島棉再生體系的建立及遺傳轉化.pdf
- 海島棉抗黃萎病基因分子標記研究.pdf
- 落葉松SSR分布特征分析及EST-SSR分子標記開發(fā).pdf
- 凡納濱對蝦EST-SSR標記的建立及人工選育群體的SSR分析.pdf
- 蠶豆EST-SSR分子標記的建立及其應用.pdf
- 海島棉DELLA基因克隆及其功能分析.pdf
- 海島棉高產(chǎn)群體特征及調(diào)控技術研究.pdf
- 茶樹EST-SSR標記的建立及其應用研究.pdf
- 海島棉GbPDF2基因的克隆及功能分析.pdf
- 甘藍EST-SSR標記開發(fā)及應用.pdf
- 海島棉枯萎病抗性鑒定及分子標記的初步篩選.pdf
- 茶樹菇農(nóng)藝性狀分析及EST-SSR標記的應用.pdf
- 海島棉CKX和PG家族基因的克隆及功能分析.pdf
- 海島棉抗黃萎病基因GbRvd的克隆及抗病功能分析.pdf
- 海島棉GbNPR1基因的表達特性及功能分析.pdf
- 杉木EST-SSR標記的開發(fā)與應用.pdf
- 海島棉再生體系的建立及SATI基因遺傳轉化初步研究.pdf
評論
0/150
提交評論