版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、利用系統(tǒng)發(fā)生足跡技術(shù)尋找巴西固氮螺菌基因組上的功能特征基于局域網(wǎng)的多機(jī)并行實(shí)現(xiàn)姜平(煙臺(tái),山東,山東工商學(xué)院信息與電子工程學(xué)院264005)摘要:要:巴西固氮螺菌是重要的植物促生內(nèi)生菌之一。為了研究其未知基因,在巴西固氮螺菌和與其同源的五個(gè)菌種之間進(jìn)行系統(tǒng)發(fā)生足跡研究,編寫軟件由計(jì)算機(jī)完成整個(gè)研究過程。由于任務(wù)執(zhí)行的串行性,效率較低。研究發(fā)現(xiàn),整個(gè)過程包含了大量重復(fù)的、沒有數(shù)據(jù)依賴的操作,如文本信息的提取,DNA序列的比較等。因此,提出
2、了基于局域網(wǎng)的多機(jī)并行實(shí)現(xiàn)的思路,由服務(wù)器將任務(wù)分配給多臺(tái)計(jì)算機(jī)并行執(zhí)行在充分利用資源的同時(shí),顯著提高了效率。關(guān)鍵詞關(guān)鍵詞:巴西固氮螺菌;同源;系統(tǒng)發(fā)生足跡;局域網(wǎng);并行1引言11巴西固氮螺菌巴西固氮螺菌(Azospirillumbrasilence)是重要的植物促生內(nèi)生菌之一,其質(zhì)體上的不同基因分別控制著其各種不同的特性。對(duì)巴西固氮螺菌的深入研究對(duì)我國農(nóng)業(yè)的發(fā)展有著深遠(yuǎn)的影響。在巴西固氮螺菌的sp7菌株里,發(fā)現(xiàn)了兩個(gè)質(zhì)體,分子量分別為
3、115MDa(p115)和90MDa(p90)。實(shí)驗(yàn)表明:p115質(zhì)體會(huì)自發(fā)地從細(xì)菌細(xì)胞中消失,并且與原生型sp7比較,由p115的衍生物來代替p115沒有造成任何表現(xiàn)型如細(xì)菌的運(yùn)動(dòng)性,化學(xué)向性等的差異,而對(duì)p90的替代卻使得細(xì)菌不能正常生存。由此得出結(jié)論:細(xì)胞存活必須的基因信息在p90質(zhì)體上。[1]12系統(tǒng)發(fā)生足跡技術(shù)p90的基因序列已經(jīng)被微生物與植物遺傳中心(KULeuvenBelgium)破譯,并且部分基因的位置和功能已經(jīng)確認(rèn),如
4、exoB和exoC控制著外聚多糖的合成。然而還有一些基因如nodP和nodQ,它們的功能還有待確定。本文應(yīng)用系統(tǒng)發(fā)生足跡技術(shù)對(duì)p90進(jìn)行研究。系統(tǒng)發(fā)生足跡是用來識(shí)別DNA序列中的調(diào)控因子(motif)的方法,它通過在多個(gè)同源基因的調(diào)控序列(基因間序列)中尋找保守區(qū)域來確定調(diào)控因子。系統(tǒng)發(fā)生足跡技術(shù)認(rèn)為:由于環(huán)境選擇的壓力,基因上的功能因子比那些非功能序列進(jìn)化的速率慢。因此,對(duì)于同源物種而言,那些保守區(qū)域?qū)⒊蔀楣δ苷{(diào)控因子的主要侯選者。[
5、2]13局域網(wǎng)多機(jī)并行實(shí)現(xiàn)隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,多機(jī)并行技術(shù)應(yīng)用日益廣泛。并行是指多臺(tái)計(jì)算機(jī)同時(shí)運(yùn)行,與單機(jī)串行運(yùn)行相比,并行能夠顯著的提高執(zhí)行速度。本系統(tǒng)構(gòu)建客戶機(jī)服務(wù)器模式的局域網(wǎng),即一臺(tái)服根據(jù)BLAST計(jì)算出的相似度,用TribeMCL對(duì)蛋白質(zhì)進(jìn)行分組,序列相似的蛋白質(zhì)將被歸為一組。為了利用序列相似的傳遞性,將各蛋白質(zhì)之間的相似關(guān)系用圖來表示,蛋白質(zhì)作為結(jié)點(diǎn),而邊用來代表蛋白質(zhì)之間的相似度,并且用log(E)作為相似度的權(quán)值。將圖進(jìn)
6、一步轉(zhuǎn)換為馬爾可夫矩陣,矩陣中的元素代表蛋白質(zhì)序列間的轉(zhuǎn)換概率。通過矩陣自乘進(jìn)一步尋找蛋白質(zhì)之間的親緣關(guān)系,避免將關(guān)系較遠(yuǎn)的蛋白質(zhì)遺漏[3]。得到蛋白質(zhì)的分組后,將蛋白質(zhì)轉(zhuǎn)換成其相應(yīng)的編碼基因,進(jìn)而得到基因分組,由于只需要與p90相關(guān)的基因組,再將包含p90基因的分組篩選出來存入數(shù)據(jù)庫中,結(jié)果如表1:表1:基因分組并行性分析并行性分析:蛋白質(zhì)分組需要將所有的蛋白質(zhì)相似度信息進(jìn)行比較,因此本模塊不能并行執(zhí)行,必須由一臺(tái)計(jì)算機(jī)獨(dú)立完成。21
7、4尋找motif得到了基因分組后,根據(jù)基因名稱將調(diào)控其編碼的基因間序列提取出來。然后在同源的基因間序列中尋找motif。本模塊使用MotifSampler軟件來尋找侯選motif該軟件采用Gibbs采樣算法,Gibbs通過隨機(jī)采樣不斷更新motif模型和在各條序列中的出現(xiàn)位置以優(yōu)化目標(biāo)函數(shù),當(dāng)滿足一定的迭代終止條件時(shí)就得到了最終的候選motif。[4]并行性分析并行性分析:同BLAST相似,motif的尋找不存在數(shù)據(jù)依賴,可以并行執(zhí)行。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 巴西固氮螺菌glnba基因的功能分析
- 48611.巴西固氮螺菌與吲哚乙酸iaa合成有關(guān)基因的克隆及功能分析
- 54553.巴西固氮螺菌nifa活性調(diào)節(jié)的分子機(jī)制
- 局域網(wǎng)共享的實(shí)現(xiàn)
- 基于局域網(wǎng)的流媒體組播系統(tǒng)的研究.pdf
- 基于組播技術(shù)的局域網(wǎng)IPTV優(yōu)化與仿真.pdf
- FDTD算法的局域網(wǎng)并行研究.pdf
- 基于局域網(wǎng)的并行計(jì)算負(fù)載平衡.pdf
- 52946.基于序列統(tǒng)計(jì)特征的全基因組系統(tǒng)發(fā)生分析
- EPON系統(tǒng)中虛擬局域網(wǎng)功能的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于藍(lán)牙技術(shù)的無線局域網(wǎng)系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 利用木馬技術(shù)實(shí)現(xiàn)局域網(wǎng)涉密檢查中的代理.pdf
- 基于Winsock的局域網(wǎng)監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于無線局域網(wǎng)的視頻監(jiān)控系統(tǒng)的研究實(shí)現(xiàn).pdf
- 基于局域網(wǎng)的遠(yuǎn)程監(jiān)控技術(shù).pdf
- 無線局域網(wǎng)中組播的應(yīng)用和實(shí)現(xiàn).pdf
- 49314.巴西固氮螺菌yu62在玉米根部的定殖固氮芽孢桿菌的分離及其glnb基因的研究
- 無線局域網(wǎng)中基于SCTP并行多路傳輸?shù)难芯?pdf
- 基于局域網(wǎng)的信息推送系統(tǒng).pdf
- 局域網(wǎng)計(jì)費(fèi)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
評(píng)論
0/150
提交評(píng)論