版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、系統(tǒng)進(jìn)化分析是生物信息學(xué)中的重要研究領(lǐng)域,它的主要研究手段是從一組同源的DNA或蛋白質(zhì)序列出發(fā),計(jì)算各個(gè)序列之間的進(jìn)化距離,進(jìn)而構(gòu)建反映物種進(jìn)化關(guān)系的進(jìn)化樹(shù)。構(gòu)建進(jìn)化樹(shù)的方法主要分為三類,即距離法、簡(jiǎn)約法和似然法。本文將對(duì)距離法做一些探索性的改進(jìn)研究。 傳統(tǒng)的距離法一般通過(guò)多序列比對(duì)計(jì)算距離矩陣,而多序列比對(duì)是一個(gè)NP難問(wèn)題,在序列數(shù)目較多時(shí)難以獲得最優(yōu)比對(duì)結(jié)果。一種解決方法是采用啟發(fā)式的多序列比對(duì)算法,另一種方法是通過(guò)計(jì)算某種
2、序列之間的兩兩距離代替多序列比對(duì)。對(duì)于計(jì)算兩兩距離的方法而言,Hansan H.Out和Khalid Sayood提出了一種基于LZ復(fù)雜度的距離,能夠正確地重構(gòu)某些進(jìn)化樹(shù)。本文則試圖通過(guò)利用一種滿足三角不等式的歸一化編輯距離來(lái)繞過(guò)多序列比對(duì)的困難,但仍然需要對(duì)序列進(jìn)行兩兩比對(duì)分析。 序列的兩兩比對(duì)通常采用Needle-Wunschman算法,其時(shí)間和空間復(fù)雜度均為O(mn)(m,n為比對(duì)兩序列的長(zhǎng)度),對(duì)長(zhǎng)序列容易超過(guò)計(jì)算機(jī)的內(nèi)
3、存限制。Hirschberg算法具有線性空間復(fù)雜度,可以用來(lái)解決Needle-Wunschman算法的內(nèi)存問(wèn)題,但是計(jì)算時(shí)間需求要多一倍,約為O(2mn)。本文試圖在時(shí)間和空間復(fù)雜度之間進(jìn)行折衷,通過(guò)引入一種新的檢查點(diǎn)(Check_Point)計(jì)算方法,提出了基于分塊遞歸的序列比對(duì)算法。理論分析表明,該算法的空間需求大約在O(5(m+n)+Ls×min(m-1,n-1)+C2)至O(5(m+n)+Ls×(m+n-2)+C2)之間,時(shí)間需
4、求介于O(1.5mn)到O(3mn)之間,但在序列相似度較高時(shí)介于O(1.5mn)到O(2mn)之間。同源物種的線粒體全基因組序列比對(duì)實(shí)驗(yàn)進(jìn)一步證明了新算法的正確性,表明在序列之間的歸一化編輯距離小于0.25時(shí),新算法能夠比Hirschberg算法快10%以上。因此分塊遞歸序列比對(duì)算法在諸如同源序列分析、系統(tǒng)進(jìn)化樹(shù)構(gòu)造等領(lǐng)域具有一定的應(yīng)用價(jià)值。 由于直接通過(guò)序列比對(duì)得到的距離易受序列長(zhǎng)度影響,與真實(shí)進(jìn)化距離的差別較大,因此需要進(jìn)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 兩種新的基于距離構(gòu)建進(jìn)化樹(shù)的方法.pdf
- 利用進(jìn)化樹(shù)研究基因序列的進(jìn)化.pdf
- 生物序列進(jìn)化樹(shù)的構(gòu)建.pdf
- 基于DNA序列的進(jìn)化樹(shù)構(gòu)建算法的研究.pdf
- 分子進(jìn)化樹(shù)構(gòu)建方法
- 基于距離矩陣的進(jìn)化樹(shù)構(gòu)建方法研究.pdf
- 基于神經(jīng)網(wǎng)絡(luò)的多叉系統(tǒng)進(jìn)化樹(shù)構(gòu)造.pdf
- 構(gòu)建進(jìn)化樹(shù)
- 兩兩nqd序列和ρ39;序列的收斂性質(zhì)
- 基于多目標(biāo)優(yōu)化的進(jìn)化樹(shù)重建方法.pdf
- 基于距離的進(jìn)化樹(shù)構(gòu)建算法研究.pdf
- 25212.基于離散度量的進(jìn)化樹(shù)構(gòu)建方法研究
- 539.兩兩多重比較的fdr控制
- 多叉進(jìn)化樹(shù)構(gòu)建方法的研究與實(shí)現(xiàn).pdf
- 兩兩NQD序列部分和收斂性質(zhì)的研究.pdf
- DNA序列3D圖形表示及進(jìn)化樹(shù)算法研究.pdf
- 系統(tǒng)進(jìn)化樹(shù)構(gòu)建的算法
- 序列分析平臺(tái)的建立:模擬PCR及快速進(jìn)化樹(shù)重建.pdf
- NJ進(jìn)化樹(shù)構(gòu)建方法的改進(jìn)及其應(yīng)用.pdf
- 兩兩NQD序列部分和之和的收斂性質(zhì).pdf
評(píng)論
0/150
提交評(píng)論