基于cis順式元件的衣藻poly(A)位點的識別研究.pdf_第1頁
已閱讀1頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、自從全基因組測序成為可能以來,基因組結(jié)構(gòu)注釋(包括了解基因組DNA中的基因組成、結(jié)構(gòu)及其調(diào)控元件)成為生物信息學(xué)研究的重要問題。隨著越來越多的生物體的DNA被測序出來,對大量的序列進行基因組分析并從中獲取有價值的信息變得日益重要。mRNA序列中多聚腺苷化位點(簡稱poly(A)位點)識別是基因識別的重要組成部分,對poly(A)位點的正確識別有助于確定基因編碼的終止位置,這在基因組分析中有重要的應(yīng)用意義。 人們普遍認為,用來識別

2、poly(A)位點的信號定位在剪切點的附近。在許多哺乳動物的poly(A)位點的上游10—35nt的區(qū)域定位了一個六聯(lián)子AAUAAA。由于其保守性,它通常被認為是poly(A)信號(PAS)。而且我們發(fā)現(xiàn)在酵母和哺乳類中出現(xiàn)的大部分cis順式元件也都存在于植物的poly(A)位點區(qū)域。此外,國際上最新的研究成果表明,在藻類的位點上游區(qū)域也存在poly(A)信號。因此,我們有理由相信,在所有真核細胞的poly(A)位點周圍存在著一些保守的

3、cis順式元件,這些cis順式元件對mRNA前體的多聚腺苷化過程(即poly(A)位點的形成過程)具有調(diào)控作用。 本文根據(jù)衣藻(Chlamydomonas)poly(A)位點上下游周圍序列cis順式元件的特征,運用層次聚類的方法來建立poly(A)位點的識別模型。對建立模型采用的訓(xùn)練集數(shù)據(jù),使用Z算法進行提取,并通過WEKA supervised attribute filter進行特征篩選,獲得cis順式元件。接下來自定義了對

4、象間距離,采用層次聚類的方法對上述cis順式元件進行聚類得到cis順式元件組。最后轉(zhuǎn)化這些cis順式元件組為PSSM,依據(jù)PSSM建立用于分類的cis特征,分別采用決策樹分類法與貝葉斯分類法,構(gòu)建出完整的poly(A)位點識別模型。該模型可依據(jù)訓(xùn)練結(jié)果,對待測序列中可能含有位點的序列進行分類,判斷其中含有位點的情況。本文使用建立的識別模型對測試數(shù)據(jù)進行測試,并對兩種分類方法的識別結(jié)果進行對比和分析。模型的測試結(jié)果表明,本文所建立的模型是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論