小鼠腦發(fā)育相關(guān)lncRNAs的高通量篩選及注釋平臺(tái)構(gòu)建.pdf_第1頁(yè)
已閱讀1頁(yè),還剩147頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、長(zhǎng)非編碼RNAs(lncRNAs)是長(zhǎng)度在200 nt以上的非編碼RNAs,在胚胎發(fā)育、癌癥、病痛和炎癥等過(guò)程中發(fā)揮重要的作用。然而,目前公共數(shù)據(jù)庫(kù)中小鼠lncRNAs數(shù)據(jù)較少,而其中被功能注釋的則更少。腦組織是lncRNAs表達(dá)的主要器官,預(yù)測(cè)腦表達(dá)lncRNAs對(duì)于全面識(shí)別小鼠腦發(fā)育相關(guān)的lncRNAs及認(rèn)識(shí)其在腦發(fā)育中的作用具有重要意義。此外,將預(yù)測(cè)的lncRNAs與已知lncRNAs進(jìn)行整合、注釋并存儲(chǔ)進(jìn)專門(mén)的數(shù)據(jù)庫(kù)中對(duì)于lnc

2、RNAs的規(guī)范化和再利用具有重要意義。小鼠 DNA元件百科全書(shū)計(jì)劃測(cè)定了大量組織和細(xì)胞系的RNA測(cè)序(RNA-Seq)和染色質(zhì)免疫共沉淀測(cè)序等高通量數(shù)據(jù),對(duì)于預(yù)測(cè)新的lncRNAs提供了一個(gè)新的思路。因此,本研究收集大量組織和細(xì)胞系的RNA-Seq數(shù)據(jù),基于RNA-Seq篩選鑒別新lncRNAs,通過(guò)基因組、轉(zhuǎn)錄組、表觀基因組和功能基因組學(xué)表征證明其有效性,利用模型進(jìn)行特征選擇從而篩選腦發(fā)育相關(guān)的lncRNAs。整合已知和基于大規(guī)模 R

3、NA-Seq數(shù)據(jù)預(yù)測(cè)的lncRNAs,構(gòu)建lncRNAs注釋平臺(tái)和開(kāi)發(fā)分析工具,便利研究人員的使用。
  本論文首先對(duì)已有的RNA-Seq流程進(jìn)行優(yōu)化,進(jìn)而篩選胚胎腦發(fā)育相關(guān)的基因間、內(nèi)含子和順式反義3種類型 lncRNAs。分別從基因組、轉(zhuǎn)錄組、表觀基因組和功能基因組學(xué)方法表征胚胎腦發(fā)育相關(guān)的新 lncRNAs,并與已知lncRNAs和編碼轉(zhuǎn)錄本進(jìn)行比較。結(jié)果表明新lncRNAs具有相對(duì)完整的基因結(jié)構(gòu)及較低的編碼潛能,具有與已知

4、lncRNAs相似的組織特異性,并與典型的染色質(zhì)修飾相關(guān)。功能富集分析和基于RNA干擾的分析結(jié)果表明胚胎腦發(fā)育相關(guān)的lncRNAs具有潛在的腦發(fā)育調(diào)控功能和結(jié)合轉(zhuǎn)錄因子發(fā)揮功能的傾向。隨機(jī)挑選的lncRNAs的實(shí)驗(yàn)驗(yàn)證結(jié)果進(jìn)一步表明lncRNAs具有較強(qiáng)的發(fā)育階段特異性并且可能受到印記機(jī)制調(diào)控。
  其次,LASSO調(diào)整的羅杰斯特回歸模型在本論文中被用于篩選 lncRNAs與編碼轉(zhuǎn)錄本之間的基因組和表觀基因組學(xué)差異。由于使用了3個(gè)

5、發(fā)育階段的染色質(zhì)修飾數(shù)據(jù),因此差異的特征可并用于篩選腦發(fā)育過(guò)程相關(guān)的lncRNAs。對(duì)模型進(jìn)行十倍交叉證實(shí)和獨(dú)立檢驗(yàn)集測(cè)試后發(fā)現(xiàn)特征選擇模型的性能和只使用基因組特征和染色質(zhì)修飾特征相近,表明少數(shù)特征對(duì)lncRNAs的預(yù)測(cè)發(fā)揮了主要作用。基于特征選擇模型對(duì)3個(gè)發(fā)育階段的RNA-Seq數(shù)據(jù)預(yù)測(cè)的候選lncRNAs進(jìn)行進(jìn)一步篩選。通過(guò)對(duì)新lncRNAs進(jìn)行的基因組、轉(zhuǎn)錄組和功能基因組學(xué)方法表征表明模型篩選腦發(fā)育相關(guān)lncRNAs的有效性。研究

6、lncRNAs與臨近編碼基因的關(guān)系后發(fā)現(xiàn) lncRNAs傾向于與臨近編碼基因共表達(dá),表明lncRNAs可能調(diào)控臨近基因。當(dāng)使用模型分析lncRNAs特異性后,發(fā)現(xiàn)lncRNAs在腦發(fā)育過(guò)程中的表達(dá)特異性受到發(fā)育階段特異的染色質(zhì)修飾調(diào)控,例如H3K4me1和H3K36me3,但并未發(fā)現(xiàn)受到基因組特征調(diào)控,表明LASSO模型具有腦發(fā)育過(guò)程特異 lncRNAs的識(shí)別能力。原位雜交結(jié)果驗(yàn)證了隨機(jī)挑選的lncRNAs的腦發(fā)育特異性,而半定量RT-

7、PCR結(jié)果發(fā)現(xiàn)胚胎發(fā)育階段特異表達(dá)的lncRNAs傾向于具有腦組織特異性。
  再次,目前公共數(shù)據(jù)庫(kù)中 lncRNAs的數(shù)目較少,于是整合基于大規(guī)模的RNA-Seq數(shù)據(jù)預(yù)測(cè)的lncRNAs和已知lncRNAs注釋,從而識(shí)別出了約26萬(wàn)個(gè)lncRNA轉(zhuǎn)錄本,稱之為 lncRNA合集。其中新 lncRNAs占75%,暗示大部分小鼠lncRNAs尚未被報(bào)道。分析發(fā)現(xiàn)該合集中新lncRNAs具有腦器官特異性,但沒(méi)有發(fā)育階段特異性。對(duì)新ln

8、cRNAs和已知轉(zhuǎn)錄本進(jìn)行加權(quán)共表達(dá)網(wǎng)絡(luò)分析發(fā)現(xiàn)了57個(gè)模塊,其中對(duì)腦組織表達(dá)的轉(zhuǎn)錄本模塊進(jìn)行的表達(dá)譜熱圖和GO生物學(xué)過(guò)程富集分析表明腦模塊中腦特異基因的富集,為功能注釋奠定基礎(chǔ)。基于隨機(jī)化實(shí)驗(yàn)確定的共表達(dá)閾值,篩選了12548個(gè)預(yù)測(cè)的具有功能的lncRNAs,其中包括3128個(gè)預(yù)測(cè)的腦功能相關(guān)的lncRNAs。進(jìn)一步利用牽連獲罪(guilt by association)方法預(yù)測(cè)新 lncRNAs的功能,結(jié)果發(fā)現(xiàn)預(yù)測(cè)出功能的新 lnc

9、RNAs數(shù)量比基于加權(quán)共表達(dá)網(wǎng)絡(luò)的方法的數(shù)量多1倍,并且注釋的功能條目數(shù)目要多2倍以上,突出了這種方法在預(yù)測(cè)lncRNAs功能方面的作用?;诮徊孀C實(shí)和獨(dú)立測(cè)試數(shù)據(jù)的檢驗(yàn)初步證明牽連獲罪方法的有效性。
  最后,對(duì)lncRNA合集中腦表達(dá)的lncRNAs進(jìn)行篩選,得到約246464個(gè)lncRNAs。對(duì)這些 lncRNAs進(jìn)行基因組和功能基因組注釋,發(fā)現(xiàn)已知基因注釋僅能覆蓋不足1/3的lncRNAs;而幾乎所有的lncRNAs都可以

10、通過(guò)Entrez Gene ID得以在基因組定位,因此 lncbrain注釋平臺(tái)中可以通過(guò)該 ID進(jìn)行 lncRNAs查詢。對(duì)lncRNAs的注釋存儲(chǔ)在建立的lncbrain注釋平臺(tái)中,該平臺(tái)具有較優(yōu)的平臺(tái)設(shè)計(jì)架構(gòu)及可視化界面,可對(duì)查詢進(jìn)行流暢的響應(yīng)。平臺(tái)中除了有預(yù)先計(jì)算好的基因組注釋,還有支持使用者實(shí)時(shí)的表觀基因組和功能基因組分析模塊。此外,本文還對(duì)lncbrain平臺(tái)的使用進(jìn)行了詳細(xì)的介紹。
  綜上所述,本文篩選了大量的腦表

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論