豬基因組中拷貝數(shù)變異分析及多聚腺苷酸化位點的發(fā)掘.pdf_第1頁
已閱讀1頁,還剩134頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、1.利用基因組重測序數(shù)據(jù)分析中外豬品種馴化過程中的拷貝數(shù)變異
  在野豬到家豬的馴化和進(jìn)一步形成品種的過程中,遺傳、變異和選擇在不同程度上,對品種的形成以及品種差異的產(chǎn)生起著一定的作用。通過研究家豬與野豬及家豬不同品種之間基因組序列的差異,可以發(fā)現(xiàn)基因組上的變異??截悢?shù)變異(copynumber variation,CNV)是指與生物正常的基因序列相比,基因組中所發(fā)生的長度范圍介于1Kb至數(shù)Mb的變異,其形式包括重復(fù)、缺失及衍生出

2、的復(fù)雜染色體微結(jié)構(gòu)變異。本研究利用豬基因組重測序數(shù)據(jù),對中外家豬13個品種共49個個體進(jìn)行CNV分析,并分析拷貝數(shù)變異區(qū)域(CNVR)內(nèi)相關(guān)基因的功能。同時,通過比較中外豬品種在馴化過程中產(chǎn)生的CNV,研究中外豬品種在馴化過程中受到選擇的CNV及其相關(guān)基因,從而發(fā)現(xiàn)中外豬品種表型差異的遺傳基礎(chǔ)。為進(jìn)一步解析豬基因組變異及豬品種改良奠定基礎(chǔ)。主要結(jié)果如下:
  1.1利用生物信息學(xué)方法分析家豬馴化過程中的CNV。以本實驗室通城豬基因

3、組個體重測序數(shù)據(jù)及公共數(shù)據(jù)庫下載的不同豬品種和野豬共49個個體重測序數(shù)據(jù)為材料,利用CNVseq和CNVnator軟件分別進(jìn)行CNV掃描。發(fā)現(xiàn),從野豬到家豬馴化過程中產(chǎn)生的CNVRs共有3131個,其中拷貝數(shù)增加的區(qū)域有745個、減少的區(qū)域2364個,增加和減少都存在的區(qū)域有22個;根據(jù)CNVR在基因組上的位置,繪制出豬全基因組CNVs圖譜。
  1.2利用實時熒光定量PCR方法驗證CNVRs。利用實時熒光定量PCR方法對隨機(jī)選取

4、的28個區(qū)域進(jìn)行拷貝數(shù)的驗證,結(jié)果24個CNVRs的拷貝數(shù)與預(yù)測CNVRs內(nèi)拷貝數(shù)的增加或減少相符合,驗證符合率為86%。
  1.3 CNV的分布特征分析。對3131個CNVRs及上下游10Kb區(qū)域中的重復(fù)元件(SINE、LINE和LTR等)的數(shù)量及分布密度進(jìn)行統(tǒng)計分析,結(jié)果發(fā)現(xiàn)在CNVRs及上下游10Kb的區(qū)域中,不同重復(fù)元件的分布密度均顯著高于基因組中的平均水平,表明CNV常分布在基因組中重復(fù)元件附近,重復(fù)元件對CNV發(fā)生有

5、重要影響。
  1.4家豬馴化過程中CNVR相關(guān)基因的功能分析。利用BioMart工具,在家豬馴化過程中產(chǎn)生的3131個CNVRs中發(fā)現(xiàn)1266個編碼蛋白的基因,利用DAVID工具對基因進(jìn)行功能富集分析,發(fā)現(xiàn)這些基因主要參與細(xì)胞粘附、GTP酶活性、細(xì)胞連接、免疫反應(yīng)、嗅覺和MAPK通路等。
  1.5中外家豬在馴化過程中產(chǎn)生的差異CNVR及相關(guān)基因功能分析。通過分析發(fā)現(xiàn),中國家豬中存在2278個CNVRs,歐洲家豬中存在17

6、06個CNVRs。分別特異存在于中外家豬中的CNVRs有129個和147個,分別對CNVRs內(nèi)相關(guān)基因進(jìn)行功能富集分析,結(jié)果顯示,中國家豬馴化過程中產(chǎn)生的特異CNVRs內(nèi)相關(guān)基因的功能富集在免疫反應(yīng)及生產(chǎn)性狀上;而歐洲家豬馴化過程中產(chǎn)生的特異CNVRs內(nèi)相關(guān)基因的功能富集在肌肉發(fā)育過程。
  2.利用轉(zhuǎn)錄組數(shù)據(jù)分析豬基因組多聚腺苷酸化位點
  多聚腺苷酸化是RNA轉(zhuǎn)錄后修飾的一個重要過程,在mRNA的轉(zhuǎn)運及成熟mRNA的翻譯

7、過程中起到關(guān)鍵作用。一個基因序列上多聚腺苷酸化位點(polyadenylation site,PAS)的數(shù)量以及每個PAS的利用程度不同會引起選擇性多聚腺苷酸化(alternative polyadenylation,APA)的形成,從而導(dǎo)致同一個基因產(chǎn)生多個轉(zhuǎn)錄本,對基因的表達(dá)及功能的發(fā)揮產(chǎn)生重要影響。本研究利用豬轉(zhuǎn)錄組數(shù)據(jù),從全基因組水平挖掘豬的PAS,通過研究PAS與基因表達(dá)量的關(guān)系,進(jìn)一步研究PAS對性狀的影響。主要結(jié)果如下:<

8、br>  2.1基于大規(guī)模轉(zhuǎn)錄組數(shù)據(jù)挖掘豬的多聚腺苷酸化位點。利用本實驗室感染藍(lán)耳病病毒前后的通城豬和大白豬中肺泡巨噬細(xì)胞的轉(zhuǎn)錄組數(shù)據(jù)及公共數(shù)據(jù)庫下載的豬的轉(zhuǎn)錄組數(shù)據(jù),包括12種組織、細(xì)胞及精子等的轉(zhuǎn)錄組數(shù)據(jù),共計120億個reads,其中有194萬個含有Poly(A)或Poly(T)的reads成功比對到基因組上,對這些reads進(jìn)行PAS挖掘,共得到28363個PASs。
  2.2對PAS位置進(jìn)行注釋。依據(jù)目前豬基因組注釋文

9、件中基因的位置信息,對本研究得到的28363個PASs進(jìn)行位置注釋,共發(fā)現(xiàn)13033個(47%) PASs位于7403個基因中,其中有7900個PASs(61%)位于基因的3'UTR,3441個PASs(26%)位于基因的內(nèi)含子區(qū)域,2187個PASs(17%)位于基因的ORF區(qū)域;利用所有轉(zhuǎn)錄組數(shù)據(jù)對豬的新轉(zhuǎn)錄本進(jìn)行預(yù)測,并對剩余的15330個PASs進(jìn)行位置注釋,結(jié)果表明,有6806個(24%) PASs位于預(yù)測的新轉(zhuǎn)錄本內(nèi)部。即:

10、利用基因組注釋文件和預(yù)測新的轉(zhuǎn)錄本信息,共發(fā)現(xiàn)19839個PASs(70%)位于基因內(nèi)部區(qū)域,8524個PASs(30%)位于基因間區(qū)域。
  2.3 PAS在基因組和不同組織中的分布特性?;谪i基因組注釋文件中基因的位置信息,對基因及其3'UTR內(nèi)的PAS分布進(jìn)行分析,結(jié)果顯示,近41%的基因中存在至少兩個以上的PASs,這些PAS可促使同一基因產(chǎn)生多個轉(zhuǎn)錄本;而對基因內(nèi)及其3'UTR中相鄰PASs間的距離分析發(fā)現(xiàn),大多數(shù)PAS

11、s(45%)間的距離很近(<1Kb);對3'UTR中的PAS與終止子間的距離分析發(fā)現(xiàn),PAS在3,UTR上的位置具有較大差異,該距離的中值為307nt;通過對肝臟及睪丸組織中PAS進(jìn)行挖掘,分別得到12777和14375個PASs,而兩個組織相同的PAS僅有4752個,占總數(shù)量的21%,并且,兩個組織中相同PAS的利用率差異很大,說明PAS具有組織特異性。
  2.4利用Pearson方法對PAS和基因表達(dá)量進(jìn)行相關(guān)性分析。本研究

12、利用源于不同雄性激素水平的睪丸和肝臟組織的轉(zhuǎn)錄組數(shù)據(jù),對每個數(shù)據(jù)中基因的表達(dá)量、相應(yīng)基因內(nèi)PAS的數(shù)量及覆蓋的reads數(shù)進(jìn)行統(tǒng)計,利用Pearson方法對PAS與基因表達(dá)量進(jìn)行相關(guān)性分析。結(jié)果表明,基因內(nèi)PAS數(shù)量與基因表達(dá)量呈中度正相關(guān)(0.4<r<0.6,p<0.01),PAS覆蓋的reads數(shù)與基因表達(dá)量呈強(qiáng)正相關(guān)(0.6<r<0.8,p<0.01)。
  2.5 PAS利用率對雄性激素水平及在細(xì)菌感染機(jī)體過程中的作用分析

13、。依據(jù)睪丸和肝臟組織中雄性激素水平的高低,對不同數(shù)據(jù)中挖掘的PAS進(jìn)行差異利用率分析,結(jié)果表明,肝臟中有272個PASs在低雄性激素組中的利用率顯著高于在高雄性激素組中利用率(p<0.05,|log2FC|≥1),對差異利用率PAS所在的109個基因進(jìn)行功能富集分析發(fā)現(xiàn),這些基因參與到了固醇及脂肪酸的代謝、甾類激素的合成和細(xì)胞色素P450的代謝等過程(p<0.05);在睪丸中,有260個PASs的利用率具有極顯著差異的(p<0.05,|

14、log2FC|≥1),相應(yīng)的基因有163個,基因功能富集分析表明,很多基因同時參與精子形成和細(xì)胞周期等過程(p<0.05)。對感染沙門氏菌前后的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行PAS分析,發(fā)現(xiàn)38個PASs在感染后有較高的利用率,相關(guān)基因有28個,而41個PAS在感染前有較高的利用率,相關(guān)基因有26個(p<0.05,|log2FC|≥1)。分別對感染前后高利用率PAS的相關(guān)基因進(jìn)行功能富集分析,結(jié)果顯示,感染后高利用率PASs的相關(guān)基因參與免疫應(yīng)答和細(xì)胞

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論