版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、關聯(lián)分析和基因組預測是對植物復雜數(shù)量性狀進行基因鑒定和遺傳改良的重要方法。自2001年以來,應用關聯(lián)分析方法發(fā)掘植物數(shù)量性狀基因就備受關注,大量的方法以及軟件包已經(jīng)涌現(xiàn),統(tǒng)計功效和運算效率也隨之增加,然而針對多位點、多性狀的關聯(lián)分析還未受到廣泛關注。此外,近年來,基因組預測也成為國際植物基因組學研究的熱點,不同于傳統(tǒng)的標記輔助選擇,基因組預測利用染色體組上的全部的標記信息來預測植物自交系或者雜種后代的表現(xiàn),能夠大大縮短育種時間,從而有效
2、降低了育種成本。大量的參數(shù)方法、半?yún)?shù)及非參數(shù)方法已用于基因組選擇。隨著分子生物技術的發(fā)展,能夠獲得各種組學的數(shù)據(jù),包括代謝組和轉錄組等,這為表型預測提供了新數(shù)據(jù)源。但如何有效利用這些組學數(shù)據(jù)以及預測方法,還未見系統(tǒng)的比較以及應用?;诖?,本文基于LASSO和偏最小二乘分別提出了多位點和多性狀的關聯(lián)分析方法,旨在提高關聯(lián)分析的檢驗功效;此外,本文分別基于玉米自交系群體以及雜交水稻群體對多種統(tǒng)計方法和不同組學數(shù)據(jù)的預測力進行比較,并利用相
3、關組學信息預測了水稻重組自交系群體所有潛在雜交種的產(chǎn)量。研究內(nèi)容主要包括以下兩個方面:
一、多位點和多性狀關聯(lián)分析
(1)基于LASSO的多位點關聯(lián)分析方法。多位點的關聯(lián)分析方法能同時考慮所有位點,并且不涉及多重測驗校正,因此與單位點方法相比具有更高的檢測功效。本研究將LASSO方法用于關聯(lián)分析,并首次采用兩種顯著性測定方法檢驗LASSO方法中位點的顯著性,分別為基于bootstrap的LASSO-A和基于混合模型方
4、程的LASSO-B,并通過模擬研究比較了基于混合線性模型的GEMMA方法和LASSO方法的檢驗功效和假發(fā)現(xiàn)率。模擬結果表明LASSO-A方法具有最高的檢驗功效以及最低的假發(fā)現(xiàn)率,即使位點的表型貢獻率很低,LASSO仍可以檢測到。本文利用LASSO-A、LASSO-B和GEMMA方法對422份油棕材料的13個經(jīng)濟性狀進行GWAS,LASSO方法共檢測到19個與經(jīng)濟性狀相關的標記位點,很大一部分在前人通過連鎖分析獲得的QTL附近,而GEMM
5、A方法僅檢測到三個顯著SNP,并且均被LASSO方法檢測到。在LASSO方法檢測到的顯著位點中,一些位點具有一因多效性,控制了多個性狀,并且這些性狀間也顯著相關。無論在模擬數(shù)據(jù)還是實際數(shù)據(jù)中,LASSO均有較高的檢驗功效,該方法是對現(xiàn)有關聯(lián)分析方法的一個很好的補充。
(2)基于多元偏最小二乘的多性狀聯(lián)合關聯(lián)分析。在實際育種工作中,經(jīng)常要同時考慮多個復雜性狀。多性狀聯(lián)合分析既可利用性狀之間的遺傳相關又可利用環(huán)境相關信息,可有效提
6、高分析結果的精確度。本文提出了用于優(yōu)異等位基因挖掘和遺傳效應估計的多性狀聯(lián)合關聯(lián)分析方法,該方法采用多元偏最小二乘和兩階段變量選擇策略,結合BIC信息準則進行最優(yōu)模型中變量的選擇,通過計算機模擬在不同樣本大小,遺傳力以及PIC下研究該方法的可行性,并與單性狀多位點關聯(lián)分析進行結果比較。結果表明:相比于單性狀分析,多性狀聯(lián)合分析可以提高檢測功效,尤其對一因多效基因優(yōu)勢更加明顯;樣本容量、遺傳力、PIC以及效應值的大小均對候選基因的統(tǒng)計功效
7、、效應估計值的準確度和精確度具有重要影響。
二、基因組預測方法比較研究及其應用
(1)玉米自交系中組學預測的統(tǒng)計方法比較。為了更好地了解不同組學數(shù)據(jù)和不同方法的預測準確性,本文利用339個玉米自交系中測量得到100K個SNP,28769個轉錄產(chǎn)物,748個代謝物作為數(shù)據(jù)源,采用8種預測方法對6個玉米農(nóng)藝性狀進行預測,并比較不同數(shù)據(jù)來源和不同方法的預測效果。方法包括LASSO,最佳線性無偏預測(BLUP),BayesA
8、,BayesB,偏最小二乘法(PLS)以及再生核希爾伯特空間(RKHS)和支持向量機(SVM-RBF和SVM-POLY)。結果表明在玉米自交系農(nóng)藝性狀的預測中,BLUP方法在所有組學和性狀的綜合預測效果最好,基因組預測較代謝組和轉錄組的預測效果好。本文將所有組學數(shù)據(jù)合并后對6個性狀進行預測,發(fā)現(xiàn)預測力沒有明顯提高。此外,為了更好的了解性狀的遺傳結構,對6個性狀進行了全基因組關聯(lián)分析,同時利用LASSO方法檢測出對農(nóng)藝性狀有顯著影響的代謝
9、物。最后,根據(jù)不同的閾值進行了標記的篩選,并利用篩選后的標記進行了基因組預測,通過交叉驗證發(fā)現(xiàn)預測效果沒有明顯改善。
(2)雜交水稻產(chǎn)量及其相關性狀的組學預測。利用水稻的基因組,轉錄組以及代謝組的數(shù)據(jù)對水稻雜交種的產(chǎn)量及其構成性狀進行預測并對預測效果進行評價。本文從210份水稻重組自交系親本中有可能產(chǎn)生的21495個雜交種中,隨機選擇278份材料進行表型鑒定,并利用這278份材料作為訓練樣本來預測所有可能樣本的產(chǎn)量相關性狀,發(fā)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 煙草煙堿含量的全基因組關聯(lián)分析及其候選基因預測.pdf
- 油菜株型相關性狀的全基因組關聯(lián)分析.pdf
- 整合功能注釋的全基因組選擇和關聯(lián)分析方法研究.pdf
- HBV相關肝病的全基因組關聯(lián)研究.pdf
- 復雜網(wǎng)絡分析方法在全基因組關聯(lián)研究中的應用.pdf
- 加權SNP集分析方法在全基因組關聯(lián)研究中的應用.pdf
- 復雜性狀與基因組多位點的關聯(lián)分析方法研究.pdf
- 一種全基因組關聯(lián)分析模型的建立及在基因組選擇中的應用.pdf
- 水稻耐淹發(fā)芽相關性狀的全基因組關聯(lián)分析.pdf
- 基因和基因組結構分析.pdf
- 全基因組關聯(lián)分析搜尋中國人群白癜風免疫相關基因.pdf
- 木瓜核基因組和線粒體基因組的拼接和初步分析.pdf
- 基因、基因組和基因組學
- 腸道菌群與冠心病的宏基因組關聯(lián)分析.pdf
- 不同數(shù)據(jù)結構下的基因組關聯(lián)分析.pdf
- 雞攻擊行為的全基因組關聯(lián)分析.pdf
- 基于奇異值分解和SCAD估計的多位點全基因組關聯(lián)分析方法.pdf
- 水稻全基因組葉綠體蛋白的預測和進化分析.pdf
- 39035.基于生物學通路方法的全基因組關聯(lián)分析
- 10821.復雜網(wǎng)絡方法在全基因組關聯(lián)研究中的應用
評論
0/150
提交評論