版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、絕大多數(shù)動(dòng)植物重要性狀是由少數(shù)較大效應(yīng)的基因和較多效應(yīng)較小的基因控制,并受環(huán)境修飾的數(shù)量性狀。為在動(dòng)植物育種中更好地利用和改良這些性狀,需要深入解析這些性狀的遺傳基礎(chǔ)。目前,關(guān)聯(lián)分析是解析數(shù)量性狀遺傳基礎(chǔ)的主要途徑。
隨著測(cè)序技術(shù)的飛速發(fā)展,標(biāo)記數(shù)p遠(yuǎn)大于樣本容量n的超高維標(biāo)記小樣本數(shù)據(jù)已成常態(tài)。這無(wú)疑加重了關(guān)聯(lián)分析的計(jì)算壓力。如何在有限的樣本容量下快速準(zhǔn)確地從海量標(biāo)記中篩選出與數(shù)量性狀顯著關(guān)聯(lián)的位點(diǎn)成為一項(xiàng)重大挑戰(zhàn)。當(dāng)前廣泛
2、應(yīng)用的關(guān)聯(lián)分析方法是基于多基因背景和群體結(jié)構(gòu)控制的單位點(diǎn)全基因組掃描。這些方法不能同時(shí)估計(jì)所有標(biāo)記效應(yīng),只能在群體結(jié)構(gòu)與多基因背景控制下單獨(dú)估計(jì)每個(gè)標(biāo)記效應(yīng)。這些估計(jì)值可能是有偏的。為解決這一問題,本研究利用奇異值分解、SCAD和經(jīng)驗(yàn)Bayes估計(jì)、多位點(diǎn)遺傳模型和似然比檢驗(yàn),提出了一種多位點(diǎn)全基因組關(guān)聯(lián)分析新方法,通過三個(gè)Monte Carlo模擬試驗(yàn)和擬南芥開花時(shí)間相關(guān)性狀分析,來(lái)證實(shí)新方法的有效性。主要結(jié)果如下:
1、新
3、方法分為兩步:1)潛在關(guān)聯(lián)標(biāo)記的選擇。通過奇異值分解獲得所有標(biāo)記的效應(yīng)值,效應(yīng)值較大的標(biāo)記為可能潛在關(guān)聯(lián)標(biāo)記,進(jìn)一步用SCAD壓縮估計(jì)選擇出潛在關(guān)聯(lián)標(biāo)記;2)顯著QTN(quantitative trait nucleotide)的鑒定。將潛在關(guān)聯(lián)標(biāo)記放入多位點(diǎn)模型中,用經(jīng)驗(yàn)Bayes估計(jì)這些潛在關(guān)聯(lián)標(biāo)記效應(yīng),當(dāng)效應(yīng)絕對(duì)值大于10-5時(shí)用似然比檢驗(yàn)鑒定其與性狀的顯著關(guān)聯(lián)性。這種方法稱為基于奇異值分解和SCAD估計(jì)(Singular va
4、lue decomposition-SCAD screening plus empirical Bayes,S3-EB)的多位點(diǎn)關(guān)聯(lián)分析方法。
2、通過三個(gè)Monte Carlo計(jì)算機(jī)模擬試驗(yàn)來(lái)驗(yàn)證S3-EB的有效性。在第一個(gè)模擬試驗(yàn)中,從199個(gè)擬南芥品系216130個(gè)SNP的實(shí)際關(guān)聯(lián)群體中隨機(jī)抽取10000個(gè)SNP作為模擬關(guān)聯(lián)群體的基因型。在稀有等位基因頻率等于0.3的6個(gè)SNP上設(shè)置了6個(gè)模擬QTNs,其遺傳率分別設(shè)為0
5、.1、0.05、0.05、0.15、0.05和0.05。群體平均數(shù)和誤差方差均設(shè)置為10。通過模擬QTN基因型值和隨機(jī)誤差獲得199個(gè)品系的模擬表型觀察值,并重復(fù)1000次。用S3-EB、mrMLM、EMMA和FarmCPU四種方法分別分析每個(gè)模擬樣本數(shù)據(jù),結(jié)果表明:1)用上述四種方法檢測(cè)6個(gè)模擬QTNs的平均功效分別為74.8、67.03、46.0和41.87(%),成對(duì)t檢驗(yàn)表明:S3-EB的統(tǒng)計(jì)功效顯著高于另外三種方法(P-值介于
6、0.0036與0.0063之間);2)6個(gè)模擬QTNs的平均均方誤差(mean squared error,MSE)分別為0.1064、0.0934、0.5432和0.2824,成對(duì)t檢驗(yàn)表明:S3-EB的MSE顯著低于EMMA(P-值等于0.015),但與mrMLM和FarmCPU無(wú)顯著差異(P-值分別等于0.3199和0.1549);3)上述四種方法的計(jì)算時(shí)間分別為0.79、4.01、68.77和5.12小時(shí);4)四種方法的假陽(yáng)性率
7、分別為0.0489、0.0167、0.0325和0.0178(%),處于同一數(shù)量級(jí)。
若在第一個(gè)模擬試驗(yàn)中分別添加多基因背景和上位性背景,以研究這些背景干擾對(duì)S3-EB的QTN檢測(cè)功效和參數(shù)估計(jì)精度的影響。結(jié)果表明:這些結(jié)果與第一個(gè)模擬試驗(yàn)結(jié)果趨勢(shì)一致。
綜上所述,新方法通過奇異值分解,將運(yùn)算維度由計(jì)算數(shù)十萬(wàn)計(jì)SNP標(biāo)記效應(yīng)個(gè)數(shù)降低為計(jì)算數(shù)干計(jì)樣本容量效應(yīng)數(shù),快速獲得同一模型下全部標(biāo)記效應(yīng)值,有利于潛在關(guān)聯(lián)變量選擇,
8、提高了統(tǒng)計(jì)功效和參數(shù)估計(jì)精度,縮短了計(jì)算時(shí)間,使假陽(yáng)性率與Bonferroni矯正方法處于同一量級(jí),驗(yàn)證了新方法的有效性。
3、用上述四種方法分析了下載的199個(gè)擬南芥品系216130個(gè)SNP的開花時(shí)間相關(guān)性狀FLC、FRI、FT-GH和FT-Field。結(jié)果表明:1)上述四種方法檢測(cè)到與FLC顯著關(guān)聯(lián)標(biāo)記數(shù)分別為15、21、0和6,計(jì)算時(shí)間分別為0.0083、0.0684、1.0767和0.0838小時(shí);與FRI顯著關(guān)聯(lián)的標(biāo)
9、記數(shù)分別為6、8、33和5;與FT-GH顯著關(guān)聯(lián)的標(biāo)記數(shù)分別為17、4、0和7;與FT-Field顯著關(guān)聯(lián)的標(biāo)記數(shù)分別為17、24、0和9;2)建立數(shù)量性狀表型與顯著關(guān)聯(lián)標(biāo)記間的多元線性回歸模型,F(xiàn)LC性狀四種方法的BIC值分別為336、328.2、596.5和521.3;FRI的BIC值分別為163.5、156.7、322.3和211.6;FT-GH性狀的BIC值分別為-321.2、-296.1、314.6和-465.0;FT-Fie
10、ld性狀的BIC值分別為30.4、318.9、306.9和156.6。新方法BIC值處于最小或者次小,說(shuō)明新方法是相對(duì)較優(yōu)的;3)在上述關(guān)聯(lián)標(biāo)記±50kb范圍內(nèi),上述四種方法分別檢測(cè)到59、9、3和8個(gè)已報(bào)道的性狀相關(guān)基因,其中39個(gè)僅被S3-EB方法檢測(cè)到。這些結(jié)果也證實(shí)新方法的有效性。
為了便于推廣應(yīng)用該方法,在R環(huán)境下,基于附加包shiny,研制了S3-EB方法的應(yīng)用程序,嵌入多位點(diǎn)關(guān)聯(lián)分析軟件包mrMLM,可在Wind
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于MapReduce的奇異值分解方法研究.pdf
- 復(fù)雜性狀與基因組多位點(diǎn)的關(guān)聯(lián)分析方法研究.pdf
- 基于正則化濾波和奇異值分解的條紋模式方向估計(jì)和濾波方法研究.pdf
- 模態(tài)參數(shù)估計(jì)的奇異值分解算法研究.pdf
- 基于奇異值分解方法的廣義矩陣秩檢驗(yàn).pdf
- 基于矩陣奇異值分解的圖像壓縮方法研究.pdf
- 基于高階奇異值分解的視頻融合性能評(píng)價(jià)方法.pdf
- 基于DCT和奇異值分解的數(shù)字水印算法研究.pdf
- 基于奇異值分解的重分形交叉相關(guān)分析.pdf
- 基于奇異值分解和特征融合的人臉識(shí)別.pdf
- 27950.改進(jìn)奇異值分解方法及其應(yīng)用
- 基于奇異值分解的數(shù)字水印算法研究.pdf
- 基于有監(jiān)督奇異值分解和類隨機(jī)森林決策方法的腫瘤特征基因篩選研究.pdf
- 奇異值分解法計(jì)算廣義逆
- 基于小波變換和奇異值分解的水印算法的分析與研究.pdf
- 基于奇異值分解的數(shù)字水印技術(shù)研究.pdf
- 基于小波變換和奇異值分解的配電網(wǎng)故障檢測(cè)方法.pdf
- 基于奇異值分解和神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法的研究.pdf
- 基于奇異值分解的狀態(tài)監(jiān)測(cè)與故障診斷方法研究.pdf
- 基于奇異值分解和擴(kuò)頻技術(shù)的數(shù)字水印算法研究.pdf
評(píng)論
0/150
提交評(píng)論