一種交替運用固定效應(yīng)和隨機效應(yīng)模型優(yōu)化全基因組關(guān)聯(lián)分析的算法開發(fā).pdf_第1頁
已閱讀1頁,還剩131頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、在全基因組關(guān)聯(lián)分析策略的幫助下,更多的人類疾病和重要農(nóng)業(yè)經(jīng)濟性狀的候選基因被發(fā)掘出來。但是全基因組關(guān)聯(lián)分析一直飽受兩個問題的困擾:大量的假陽性和令人惋惜的假陰性。
  假陽性是指關(guān)聯(lián)分析結(jié)果中對檢測標(biāo)記p值的高估。通常這種高估是由群體結(jié)構(gòu)和個體之間的親緣關(guān)系矩陣造成的。將群體結(jié)構(gòu)作為固定效應(yīng)加入到一般線性模型中或者同時將群體結(jié)構(gòu)作為固定效應(yīng),親緣關(guān)系矩陣作為隨機效應(yīng)加在混合線性模型中可以很好的控制假陽性,但同時兩種效應(yīng)變量與待檢測

2、位點之間的混雜問題降低了模型對關(guān)聯(lián)位點的檢測效力,造成了一定程度的假陰性。這種現(xiàn)象報道于2010年發(fā)表在Nature的一篇擬南芥全基因組關(guān)聯(lián)分析的文章中。由于簡單模型(未校正群體分層)p值高估造成的假陽性,和復(fù)雜模型(加入了個體間親緣關(guān)系矩陣)p值低估造成的假陰性,開花期類的性狀中一些已知的候選基因無論使用一般線性模型還是混合線性模型都無法與背景噪音分離。
  本文闡述了一個新的算法來解決混合線性模型中存在的混雜問題,名字為“Fi

3、xed and random model Circulating Probability Unification”,簡稱為FarmCPU。FarmCPU通過交替使用一個固定效應(yīng)模型和一個隨機效應(yīng)模型來解決模型中的混雜問題??赡荜P(guān)聯(lián)位點(pseudo QTNs)在固定效應(yīng)模型中用做協(xié)變量來控制假陽性,并通過隨機效應(yīng)模型進行預(yù)測。固定效應(yīng)模型和隨機效應(yīng)模型交替使用直到?jīng)]有新的可能關(guān)聯(lián)位點加到模型中時,F(xiàn)armCPU結(jié)束。相比混合線性模型,F(xiàn)

4、armCPU顯著的提高了統(tǒng)計效力的計算速度,結(jié)果如下:
  (1)107個擬南芥真實性狀的研究結(jié)果顯示FarmCPU找回了混合線性模型結(jié)果中丟失的部分候選基因,并可廣泛的應(yīng)用于人類,豬,小鼠,玉米等各個物種數(shù)據(jù)。
  (2)模擬性狀的研究結(jié)果顯示FarmCPU相比當(dāng)前的混合線性模型具有更高的統(tǒng)計效力,對一個由500個等效關(guān)聯(lián)位點模擬的具有75%遺傳力的性狀,在10%錯誤率下,F(xiàn)armCPU相比混合線性模型多檢測到50個關(guān)聯(lián)位

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論