版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、大量SNP標記的出現,使以單個標記為中心的關聯(lián)分析方法逐漸轉變成以單倍型為主的關聯(lián)分析方法。以單倍型為主的分析方法的首要問題是如何獲取單倍型。通過實驗手段獲取單倍型成本較高,利用基因型數據通過單倍型推斷獲取單倍型是當前首選方法。 針對一般系譜和緊密連鎖的SNP標記,本研究提出了一種快速和準確的單倍型推斷方法。該方法通過三步六條規(guī)則,利用親子關系確定有序基因型,逐步剔除多余的單倍型,最后通過最大似然法確定單倍型組合。利用SIMPE
2、D程序模擬數據驗證在不同系譜大小,不同標記數目和不同標記基因型缺失率等參數組合條件下,單倍型推斷方法的效率和準確性,并與PEDPHASE程序作比較。結果表明我們的方法的運行速度和準確性都優(yōu)于PEDPHASE。我們的方法的運行速度比PEDPHASE快10~15倍;準確性比PEDPHASE高4~10%。同時結果還說明了我們的方法的準確性幾乎不受系譜大小、標記數目和標記基因型缺失率的影響。 在零重組單倍型推斷方法的基礎上,本研究又提出
3、了有重組的單倍型推斷方法。同樣,該方法也是三步六規(guī)則,利用親子關系確定有序基因型,逐步剔除多余的單倍型,最后通過最大似然法確定單倍型組合。與零重組單倍型推斷方法不同的地方在于本方法的六條規(guī)則要按標記順序正向和反向運行兩次,同時本方法第五條規(guī)則中的閾值與零重組單倍型推斷方法不同,由零重組數閾值變成最小重組數閾值。同樣該方法也通過SIMPED模擬不同系譜大小、標記數目、標記間重組率和標記基因型缺失率等共81種參數組合情況下的標記基因型數據,
4、從而對算法的效率和準確性進行驗證,并與PEDPHASE進行比較。結果說明我們的方法具有較高的效率和準確性,在絕大多數的情況下要優(yōu)于PEDPHASE。 在對上述單倍型推斷算法進行驗證的同時,我們還分析系譜大小和結構、標記數目、標記基因型缺失率和標記間重組率對單倍型推斷的影響。 隨著系譜變大,單倍型推斷算法運行時間也增長。一般情況下,單倍型推斷的準確性會隨著系譜增大而降低;但是在零重組的條件下,單倍型推斷的準確性有隨著系譜增
5、大而提高的趨勢;系譜中基礎群個體比例的增加會降低單倍型推斷的準確性。 標記數目的增加會加長單倍型推斷算法的運行時間。在標記間重組率較大的情況下,單倍型推斷的準確性會隨著標記數目的增加而明顯降低;當標記間重組率較小時,這種降低的趨勢就變得不明顯了。 標記間重組率對單倍型推斷的影響非常大。在零重組的條件下,單倍型推斷的準確率相當高,可以接近和達到1;在有重組的情況下,單倍型推斷的準確率會隨著重組率的增加而降低,且變化明顯。同
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 一般中立型延遲積分微分方程的單支方法研究.pdf
- 一般物品采購單
- 不同單倍型塊定義在單倍型塊結構推斷與htSNPs選擇中的效應.pdf
- 一般的驗貨方法
- 一般Ⅱ型逐步刪失數據下的一些統(tǒng)計推斷問題的研究.pdf
- 一般物品采購單 (2)
- 對含有缺失基因型數據的家系進行單倍型推斷的EM方法.pdf
- 一般物品采購單 (1)
- 一般單種群最優(yōu)捕獲策略.pdf
- 櫻桃一般繁殖方法
- 基于單倍型的關聯(lián)分析方法.pdf
- 單倍型的關聯(lián)分析方法研究.pdf
- 科學的一般原理和方法
- 圖像預處理的一般方法
- 韓國短期一般一般研修人簽證所需材料c-1單次
- 一般路基施工方法
- 一般路基施工方法
- 求定義域的一般方法
- 電路的一般分析方法ppt課件
- [學習]電阻電路的一般分析方法
評論
0/150
提交評論