版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、過(guò)去十年中,全基因組關(guān)聯(lián)分析(GWAS)研究提高人們對(duì)疾病遺傳學(xué)的認(rèn)知和理解,對(duì)于發(fā)現(xiàn)基因型-表型關(guān)系起到關(guān)鍵作用。在GWAS分析中,遺傳學(xué)家依靠DNA多態(tài)性標(biāo)記來(lái)檢測(cè)這些關(guān)聯(lián)關(guān)系。單核苷酸多態(tài)性是其中最流行的一類遺傳標(biāo)記,可以用來(lái)挖掘疾病的致病原因和潛在的生物機(jī)理。迄今為止,大多數(shù)遺傳關(guān)聯(lián)研究使用單基因位點(diǎn)分析策略,其中每個(gè)基因變體單獨(dú)和特定的表型關(guān)聯(lián)測(cè)試。但是這種策略在復(fù)雜疾病中則表現(xiàn)不成功,例如高血壓、糖尿病和哮喘等,這是由于單位
2、點(diǎn)分析忽略上位效應(yīng),有些位點(diǎn)僅能夠通過(guò)與其他基因的相互作用而影響疾病,而該基因位點(diǎn)的主效應(yīng)的影響非常小或者不存在,這一現(xiàn)象也被稱為“丟失的遺傳性”。研究表明,上位性是復(fù)雜的人類疾病病因中普遍存在的成分,在許多性狀的遺傳控制起到至關(guān)重要的作用。
隨著高通量測(cè)序技術(shù)的出現(xiàn),使得研究人員能夠在全基因組范圍內(nèi)檢測(cè)上位效應(yīng),能夠更好的揭露出復(fù)雜疾病潛在的遺傳機(jī)理。而在全基因組范圍檢測(cè)上位效應(yīng)所遭遇到的第一個(gè)困難和挑戰(zhàn)是計(jì)算負(fù)擔(dān)。在本文研
3、究中,提出一種基于混合隨機(jī)森林框架的預(yù)篩選模型,來(lái)選擇最佳候選集合,然后在候選集合中使用MDR算法來(lái)檢測(cè)上位效應(yīng)?;旌想S機(jī)森林模型能夠篩選出主效應(yīng)顯著的上位效應(yīng)模型和主效應(yīng)微弱而組合效應(yīng)顯著的純上位效應(yīng)。在相加模型、相乘模型、閾值模型和純上位模型四種類型的實(shí)驗(yàn)中驗(yàn)證了我們的算法,實(shí)驗(yàn)結(jié)果表明該算法具有一定的實(shí)際意義。
另外我們提出一種基于梯度提升模型的置換方法,用來(lái)檢測(cè)主效應(yīng)微弱的純上位效應(yīng)。所提出的置換梯度提升模型pGBM,
4、通過(guò)移除SNP相互作用對(duì)GBM模型分類器的影響,來(lái)檢測(cè)最有可能發(fā)生相互作用的SNP組合對(duì)。我們采用平均AUC差值來(lái)定義相互作用,進(jìn)而將模型應(yīng)用到非平衡數(shù)據(jù)集上。在實(shí)驗(yàn)驗(yàn)證中當(dāng)遺傳互質(zhì)性大于0.01的時(shí)候,該算法的檢測(cè)能力能夠達(dá)到百分之百,遺傳互質(zhì)性取值小于0.01的時(shí)候,其檢測(cè)能力也遠(yuǎn)高于pRF算法。同時(shí)采用CPU并行計(jì)算的思想,提升模型的運(yùn)算速度,進(jìn)而縮短計(jì)算時(shí)間。pGBM算法采用6個(gè)CPU并行計(jì)算時(shí),要比pRF算法快4.78倍。這種
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于隨機(jī)森林算法的煙霧檢測(cè)算法研究.pdf
- 基于隨機(jī)梯度提升決策樹(shù)的行人檢測(cè)算法設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于隨機(jī)森林的硬盤(pán)故障預(yù)測(cè)算法的研究.pdf
- 基于梯度算子的圖像邊緣檢測(cè)算法研究.pdf
- 基于圖像特征的森林煙霧和火焰檢測(cè)算法研究.pdf
- 基于梯度算子和類間方差邊緣檢測(cè)算法研究.pdf
- 結(jié)合梯度和顯著特征的目標(biāo)檢測(cè)算法的研究.pdf
- 基于灰度、梯度和膚色特征的通用人臉檢測(cè)算法研究.pdf
- 隨機(jī)森林的特征選擇和模型優(yōu)化算法研究.pdf
- 面向過(guò)去算子的隨機(jī)模型檢測(cè)算法與應(yīng)用.pdf
- LTE-FDD的隨機(jī)接入檢測(cè)算法的研究和PRACH仿真模型設(shè)計(jì).pdf
- 基于隨機(jī)森林模型的心臟CT圖像分割算法研究.pdf
- 基于膚色檢測(cè)模型的人臉檢測(cè)算法研究.pdf
- 基于矢量梯度的彩色圖像邊緣檢測(cè)算法實(shí)現(xiàn).pdf
- 基于TDD-LTE的隨機(jī)接入檢測(cè)算法研究.pdf
- 結(jié)合SURF與Hough森林模型的人臉檢測(cè)算法研究.pdf
- 基于梯度方向直方圖的快速人體檢測(cè)算法.pdf
- 基于高斯混合模型的運(yùn)動(dòng)目標(biāo)檢測(cè)算法研究和應(yīng)用.pdf
- 基于粗糙集理論的網(wǎng)絡(luò)入侵檢測(cè)算法和模型研究.pdf
- 基于梯度方向直方圖的人體檢測(cè)算法的改進(jìn).pdf
評(píng)論
0/150
提交評(píng)論