版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、隨著系統(tǒng)生物學(xué)的發(fā)展,基因組學(xué)、蛋白組學(xué)、代謝組學(xué)等在疾病診斷、藥物療效等方面應(yīng)用日益廣泛?;颉⒌鞍?、代謝等生物信息學(xué)數(shù)據(jù)通常是高維,而特征選擇技術(shù)能從高維數(shù)據(jù)中過濾掉噪音和無關(guān)變量,從而有效的降維。本文對(duì)特征選擇技術(shù)及其在生物信息處理中的應(yīng)用進(jìn)行研究。
生物信息學(xué)時(shí)間序列數(shù)據(jù)分析有助于探尋疾病的發(fā)生發(fā)展過程,尋找疾病發(fā)生的前瞻性標(biāo)志物。傳統(tǒng)的處理時(shí)間序列方法常用來處理某種監(jiān)測變量在相對(duì)較短的時(shí)間間隔下的連續(xù)測量值,主要用于
2、預(yù)測、異常點(diǎn)檢測及分類等。而生物信息學(xué)中的時(shí)間序列通常是多樣本及高維數(shù)據(jù)在時(shí)間維度上的序列,且時(shí)間點(diǎn)少。本文對(duì)生物信息學(xué)中時(shí)間序列數(shù)據(jù)處理方法進(jìn)行研究,為從大量變量中篩選反應(yīng)疾病發(fā)生的前瞻性標(biāo)志信息,提出了一種利用相對(duì)偏差思想來對(duì)時(shí)間序列特征選擇的方法wRDA。為了反應(yīng)不同時(shí)間點(diǎn)在疾病發(fā)生發(fā)展過程中的所處的階段不同,wRDA方法采用各個(gè)時(shí)間點(diǎn)上加權(quán)的相對(duì)偏差并累加來尋找疾病的前瞻性標(biāo)志信息。為驗(yàn)證wRDA方法的有效性,本文將其分別應(yīng)用到
3、一個(gè)動(dòng)物肝病實(shí)驗(yàn)和一個(gè)人群肝病的代謝時(shí)間序列數(shù)據(jù)處理中,同時(shí),結(jié)合臨床時(shí)間序列數(shù)據(jù)處理的特點(diǎn),兼顧樣本儲(chǔ)藏時(shí)間的影響,本文對(duì)同一時(shí)間點(diǎn)的不同采樣時(shí)間加權(quán),將wRDA擴(kuò)展為w2RDA方法。動(dòng)物時(shí)間序列代謝組學(xué)的數(shù)據(jù)分析實(shí)驗(yàn)結(jié)果表明,wRDA能夠發(fā)現(xiàn)已知的重要的反映肝病不同病程的代謝物,同時(shí)所選變量能夠較好的區(qū)分有病與無病、肝癌和非肝癌樣本。在人群肝病的時(shí)間序列代謝數(shù)據(jù)處理中,發(fā)現(xiàn)篩選的特征子集中血清膽汁酸在癌前階段具有長期升高的現(xiàn)象,因此
4、本文推測膽汁酸為肝癌發(fā)生的風(fēng)險(xiǎn)因子。
針對(duì)生物信息學(xué)數(shù)據(jù)具有變量維度高、樣本少的特點(diǎn),本文提出了一種特征選擇算法ReliefF-WS,用來過濾噪聲及降低維度。算法首先利用類重疊的思想對(duì)樣本進(jìn)行度量并賦予一定的權(quán)值,質(zhì)量好的樣本將獲得較高的權(quán)值,質(zhì)量差的樣本得到較低的權(quán)值。ReliefF算法是一種快速有效的過濾式特征選擇算法,將類重疊樣本加權(quán)的思想應(yīng)用到ReliefF算法中對(duì)其進(jìn)行改進(jìn),可以降低ReliefF算法在特征權(quán)值更新過
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 特征選擇及其在文本信息處理中的應(yīng)用.pdf
- 熵分析方法在生物信息處理中的應(yīng)用.pdf
- 若干統(tǒng)計(jì)計(jì)算模型研究及其在生物醫(yī)學(xué)信息處理中的應(yīng)用.pdf
- 深度相機(jī)若干處理算法及其在生物識(shí)別特征中的應(yīng)用研究.pdf
- 量子糾纏及其在量子信息處理中的應(yīng)用研究.pdf
- 智能信息處理技術(shù)在生物學(xué)與網(wǎng)絡(luò)通訊中的應(yīng)用.pdf
- 螺旋相位板及其在光學(xué)信息處理中的應(yīng)用研究.pdf
- 計(jì)算動(dòng)詞理論及其在信息處理中的應(yīng)用研究.pdf
- 指紋信息處理及其在網(wǎng)絡(luò)身份認(rèn)證中的應(yīng)用研究.pdf
- 神經(jīng)網(wǎng)絡(luò)優(yōu)化方法及其在信息處理中的應(yīng)用研究.pdf
- 軟計(jì)算方法及其在通信信息處理中的應(yīng)用研究.pdf
- 量子信息處理中弱測量的應(yīng)用研究.pdf
- 進(jìn)化算法及其在生物信息中的應(yīng)用.pdf
- 離子液體在生物質(zhì)預(yù)處理中的應(yīng)用研究.pdf
- 結(jié)構(gòu)化漢字信息處理方法及其應(yīng)用研究.pdf
- 數(shù)據(jù)流技術(shù)及其在電力信息處理中的應(yīng)用研究.pdf
- 智能信息處理方法及其在嵌入式系統(tǒng)中的應(yīng)用研究.pdf
- 相干態(tài)在量子信息處理中的應(yīng)用研究.pdf
- 感性信息處理在圖像檢索中的應(yīng)用研究.pdf
- 尺度空間理論在生物特征識(shí)別中的應(yīng)用研究.pdf
評(píng)論
0/150
提交評(píng)論