2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩158頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、人類基因組草圖(HumanGenomeDraft,HGD)的繪制完成標(biāo)志著現(xiàn)代生命科學(xué)研究從基因組時代進(jìn)入了后基因組時代,研究的重心由結(jié)構(gòu)基因組學(xué)轉(zhuǎn)向功能基因組學(xué),基因彼此之間的相互作用、相互影響越來越多地受到研究者的關(guān)注。基因芯片作為一種高通量的檢測技術(shù),可以同時檢測成千上萬條基因的表達(dá)水平,成為研究基因與基因之間相互作用關(guān)系的強(qiáng)大工具。隨著基因芯片大量數(shù)據(jù)的產(chǎn)生,數(shù)據(jù)挖掘成為從基因芯片表達(dá)數(shù)據(jù)中解讀基因相關(guān)信息的重要技術(shù)手段。

2、 本研究針對目前關(guān)聯(lián)規(guī)則挖掘技術(shù)用于基因芯片表達(dá)數(shù)據(jù)分析時存在的問題,從三個方面進(jìn)行了比較全面和深入的研究:時序基因芯片表達(dá)數(shù)據(jù)的跨事務(wù)關(guān)聯(lián)規(guī)則挖掘、傳統(tǒng)關(guān)聯(lián)規(guī)則中基因表達(dá)狀態(tài)信息缺失問題及大量關(guān)聯(lián)規(guī)則的聚類問題等。本文的主要內(nèi)容及貢獻(xiàn)包括: (1)時序基因芯片表達(dá)數(shù)據(jù)中的跨事務(wù)關(guān)聯(lián)規(guī)則挖掘研究 為了解決傳統(tǒng)關(guān)聯(lián)規(guī)則忽視數(shù)據(jù)中的時間信息以及無法對基因的表達(dá)狀態(tài)進(jìn)行動態(tài)預(yù)測的問題,本研究提出將跨事務(wù)關(guān)聯(lián)規(guī)則挖掘技術(shù)引入到

3、時序基因芯片表達(dá)數(shù)據(jù)的分析之中,并對跨事務(wù)關(guān)聯(lián)規(guī)則進(jìn)行了詳細(xì)介紹。結(jié)合生物學(xué)數(shù)據(jù)庫,包括GeneOntology基因注釋數(shù)據(jù)庫、iHOP數(shù)據(jù)庫、DAVID生物信息學(xué)資源數(shù)據(jù)庫等,對挖掘出來的跨事務(wù)關(guān)聯(lián)規(guī)則進(jìn)行分析,結(jié)果顯示跨事務(wù)關(guān)聯(lián)規(guī)則能夠有效地挖掘時序基因芯片表達(dá)數(shù)據(jù)中的隱含信息,產(chǎn)生的關(guān)聯(lián)規(guī)則符合生物學(xué)背景,合理地描述基因之間的動態(tài)表達(dá)行為。因此,跨事務(wù)關(guān)聯(lián)規(guī)則為基因功能的預(yù)測提供了新的手段和方法。 (2)傳統(tǒng)關(guān)聯(lián)規(guī)則中基因

4、表達(dá)狀態(tài)信息缺失問題研究 通過對傳統(tǒng)關(guān)聯(lián)規(guī)則中基因表達(dá)狀態(tài)信息缺失這一問題的深入分析,本研究設(shè)計了一種新型的關(guān)聯(lián)規(guī)則類型--差異表達(dá)關(guān)聯(lián)規(guī)則(DifferentialExpressionAssociationRules,DEAR),并給出了基本定義及相關(guān)概念。為了能夠有效地挖掘差異表達(dá)關(guān)聯(lián)規(guī)則,本文提出了一種算法--差異表達(dá)關(guān)聯(lián)規(guī)則矩陣算法(DifferentialExpressionAssociationRulesMatrix

5、Algorithm,DEARM算法),并對進(jìn)行了詳細(xì)地闡述。實驗結(jié)果表明,差異表達(dá)關(guān)聯(lián)規(guī)則在發(fā)現(xiàn)基因表達(dá)模式及控制冗余規(guī)則產(chǎn)生方面要優(yōu)于傳統(tǒng)關(guān)聯(lián)規(guī)則。差異表達(dá)關(guān)聯(lián)規(guī)則作為一種新的關(guān)聯(lián)規(guī)則類型,是對關(guān)聯(lián)規(guī)則挖掘內(nèi)容的豐富,將有助于研究人員從基因芯片表達(dá)數(shù)據(jù)中揭示基因之間隱含的表達(dá)關(guān)系。 (3)大量關(guān)聯(lián)規(guī)則的聚類研究 關(guān)聯(lián)規(guī)則挖掘通常會推導(dǎo)出大量的規(guī)則,這給后期的分析與利用帶來了巨大的障礙。本研究針對這一現(xiàn)實問題,提出了采用

6、聚類分析對關(guān)聯(lián)規(guī)則進(jìn)行后期處理。為了更有效地對關(guān)聯(lián)規(guī)則進(jìn)行聚類,本文提出了新的關(guān)聯(lián)規(guī)則相似性度量方法-內(nèi)容結(jié)構(gòu)加權(quán)度量,從關(guān)聯(lián)規(guī)則的結(jié)構(gòu)及內(nèi)容上全面反映關(guān)聯(lián)規(guī)則的相似性,克服了已有度量方法的缺陷只注重內(nèi)容方面的缺陷。本文將聚類結(jié)果與生物學(xué)數(shù)據(jù)庫GeneOntology相結(jié)合進(jìn)行分析,從生物學(xué)的角度說明了同一個子類中的關(guān)聯(lián)規(guī)則所涉及的基因有著相似或者相關(guān)的生物學(xué)基礎(chǔ),體現(xiàn)了聚類在關(guān)聯(lián)規(guī)則后期分析處理中的價值。因此,聚類分析將為研究才從關(guān)聯(lián)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論