版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著新一代測(cè)序技術(shù)的發(fā)展及公共數(shù)據(jù)庫(kù)的建立,研究者們能夠快速地獲取海量小RNA測(cè)序數(shù)據(jù),那么該技術(shù)能否為人類(lèi)基因組學(xué)研究帶來(lái)新突破,關(guān)鍵在于研究者們?nèi)绾斡行У靥幚砗头治鲞@些數(shù)據(jù),一些生物信息學(xué)方法與軟件也應(yīng)運(yùn)而生。然而,大部分測(cè)序研究由于樣本較少而只是單純的統(tǒng)計(jì)描述,其中的一些統(tǒng)計(jì)分析方法也存在諸多的局限性。為此,本研究通過(guò)計(jì)算機(jī)模擬,從統(tǒng)計(jì)學(xué)角度,系統(tǒng)地評(píng)價(jià)了四種差異表達(dá)算法在小RNA測(cè)序數(shù)據(jù)分析中的統(tǒng)計(jì)學(xué)性質(zhì)和應(yīng)用效果;同時(shí)結(jié)合TC
2、GA公共數(shù)據(jù)庫(kù),從實(shí)際應(yīng)用的角度,基于miRNA/isomiR表達(dá)譜探討了小RNA測(cè)序數(shù)據(jù)的統(tǒng)計(jì)分析策略和方法。
第一部分:基于負(fù)二項(xiàng)分布和實(shí)際參數(shù)設(shè)計(jì)模擬試驗(yàn),考察四種特征選擇算法的一類(lèi)錯(cuò)誤和檢驗(yàn)效能,主要結(jié)論如下:⑴baySeq、DESeq和permutation檢驗(yàn)均能控制一類(lèi)錯(cuò)誤,其中baySeq控制過(guò)于嚴(yán)格,而edgeR算法的一類(lèi)錯(cuò)誤控制較差。Bonferroni校正后permutation檢驗(yàn)的一類(lèi)錯(cuò)誤輕度膨脹。⑵
3、在其他參數(shù)不變的條件下,各算法的檢驗(yàn)效能與兩組間均數(shù)差異成正比,與離散系數(shù)成反比,而與陰性基因比例π0無(wú)關(guān);相同參數(shù)條件下,baySeq、DESeq和edgeR算法的檢驗(yàn)效能均高于permutation檢驗(yàn)。通過(guò)對(duì)TCGA中的小RNA測(cè)序數(shù)據(jù)(BRCA)的實(shí)際分析,本研究提出“數(shù)據(jù)預(yù)處理→差異表達(dá)分析→聚類(lèi)分析→功能富集分析”的統(tǒng)計(jì)分析策略,若單純依據(jù)P值確定差異表達(dá)基因,四種方法的結(jié)果差異很大;若依據(jù)P值并同時(shí)結(jié)合生物學(xué)意義,即|lo
4、g2(FC)|≥2,則四種方法結(jié)果相近。較之正常組織,腫瘤組織中發(fā)生差異表達(dá)的miRNAs共有15種,它們的靶基因顯著地富集在一些腫瘤相關(guān)的生物學(xué)通路上。利用這15種miRNAs繪制的系統(tǒng)聚類(lèi)圖顯示,表達(dá)特征相近的miRNAs聚集在一起,而腫瘤組織與正常組織分界清楚。
第二部分:深入研究“臂轉(zhuǎn)換”現(xiàn)象和isomiR表達(dá)模式,同時(shí)比較了基于miRNA/isomiR表達(dá)譜的三種特征的判別效果??紤]到測(cè)序數(shù)據(jù)的極度偏態(tài)和過(guò)度離散特點(diǎn)
5、,本研究推薦使用Wilcoxon秩和檢驗(yàn)識(shí)別不同組織中發(fā)生“臂轉(zhuǎn)換”的pre-miRNAs;采用基于秩次變換的MANOVA比較多重isomiR表達(dá)模式的組間差異。另外,差異表達(dá)isomiRs對(duì)樣本的分類(lèi)效果優(yōu)于miRNA總讀數(shù)和標(biāo)準(zhǔn)序列,提示研究者們?cè)谶M(jìn)行小RNA測(cè)序數(shù)據(jù)分析時(shí)除了要關(guān)注miRNA的差異表達(dá),也要考察isomiR表達(dá)譜的變化趨勢(shì)。綜合上述分析,本研究認(rèn)為:⑴DESeq算法可以在不損失檢驗(yàn)效能的情況下同時(shí)控制假陽(yáng)性率,推薦
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于深度測(cè)序和生物信息學(xué)分析的衣藻小RNA研究.pdf
- 擬南芥種子發(fā)育過(guò)程小RNA深度測(cè)序數(shù)據(jù)的分析.pdf
- 白紋伊蚊miRNA的測(cè)序、鑒定及表達(dá)譜的初步分析.pdf
- 柑橘類(lèi)病毒的鑒定及其小RNA的深度測(cè)序分析研究.pdf
- 小RNA深度測(cè)序在幾種木本植物病毒鑒定中的應(yīng)用.pdf
- 肺癌miRNA表達(dá)譜的篩選及定量驗(yàn)證方法的研究.pdf
- 基于高通量測(cè)序技術(shù)的孕婦外周血miRNA表達(dá)譜分析及應(yīng)用研究.pdf
- 沙田柚自交和異交花柱miRNA測(cè)序及miRNA的差異表達(dá)分析.pdf
- 基于高通量測(cè)序技術(shù)的miRNA分析策略及數(shù)據(jù)挖掘研究.pdf
- 非小細(xì)胞肺癌患者全血細(xì)胞miRNA表達(dá)譜的建立及其特征的研究.pdf
- 宮頸鱗癌轉(zhuǎn)移相關(guān)miRNA表達(dá)譜的初步研究.pdf
- 莖特異表達(dá)基因EST測(cè)序分析及RNA微陣列驗(yàn)證.pdf
- 冷脅迫下東鄉(xiāng)野生稻表達(dá)譜測(cè)序分析.pdf
- 基于全轉(zhuǎn)錄組深度測(cè)序的垂體ACTH腺瘤mRNA及microRNA表達(dá)譜分析.pdf
- 基于基因表達(dá)譜的數(shù)據(jù)挖掘方法研究.pdf
- 高通量RNA-seq測(cè)序數(shù)據(jù)的基因表達(dá)水平分析研究.pdf
- 小干涉rna遞送方法的研究
- 基于譜聚類(lèi)方法的基因表達(dá)數(shù)據(jù)分析研究.pdf
- 基于SAM的基因表達(dá)譜數(shù)據(jù)分析方法研究及應(yīng)用.pdf
- 基于高通量測(cè)序技術(shù)的非編碼RNA研究.pdf
評(píng)論
0/150
提交評(píng)論