版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、泛素和類泛素偶聯(lián)是最重要的蛋白質(zhì)翻譯后修飾之一,負(fù)責(zé)調(diào)控各種各樣的生物學(xué)過程。在真核生物中,泛素化和其它類泛素修飾有相似的酶級聯(lián)E1(泛素激活酶)-E2(泛素偶聯(lián)酶)-E3(泛素蛋白連接酶)。泛素和類泛素研究發(fā)現(xiàn)了一千多個具有活性的酶,但是不能確定它們的正確分類以及在物種中的準(zhǔn)確數(shù)量。經(jīng)過文獻(xiàn)檢索,已收集到E1,E2,E3和DUB的數(shù)量分別是26、105、1003和148。綜合文獻(xiàn)中的各種觀點,所有酶分為1、3、19和7個家族。對活性結(jié)
2、構(gòu)域保守的E1,E2,E3和DUB家族,分別建立了1、1、15和6個隱馬可夫譜。對活性結(jié)構(gòu)域不保守的家族,采用了雙向BLAST的同源搜索辦法。經(jīng)過實驗驗證的酶作為測試集,評估了預(yù)測性能和隱馬可夫譜識別的特異性。最后,本文構(gòu)建了泛素和類泛素偶聯(lián)酶的數(shù)據(jù)庫UUCD(Ubiquitin and Ubiquitin-like Conjugation Database),包含E1,E2,E3和DUB酶的數(shù)量分別是738、2937、46631和66
3、47,這些酶分布在70種真核生物中。利用泛素和類泛素偶聯(lián)酶,可以分析泛素和類泛素偶聯(lián)系統(tǒng)與復(fù)雜疾病的關(guān)系。在Cancer Gene Census和Drugbank這兩個數(shù)據(jù)庫中,發(fā)現(xiàn)只有27個癌癥基因和16個藥物靶點與人類的泛素和類泛素偶聯(lián)酶相關(guān)。通過超幾何分布的統(tǒng)計學(xué)分析,發(fā)現(xiàn)它們在泛素和類泛素偶聯(lián)系統(tǒng)中不顯著(P-value>0.05)。但是KEGG的分析結(jié)果顯示泛素和類泛素偶聯(lián)酶在小細(xì)胞肺癌相關(guān)的PI3K-Akt信號、細(xì)胞循環(huán)、自
4、噬和p53信號通路中起著重要的作用。
E3能特異性地識別底物,決定泛素化修飾的特異性。目前已開發(fā)有多種預(yù)測泛素化位點的工具,但它們不能揭示底物位點和E3的關(guān)系。通過文獻(xiàn)檢索,本文發(fā)現(xiàn)1027個具有E3特異性的位點。單個位點可能對應(yīng)多個E3,按照位點和E3的一對一原則,整合出1214對site-E3組合。根據(jù)UUCD數(shù)據(jù)庫中E3的分類原則,全部site-E3組合可分為類、組、亞組、家族和個體五種水平。在家族水平上可分為10個數(shù)據(jù)
5、集,在個體水平上可分為92個數(shù)據(jù)集。E3特異性的位點預(yù)測選在家族和個體水平上進(jìn)行。訓(xùn)練過程采用GPS2.2(Group-based Prediction System,version2.2)算法中的模體長度選擇、權(quán)重訓(xùn)練和矩陣突變。每個數(shù)據(jù)集的cutoff分為high,medium和low三種水平,分別對應(yīng)于假陽性率(False positive rate,FPR)為2%、6%和10%時的閾值。根據(jù)上述分類、訓(xùn)練結(jié)果以及cutoff設(shè)置
6、,本分開發(fā)了具有層次分類結(jié)構(gòu)的E3特異性的泛素化位點預(yù)測工具GPS-PLUB1.0,可以預(yù)測10種E3家族和92種E3個體特異性的泛素化位點。此外,GPS-PLUB1.0可對實驗發(fā)現(xiàn)的141076個泛素化位點進(jìn)行大規(guī)模預(yù)測。
泛素偶聯(lián)類型是底物位點泛素化的具體表現(xiàn)形式,包括單聚泛素化和不同鏈類型的多聚泛素化。每種泛素偶聯(lián)類型能決定底物的功能。許多泛素化研究難以揭示底物的E3酶,但是容易驗證底物的泛素偶聯(lián)類型。大量位點泛素偶聯(lián)類
7、型數(shù)據(jù)的產(chǎn)生,迫切需要預(yù)測工具對數(shù)據(jù)特征進(jìn)行整合。通過文獻(xiàn)檢索,收集到1485個含泛素偶聯(lián)類型的位點。單個位點可能對應(yīng)多個泛素偶聯(lián)類型,按照位點與泛素偶聯(lián)類型的一對一原則,整合出2122對位點與泛素偶聯(lián)類型的組合。所有組合可分為2個組、2個亞組和7個家族,組成11個數(shù)據(jù)集。數(shù)據(jù)集的訓(xùn)練過程采用了GPS3.0算法。
綜上所述,生物信息學(xué)在泛素和類泛素偶聯(lián)研究中有著重要的應(yīng)用。利用生物信息學(xué)中的方法,構(gòu)建了泛素和類泛素偶聯(lián)的酶數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 生物信息學(xué)
- 生物信息學(xué)課件
- 生物信息學(xué)導(dǎo)論
- 生物信息學(xué)教案
- 生物信息學(xué)課程信息
- 生物信息學(xué)概論
- 生物信息學(xué)在G蛋白偶聯(lián)受體功能研究中的運(yùn)用.pdf
- 生物信息學(xué)序列分析
- 生物信息學(xué) 期末復(fù)習(xí)
- 生物信息學(xué)考試大綱
- 生物信息學(xué)作業(yè)實驗
- 蛋白質(zhì)泛素化的生物信息學(xué)分析.pdf
- 基于生物信息學(xué)方法的系統(tǒng)異常診斷.pdf
- 生物信息學(xué)選擇題
- 中藥寒熱屬性的生物信息學(xué)研究.pdf
- 生物信息學(xué)復(fù)習(xí)題
- 生物信息學(xué)及其發(fā)展歷史
- 生物信息學(xué) 復(fù)習(xí)題
- 生物信息學(xué)實驗報告
- 生物信息學(xué)作業(yè)實驗6
評論
0/150
提交評論