版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基因的表達(dá)調(diào)控是功能基因組研究的一個(gè)核心組成部分.轉(zhuǎn)錄因子與DNA順式元件相結(jié)合,進(jìn)而激活下游靶基因是轉(zhuǎn)錄反應(yīng)發(fā)生和基因表達(dá)的關(guān)鍵步驟之一.很多的疾病被發(fā)現(xiàn)與轉(zhuǎn)錄因子的變異有關(guān),這也可能是由轉(zhuǎn)錄因子變異引起的調(diào)控網(wǎng)絡(luò)的變化所導(dǎo)致的.目前在人、鼠等的模式生物中仍有約50﹪的轉(zhuǎn)錄因子尚未被確定.作為研究轉(zhuǎn)錄調(diào)控過程的內(nèi)容之一,識(shí)別轉(zhuǎn)錄因子的重要性是顯而易見的.在基因組水平上確定轉(zhuǎn)錄因子或轉(zhuǎn)錄因子家族的范圍也是構(gòu)建和了解基因轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)的重要
2、前提工作.堿性/螺旋-環(huán)-螺旋(basic/Helix-Loop-Helix,bHLH)轉(zhuǎn)錄因子家族是真核生物體內(nèi)非常重要的轉(zhuǎn)錄因子超家族.該轉(zhuǎn)錄因子超家族廣泛存在于從酵母到人類的所有真核生物中,并在細(xì)胞增殖、決定和分化過程中發(fā)揮著重要作用.bHLH功能域大約60個(gè)氨基酸,包含了約15個(gè)氨基酸的堿性區(qū)和被一個(gè)可變長度的Loop區(qū)連接兩個(gè)α-螺旋區(qū).與DNA結(jié)合的堿性區(qū)的堿性氨基酸含量較高,HLH功能域通常先形成同源或異源二聚體或多聚體,
3、然后由堿性區(qū)與靶基因DNA上的特定六堿基序列結(jié)合.在全基因組水平上對(duì)bHLH家族轉(zhuǎn)錄因子的預(yù)測(cè)工作已經(jīng)在線蟲、果蠅、酵母、人類、擬南芥和水稻中完成.小鼠基因組測(cè)序的完成為我們?nèi)孀R(shí)別小鼠bHLH轉(zhuǎn)錄因子創(chuàng)造了令人興奮的機(jī)會(huì).公共數(shù)據(jù)庫中大規(guī)模的基因表達(dá)芯片數(shù)據(jù)也為我們構(gòu)建轉(zhuǎn)錄因子控制的調(diào)控網(wǎng)絡(luò)提供了良好的信息基礎(chǔ). 本論文的研究工作主要包括如下內(nèi)容: 1.小鼠bHLH轉(zhuǎn)錄因子家族預(yù)測(cè)的DP優(yōu)化:在已有預(yù)測(cè)模式的基礎(chǔ)之上,
4、通過對(duì)BLAST的查詢序列的擴(kuò)展性選擇和預(yù)測(cè)打分過程的動(dòng)態(tài)規(guī)劃實(shí)現(xiàn),提出了優(yōu)化后的預(yù)測(cè)小鼠bHLH蛋白的BLAST-DP法.應(yīng)用BLAST-DP法首次預(yù)測(cè)了測(cè)序完成后的小鼠基因組中bHLH轉(zhuǎn)錄因子家族,分析確定的124個(gè)小鼠bHLH轉(zhuǎn)錄因子.28個(gè)蛋白是前人研究中尚未發(fā)現(xiàn)的新成員,特別是有10個(gè)非典型預(yù)測(cè)蛋白(uncharacterized putative protein) 很可能就是新發(fā)現(xiàn)的轉(zhuǎn)錄因子.預(yù)測(cè)模式中保守位點(diǎn)的比較結(jié)果說明
5、:與擬南芥相比,大部分位點(diǎn)上,小鼠的保守度大于擬南芥.124個(gè)小鼠bHLH蛋白通過公認(rèn)的命名法和進(jìn)化分析被劃分到六個(gè)不同的子類(A~F).超過三分之二的小鼠bHLH轉(zhuǎn)錄因子蛋白都屬于A類或B類.打分情況顯示預(yù)測(cè)模型對(duì)鑒定A類、B類和E類蛋白是相當(dāng)準(zhǔn)確的,但對(duì)另外兩類的準(zhǔn)確度稍微欠佳.我們從蛋白功能分析中發(fā)現(xiàn)70﹪的小鼠bHLH蛋白在basic區(qū)包含Glu-9/Arg-12殘基對(duì),也就擁有識(shí)別CANNTG的基序.位于23位的形成二聚結(jié)構(gòu)所
6、必需的亮氨酸 (Leu) 在小鼠bHLH蛋白中保守度高達(dá)97﹪.GO(Gene Ontology)的統(tǒng)計(jì)分析顯示:bHLH蛋白主要參與細(xì)胞分化和細(xì)胞發(fā)育過程.本論文首次對(duì)bHLH蛋白的各類進(jìn)行了功能富集性統(tǒng)計(jì)分析.結(jié)果表明歸屬于各類的蛋白傾向于擁有特定的生物功能.最大的A類bHLH蛋白在細(xì)胞命運(yùn)確定 (cell fatecommitment) 和神經(jīng)系統(tǒng)發(fā)育中扮演重要角色.B類蛋白調(diào)控細(xì)胞周期,具有DNA結(jié)合活性.信號(hào)傳導(dǎo)、轉(zhuǎn)移酶活性、
7、轉(zhuǎn)錄輔激活蛋白活性、刺激反應(yīng)在C類蛋白中顯著富集.只有心臟發(fā)育在D類bHLH蛋白中顯著富集.E類蛋自在血管形成過程中發(fā)揮重要作用.F類蛋白有陽離子結(jié)合,尤其是鋅離子結(jié)合活性.很顯然,不同的蛋白類有特定的功能傾向.我們從中可以看出,bHLH蛋白序列的相似導(dǎo)致了它們功能的相似.這樣,小組內(nèi)那些新發(fā)現(xiàn)或性能尚不明確的蛋白成員的生物功能就可以從小組的功能富集性進(jìn)行推斷. 2.bHLH轉(zhuǎn)錄因子隱馬爾可夫模型的建立:為了建立適合所有真核生物
8、的bHLH的預(yù)測(cè)模型,我們首次使用剖面隱馬爾可夫模型 (Profile Midden Markov Models,PHMM)的機(jī)器學(xué)習(xí)算法構(gòu)建了bHLH蛋白的預(yù)測(cè)模型bHLH-HMM.構(gòu)建新模型的原因是BLAST-DP物種特異性太強(qiáng).雖然我們的BLAST-DP法是對(duì)原有BLAST方法做了優(yōu)化和改進(jìn),但由于BLAST自身打分矩陣的特征,所有基于BLAST的預(yù)測(cè)bHLH蛋白的方法都存在物種應(yīng)用范圍太窄的問題.這樣在對(duì)新物種的分析就受到了限制
9、.此外,針對(duì)小鼠基因組或蛋白質(zhì)組建立的方法流程并不一定適合其它物種.而且查詢序列或序列集的選擇受個(gè)人經(jīng)驗(yàn)的影響較大,預(yù)測(cè)的結(jié)果可能隨研究者的不同而不同.為了克服上述種種不足,我們將試驗(yàn)確定的真核bHLH轉(zhuǎn)錄因子作為隱馬爾可夫模型的訓(xùn)練集,經(jīng)過模型建立和模型校準(zhǔn)兩步建立了預(yù)測(cè)真核生物的bHLH蛋白的隱馬爾可夫模型.模型的性能評(píng)估結(jié)果顯示隱馬爾可夫模型在預(yù)測(cè)敏感度和準(zhǔn)確度方面明顯優(yōu)于所有基于BLAST的方法.為了用新建立的bHLH-HMM發(fā)
10、現(xiàn)更多的小鼠bHLH轉(zhuǎn)錄因子,我們bHLH蛋白隱馬預(yù)測(cè)模型對(duì)小鼠蛋白質(zhì)組再次進(jìn)行了分析,結(jié)果有113個(gè)蛋白達(dá)到了判定閾值,其中一個(gè)bHLH蛋白被新發(fā)現(xiàn).經(jīng)比較,與BLAST-DP法的結(jié)果有95﹪相同.為了獲得同源基因信息,我們對(duì)人類和大鼠的蛋白質(zhì)組也進(jìn)行了分析,并采用best-best的方法與小鼠的bHLH因子進(jìn)行了同源關(guān)系的確定.同時(shí),分別得到107人類bHLH轉(zhuǎn)錄因子和109個(gè)大鼠bHLH轉(zhuǎn)錄因子.值得注意的是對(duì)大鼠bHLH轉(zhuǎn)錄因子
11、家族目前尚未見其它的研究報(bào)道.通過上述兩種預(yù)測(cè)方法,我們?cè)谛∈蟮牡鞍踪|(zhì)組中找到了共計(jì)125個(gè)bHLH轉(zhuǎn)錄因子.此外,由于小鼠、大鼠和人類是哺乳動(dòng)物的典型代表.本論文首次通過對(duì)小鼠、大鼠和人類的bHLH蛋白的進(jìn)化分析,將哺乳動(dòng)物的bHLH轉(zhuǎn)錄因子分為30個(gè)家族(bootstrap值>35﹪).每個(gè)家族依據(jù)所包含的亞家族或其中最為熟知的成員而被命名.30個(gè)家族的規(guī)模大小不同,最小的如CLOCK,僅有3個(gè)成員蛋白;最大的HEY族包含了38個(gè)蛋
12、白.較大的家族又可細(xì)分為更多的亞家族.平均每個(gè)家族包含約11個(gè)蛋白.在進(jìn)化樹上,有一個(gè)功能未知的家族(UNKNOWN)被發(fā)現(xiàn)并有很高的支持度.bHLH蛋白家族在三個(gè)物種中都比較保守,并沒有發(fā)現(xiàn)僅在一個(gè)物種出現(xiàn)的bHLH蛋白家族,這可能是因?yàn)樾∈?、人和大鼠的進(jìn)化關(guān)系比較近的緣故. 3.小鼠腦中bHLH轉(zhuǎn)錄因子的調(diào)控網(wǎng)絡(luò)預(yù)測(cè):確定轉(zhuǎn)錄因子的一個(gè)主要目的就是構(gòu)建它們所控制的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò).很多研究報(bào)道bHLH蛋白是參與調(diào)控中樞神經(jīng)系統(tǒng)(
13、central nervous system,CNS)的發(fā)育過程非常重要的轉(zhuǎn)錄因子家族.為了研究bHLH轉(zhuǎn)錄因子在小鼠腦中的調(diào)控機(jī)制,基于我們的轉(zhuǎn)錄因子預(yù)測(cè)結(jié)果和已有的報(bào)道,我們第一次通過基因芯片表達(dá)譜和模塊網(wǎng)絡(luò)算法進(jìn)行了小鼠腦中bHLH轉(zhuǎn)錄因子調(diào)控網(wǎng)絡(luò)的推斷.經(jīng)過層層篩選和分析,最終推斷所得的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)包含了5個(gè)重要的bHLH轉(zhuǎn)錄因子和153個(gè)靶基因.整個(gè)網(wǎng)絡(luò)根據(jù)其表達(dá)譜被分為28個(gè)調(diào)模塊.每個(gè)模塊的靶基因數(shù)目從1到18不等.每個(gè)模
14、塊根據(jù)最富集的第4層GO分類來給定一個(gè)特定的名稱.眾多的調(diào)控模式顯示了所構(gòu)建的網(wǎng)絡(luò)的復(fù)雜性和多樣性.此外,26對(duì)協(xié)作因子也在調(diào)控網(wǎng)絡(luò)中被發(fā)現(xiàn).轉(zhuǎn)錄因子間的協(xié)作體現(xiàn)了因子間可能存在的物理互作或遺傳調(diào)控.令人感興趣的是,像Neurod6和Hey2這樣的積極因子調(diào)控著多個(gè)模塊.它們共同調(diào)控了表達(dá)方式不相同的蛋白激活酶催化模塊、細(xì)胞形態(tài)生成模塊和胚胎上皮生成模塊.兩個(gè)轉(zhuǎn)錄因子的轉(zhuǎn)錄因子角色和靶基因的角色在不同的模塊里面發(fā)生了交換,而且在表達(dá)上出
15、現(xiàn)了"交互抑制"的現(xiàn)象.我們發(fā)現(xiàn)在Hey2和Neurod6本身的蛋白序列也為它們結(jié)合相同的目的基因和彼此相互結(jié)合提供了可能性.在對(duì)預(yù)測(cè)出的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)的有效性評(píng)價(jià)過程中,網(wǎng)絡(luò)內(nèi)超過75﹪的轉(zhuǎn)錄因子-靶基因?qū)Ρ粏?dòng)區(qū)的轉(zhuǎn)錄因子結(jié)合位點(diǎn)的匹配所驗(yàn)證.在PubMed中的文獻(xiàn)挖掘又為5個(gè)模塊的調(diào)控關(guān)系提供了可信的支持.更重要的是,在最大的模塊中,關(guān)鍵元素間的調(diào)控關(guān)系被轉(zhuǎn)錄因子敲除突變?cè)囼?yàn)所證明.這個(gè)轉(zhuǎn)錄因子在其它兩個(gè)模塊的調(diào)控作用同樣得到了試驗(yàn)
16、驗(yàn)證.這樣看來,我們的調(diào)控網(wǎng)絡(luò)對(duì)了解bHLH轉(zhuǎn)錄因子在小鼠腦的生長發(fā)育和功能發(fā)揮過程中的角色具有非常重要的參考價(jià)值,同時(shí)也能為進(jìn)一步的試驗(yàn)研究給出了指導(dǎo)性數(shù)據(jù). 綜上所述,本論文針對(duì)bHLH轉(zhuǎn)錄因子家族,利用小鼠基因組、蛋白質(zhì)組數(shù)據(jù)和基因表達(dá)芯片數(shù)據(jù),充分使用生物信息學(xué)的方法和手段進(jìn)行bHLH轉(zhuǎn)錄因子家族的預(yù)測(cè)和轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)構(gòu)建.我們的研究結(jié)果提出更可靠便捷的專門預(yù)測(cè)小鼠bHLH蛋白的BLAST-DP法,同時(shí)應(yīng)用剖面隱馬爾可夫算
17、法建立適合所有真核生物的bHLH蛋白的預(yù)測(cè)模型bHLH-HMM.隨后,用這兩種方法在蛋白質(zhì)組中預(yù)測(cè)小鼠bHLH轉(zhuǎn)錄因子,進(jìn)行了分類、進(jìn)化、功能和同源基因確定等方面的分析. 最后利用我們的預(yù)測(cè)結(jié)果和腦組織基因表達(dá)芯片構(gòu)建bHLH轉(zhuǎn)錄因子在小鼠腦中的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò),并進(jìn)行了模塊化、網(wǎng)絡(luò)特性以及有效性評(píng)價(jià)、試驗(yàn)驗(yàn)證等研究.我們的研究結(jié)果不僅將極大推進(jìn)小鼠轉(zhuǎn)錄調(diào)控機(jī)理的研究進(jìn)展,也為人類相關(guān)疾病的分子生物學(xué)研究提供重要參考.此外,論文中研
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 家犬bHLH轉(zhuǎn)錄因子家族成員的鑒定及分析.pdf
- 金小蜂bHLH轉(zhuǎn)錄因子家族成員的鑒定與分析.pdf
- 蘋果bHLH轉(zhuǎn)錄因子家族的鑒定及表達(dá)分析.pdf
- 擬南芥轉(zhuǎn)錄因子bHLH34和bHLH104調(diào)控鐵平衡.pdf
- 35840.家蠶bhlh轉(zhuǎn)錄因子家族成員鑒定及其基因的電子克隆
- 17932.豌豆蚜蟲bhlh轉(zhuǎn)錄因子家族成員鑒定及其基因的電子克隆
- 新型轉(zhuǎn)錄因子數(shù)據(jù)庫及轉(zhuǎn)錄因子互調(diào)控網(wǎng)絡(luò)的構(gòu)建.pdf
- 12046.綠蜥蜴bhlh轉(zhuǎn)錄因子家族成員分類及進(jìn)化分析
- 甜瓜轉(zhuǎn)錄因子全基因組預(yù)測(cè)及ARF轉(zhuǎn)錄因子家族分析.pdf
- 病媒蚊bHLH轉(zhuǎn)錄因子的進(jìn)化分析.pdf
- lncRNA與轉(zhuǎn)錄因子關(guān)聯(lián)關(guān)系分析及調(diào)控網(wǎng)絡(luò)構(gòu)建.pdf
- 稻瘟病菌Zn2Cys6和bHLH家族轉(zhuǎn)錄因子功能分析.pdf
- 水稻和擬南芥基因組bHLH轉(zhuǎn)錄因子超家族生物信息學(xué)研究.pdf
- 10040.基于高通量數(shù)據(jù)的轉(zhuǎn)錄調(diào)控預(yù)測(cè)分析與調(diào)控網(wǎng)絡(luò)構(gòu)建研究
- 含F(xiàn)z-CRD結(jié)構(gòu)域的蛋白家族及兩類bHLH轉(zhuǎn)錄因子家族的系統(tǒng)進(jìn)化分析.pdf
- 轉(zhuǎn)錄因子AP-2α調(diào)控網(wǎng)絡(luò)的研究.pdf
- 小黑楊bHLH轉(zhuǎn)錄因子基因的克隆及遺傳轉(zhuǎn)化.pdf
- 大腸癌差異基因識(shí)別及轉(zhuǎn)錄因子調(diào)控網(wǎng)絡(luò)的構(gòu)建.pdf
- 玉米bHLH類轉(zhuǎn)錄因子基因B695的功能分析.pdf
- 轉(zhuǎn)錄因子Snail家族在EMT中對(duì)CD147轉(zhuǎn)錄調(diào)控機(jī)制的研究.pdf
評(píng)論
0/150
提交評(píng)論