2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩136頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、生物體內(nèi)天然狀態(tài)的雙鏈DNA幾乎都是以B構(gòu)型DNA(B-DNA)存在,也就是沃森克里克在1953年發(fā)現(xiàn)的右手雙螺旋DNA結(jié)構(gòu)。右手雙螺旋DNA理論的提出標(biāo)志著現(xiàn)代分子生物學(xué)的誕生。之后的二十多年間分子生物學(xué)家一直把DNA視為在結(jié)構(gòu)上遵循B-DNA模型的靜態(tài)分子。直到1979年Rich等人通過高分辨率的單晶體X射線衍射技術(shù)第一次發(fā)現(xiàn)了Z-DNA(Z conformation DNA,又稱左手螺旋DNA),科學(xué)家們才認(rèn)識到DNA的構(gòu)象其實是

2、多種構(gòu)象之間的動態(tài)平衡。
  但是關(guān)于Z-DNA的研究進展緩慢,在之后的幾年里,這個具有特殊結(jié)構(gòu)的生物分子的生物學(xué)意義受到了分子生物學(xué)家的廣泛質(zhì)疑。從事Z-DNA構(gòu)象和功能研究的實驗室逐漸減少,以至于上世紀(jì)八十年代后期到九十年代初期科學(xué)家對Z-DNA的科研興趣越來越小。隨著近二十年來Z-DNA在生物學(xué)過程和諸多疾病發(fā)生機制中的潛在作用逐漸被揭示,有關(guān)Z-DNA的研究開始引起越來越多實驗生物學(xué)家的關(guān)注。
  一般認(rèn)為,當(dāng)DNA

3、片段從B構(gòu)象到Z構(gòu)象的轉(zhuǎn)換(B-to-Z transition)過程中DNA負(fù)超螺旋(Negative Supercoiling)解旋釋放能量,DNA吸收能量使得核苷酸發(fā)生構(gòu)象改變形成反順交替的結(jié)構(gòu),因此Z-DNA構(gòu)象是一種高能狀態(tài),且其存在時間很短所以又是瞬時的行為,當(dāng)它行使功能后便釋放能量從高能狀態(tài)下的Z-DNA恢復(fù)成穩(wěn)定低能狀態(tài)下的B-DNA構(gòu)象。由于以上原因,它很難在體內(nèi)被準(zhǔn)確地捕捉和定位,且?guī)追NZ-DNA結(jié)合蛋白的識別效率較低

4、,通過實驗方法檢測的效果不佳。綜上所述,通過Z-DNA的序列特征和結(jié)構(gòu)特征,采用生物信息學(xué)的方法來對其進行預(yù)測則是一個較為可行的辦法。預(yù)測得到的結(jié)果不但可以在基因組的尺度上了解Z-DNA的特征,探索ZDRs的分布,還可對Z-DNA生物學(xué)功能的研究起到輔助作用。這些都是本研究的出發(fā)點和落腳點。
  已知Z-DNA的分布與一些疾病的染色體斷裂點的分布一致,但至今無人對Z-DNA與癌癥拷貝數(shù)變異的潛在關(guān)系進行研究。
  本研究目的

5、是:
  1.通過改進Z-Catcher以提供切實可行、方便快捷的Z-DNA預(yù)測的生物信息學(xué)方法;
  2.探索Z-DNA潛在區(qū)域在人類基因組和模式生物基因組中的分布;
  3.對Z-Catcher2的預(yù)測結(jié)果進行整理、綜合構(gòu)建數(shù)據(jù)庫和Z-DNA網(wǎng)站來供給對Z-DNA感興趣的科研人員查詢、下載使用;
  4.尋找Z-DNA與結(jié)腸癌拷貝數(shù)變異的潛在聯(lián)系。
  本研究內(nèi)容主要分為以下四個部分:
  第一部

6、分:Z-DNA潛在區(qū)域的預(yù)測方法和Z-Catcher2的提出。
  Z-Catcher2相對于其它已有方法有三個優(yōu)點:第一,輸入序列可以是任意長度的片段,可以是一段基因區(qū)域,一條染色體或者是整個基因組文件,且同一文件中可以有多條查詢序列。第二,輸出的Z-DNA潛在區(qū)域長度為大于等于12bps(初始滑窗長度)的序列,因為Z-Catcher2的搜索策略是搜索出盡可能長的不間斷的Z-DNA區(qū)域,以負(fù)超螺旋密度(σ0)為閾值來判斷查詢序列

7、是否滿足形成Z-DNA所需的能量。第三,程序運行快,對人類基因組序列進行一次Z-Catcher2掃描大概需要15小時左右。
  對Z-Catcher2預(yù)測結(jié)果的驗證方面,使用了經(jīng)典Z-DNA片段來測試Z-Catcher2的準(zhǔn)確性。對人類c-MYC基因的三個已知Z-DNA片段Z1,Z2和Z3進行預(yù)測,當(dāng)σ0=-0.075時可以檢測到Z2片段,當(dāng)σ0=-0.08時可以檢測到Z1、Z2片段,當(dāng)σ0=-0.09時可以同時檢測到Z1、Z2、

8、Z3,三個片段。通過比較使用nBMST在人類基因組(version hg19)中的運行結(jié)果發(fā)現(xiàn),當(dāng)σ0=-0.07時,Z-Catcher2預(yù)測的Z-DNA潛在區(qū)域結(jié)果中有66.88%同nBMST預(yù)測結(jié)果的68.56%有重疊。當(dāng)σ0=-0.075時,Z-Catcher2預(yù)測的Z-DNA潛在區(qū)域結(jié)果覆蓋了86%的nBMST預(yù)測結(jié)果。剩余未重疊部分則可能是因為nBMST方法未加入Z-DNA的熱動力特征所產(chǎn)生的差異。
  第二部分:利用Z

9、-Catcher2探索Z-DNA潛在區(qū)域在人類基因組以及模式生物基因組中的分布。
  本章使用Z-Catcher2對人類基因組(version hg38),人類近緣的黑猩猩基因組,模式生物基因組(果蠅、秀麗線蟲、大鼠、小鼠、斑馬魚、啤酒酵母、擬南芥)進行了Z-DNA的分析。在人類基因組中得到了幾個重要結(jié)果。首先,Z-DNA潛在區(qū)域在基因組中的分布同GC含量雖然具有一定的正相關(guān)性,但也有些GC含量較高的染色體中ZDRs的含量相對較低

10、,而一些GC含量較低的染色體中卻含有較多的ZDRs。在對其它模式生物的ZDRs預(yù)測結(jié)果和GC含量的考查中同樣發(fā)現(xiàn),二者之間雖具有相關(guān)性但這樣的相關(guān)性并不具有統(tǒng)計學(xué)意義,比如小鼠、大鼠基因組的GC含量只比人類和黑猩猩基因組的略高,但其預(yù)測得到的ZDRs數(shù)量卻是前兩者的2倍多。其次,人類基因組中預(yù)測得到的ZDRs長度分布與隨機序列上ZDRs的長度分布明顯不同,人類的ZDRs長度大于41 bps的約占40%,而隨機序列上的ZDRs長度大于41

11、 bps的序列則只占了0.8%,77.8%的隨機序列上的ZDRs長度在12~20 bps之間。再次,Z-DNA潛在區(qū)域明顯富集在編碼基因的轉(zhuǎn)錄起始位點附近,并且Z-DNA潛在區(qū)域在非編碼基因的轉(zhuǎn)錄起始位點附近則未見明顯富集現(xiàn)象。最后,編碼蛋白基因里的外顯子中ZDRs的含量顯著高于內(nèi)含子中ZDRs的含量。在考查了其它基因組后發(fā)現(xiàn),除了與人類近緣的黑猩猩基因組中出現(xiàn)類似人類的外顯子和內(nèi)含子所含ZDRs存在差異的現(xiàn)象之外,其余模式生物都不存在

12、這種現(xiàn)象。另外,在長鏈非編碼RNA中ZDRs的密度與編碼蛋白基因內(nèi)含子中ZDRs的密度相似,但其顯著低于外顯子中ZDRs的密度。
  第三部分:Z-DNA潛在區(qū)域數(shù)據(jù)庫的構(gòu)建、網(wǎng)頁查詢以及數(shù)據(jù)下載。
  本部分中,對Z-Catcher2在各個模式生物基因組中得到的Z-DNA潛在區(qū)域的數(shù)據(jù)進行整理綜合,然后建立動態(tài)查詢網(wǎng)頁,面向科研工作者提供Z-Catcher2得到的Z-DNA潛在區(qū)域結(jié)果和Z-Catcher2程序本身的下載。

13、因為Z-DNA潛在區(qū)域的結(jié)果相對簡單,不涉及二維表之間的關(guān)聯(lián)所以使用輕型開源的SQLite軟件來構(gòu)建數(shù)據(jù)庫。另外SQLite數(shù)據(jù)庫和R語言平臺的連接非常方便,R中有專門連接SQLite的程序包。動態(tài)網(wǎng)頁的制作則使用R語言平臺下的Shiny package。Shiny是一款出自Rstudio公司的在R平臺下功能強大的動態(tài)網(wǎng)頁制作的程序包。動態(tài)網(wǎng)頁被分成前端的UI界面和后端的SERVER服務(wù)器兩個單獨的R腳本。使用Shiny包可以快速地制作

14、出美觀實用的動態(tài)網(wǎng)頁,省去了理解HTML文件、美化網(wǎng)頁等繁瑣操作,繼而可以專心于數(shù)據(jù)處理和對處理結(jié)果的呈現(xiàn),目前該軟件包已經(jīng)成為炙手可熱的網(wǎng)頁制作新方法。
  第四部分:探索Z-DNA與結(jié)腸癌拷貝數(shù)變異的潛在聯(lián)系。
  Z-DNA的已知生物學(xué)功能除了與基因轉(zhuǎn)錄密切相關(guān)外,就是能夠引起染色質(zhì)的遺傳不穩(wěn)定性。在哺乳動物中,CG、GT等低拷貝重復(fù)區(qū)域能夠引起附近序列發(fā)生大片段的缺失、染色體重排現(xiàn)象;而且這些區(qū)域也與一些疾病中發(fā)現(xiàn)的

15、DNA序列斷裂點高度一致。另外染色體二級結(jié)構(gòu)的變化能夠引起染色體的拷貝數(shù)變異現(xiàn)象,致病的拷貝數(shù)變異區(qū)域(大片段的缺失和擴增)常見于癌癥病人中。但Z-DNA與癌癥拷貝數(shù)變異的關(guān)系還未見報導(dǎo)。
  本部分研究使用已知可信的結(jié)腸癌拷貝數(shù)變異峰值區(qū)域,通過計算峰值區(qū)域內(nèi)ZDRs的密度與整條染色體內(nèi)ZDR密度的差異來探索Z-DNA與結(jié)腸癌拷貝數(shù)變異的潛在聯(lián)系。發(fā)現(xiàn)17個顯著擴增的CNV峰值區(qū)域中有13個ZDR密度明顯高于染色體ZDR密度;2

16、8個顯著缺失的CNV峰值區(qū)域中有15個ZDR密度顯著高于染色體ZDR密度;與結(jié)腸癌腫瘤惡性程度高度相關(guān)的15個CNV峰值區(qū)域中有12個區(qū)域出現(xiàn)ZDRs富集現(xiàn)象,這提示我們ZDR富集現(xiàn)象使得這些存在癌基因和抑癌基因的區(qū)域內(nèi)由ZDRs引起的遺傳不穩(wěn)定事件發(fā)生的頻率變高,或者說該區(qū)域本身就是遺傳不穩(wěn)定事件發(fā)生的高頻區(qū),異常的CNV改變了這些基因的表達(dá)情況從而也就在根本上促進了癌癥的發(fā)生以及發(fā)展。
  綜上所述,因為Z-DNA的特殊結(jié)構(gòu)和

17、高能瞬時構(gòu)象使得科研人員對Z-DNA片段本身的探索變得非常困難,有必要采用生物信息預(yù)測的方法來對Z-DNA的潛在區(qū)域進行預(yù)測和分析,從而為Z-DNA生物學(xué)功能的研究奠定基石。本課題屬于Z-DNA方面的基礎(chǔ)研究,以Z-DNA的預(yù)測和探索Z-DNA潛在區(qū)域在基因組中的分布及其與結(jié)腸癌拷貝數(shù)變異的潛在關(guān)系為研究目的。首先,在本研究組前期工作的基礎(chǔ)上開發(fā)了一個新穎的預(yù)測Z-DNA潛在區(qū)域的方法并且使用Perl語言實現(xiàn)該方法,命名Z-Catche

18、r2。其次,使用Z-Catcher2對人類基因組和其他模式生物基因組進行ZDR的預(yù)測并且探索了ZDR在基因組中的分布。再次,綜合了已有各模式生物基因組中ZDR數(shù)據(jù),使用R語言平臺構(gòu)建關(guān)于Z-DNA的動態(tài)查詢網(wǎng)頁并提供Z-Catcher2程序的下載,這填補了現(xiàn)階段Z-DNA數(shù)據(jù)庫和網(wǎng)頁查詢的空白。最后通過計算結(jié)腸癌CNV峰值區(qū)域中ZDRs密度和區(qū)域邊界附近ZDR數(shù)量發(fā)現(xiàn)了ZDR的分布于結(jié)腸癌CNV的潛在聯(lián)系。希望本課題所做的基礎(chǔ)研究能夠為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論