2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩139頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、生物信息學Bioinformatics,,Species Phylogeny,Orangutan,Gorilla,Chimpanzee,Human,From the Tree of the Life Website,University of Arizona,Global Phylogeny of Fully Sequenced Organisms,Science. 2006 ; 311(5765):1283-7Toward au

2、tomatic reconstruction of a highly resolved tree of life,生物學家:We have a dream…,Tree of Life: 重建所有生物的進化歷史并以系統(tǒng)樹的形式加以描述,夢想走進現(xiàn)實:How?,最理想的方法:化石!—— 零散、不完整,比較形態(tài)學和比較生理學:確定大致的進化框架 —— 細節(jié)存很多的爭議,比較形態(tài)學證據(jù) (Comparative morphology),

3、普適性 由4種核酸組成 ? 分子水平的進化表現(xiàn)為:DNA序列的演化、氨基酸序列演化、蛋白質(zhì)結(jié)構(gòu)的演化 可比較性 比較不同物種的有關(guān)DNA序列 ? 建立DNA序列的演化模型、氨基酸序列的演化模型(數(shù)學模型) 蛋白質(zhì)結(jié)構(gòu)的演化模型 (形態(tài)、性狀的演化模型?) 基因組編碼信息的豐富 與形態(tài)、性狀包含的信息相比,基因組序列包含更多、更復雜的信息結(jié)構(gòu),第三種方案 進化學的分子

4、途徑,,分子系統(tǒng)發(fā)育學Molecular Phylogenetics分子系統(tǒng)學Molecular Systematics,What can we do for molecular evolution?序列比較:源于同一祖先DNA/氨基酸序列的兩條DNA/氨基酸序列,考察二者的差異。序列差異:進化過程中分子突變的痕跡分子進化:以累計在DNA/氨基酸分子上的歷史信息為基礎(chǔ),研究分子水平的生物進化過程和機制。,分子系統(tǒng)學為生

5、物分類問題提供了許多嶄新的見解。,基因突變,1、核苷酸替代、插入/缺失、重組2、基因轉(zhuǎn)換,,固定在生物個體以及物種內(nèi),遺傳漂變,自然選擇,,傳遞給后代,產(chǎn)生新的形態(tài)、性狀,分子系統(tǒng)學是研究進化機制的一個重要工具。,生物進化的分子機制,,性狀改變,DNA分子的改變,核苷酸替代substitution,核苷酸缺失deletion,核苷酸插入insertion,核苷酸倒位invertion,DNA序列的突變,從物種的一些分子特性出發(fā)

6、,構(gòu)建系統(tǒng)發(fā)育樹,進而了解物種之間的生物系統(tǒng)發(fā)生的關(guān)系 —— tree of life; 物種分類大分子功能與結(jié)構(gòu)的分析:同一家族的大分子,具有相似的三級結(jié)構(gòu)及生化功能,通過序列同源性分析,構(gòu)建系統(tǒng)發(fā)育樹,進行相關(guān)分析;功能預測進化速率分析:例如,HIV的高突變性;哪些位點易發(fā)生突變?,分子進化研究的目的,Tsar Nicholas IIEstablishing the identity of Anna Anderson Ma

7、nahan,《真假公主》—— 1917年俄國末代王朝被推翻,貴族與侍衛(wèi)全部逃走,而沙皇可憐的兒子老少一個都沒走脫,并于1918年被全部處決。但民間卻流傳著沙皇的小女兒死里逃生,遠走他鄉(xiāng)的故事。為了得到俄國沙皇的一千萬遺產(chǎn),許多人絞盡腦汁尋找安娜公主,終無所獲。俄國貴族后裔布丁將軍終于找到一位外貌氣質(zhì)酷似安娜公主的女子,于是訓練她皇室的各種禮儀及相關(guān)的人和事,安娜公主過關(guān)斬將。順利和皇太后相認,就在太后要宣布安娜公主為遺產(chǎn)繼承人并與保羅定

8、婚時,安娜公主與布丁悄然消失,結(jié)局出人意料……,Contents,第1節(jié) 基本概念第2節(jié) 距離法第3節(jié) 常用分子進化與系統(tǒng)發(fā)育分析的軟件第4節(jié) 生物進化理論與分子進化的討論,第一節(jié) 基本概念,基本概念:系統(tǒng)發(fā)生(phylogeny)——是指生物形成或進化的歷史系統(tǒng)發(fā)生學(phylogenetics)——研究物種(遺傳學特征)之間的進化關(guān)系,認為特征相似的物種在遺傳學上接近.系統(tǒng)發(fā)生的結(jié)果常以系統(tǒng)發(fā)生樹表示; 系統(tǒng)發(fā)生樹(

9、phylogenetic tree)——表示形式,描述物種(遺傳學特征: 形態(tài), 基因序列, 蛋白質(zhì)序列等等) 之間進化關(guān)系,,系統(tǒng)發(fā)生樹: 物種(遺傳特征)之間的關(guān)系; 進化樹: 從低等到高等, 有始有終,,經(jīng)典系統(tǒng)發(fā)生學 主要是物理或表型特征 如生物體的大小、顏色、觸角個數(shù)即通過表型比較來推斷生物體的基因型(genotype),研究物種之間的進化關(guān)系.有時候親緣關(guān)系遠的物種也能進化出相似的表

10、型,所謂的趨同進化(convergent evolution).所以表型為依據(jù)的進化分析有時候并不正確.如是否有眼睛?,現(xiàn)代系統(tǒng)發(fā)生學 利用從遺傳物質(zhì)中提取的信息作為物種特征 具體地說就是核酸序列或蛋白質(zhì)分子,根據(jù)現(xiàn)有生物基因或物種多樣性重建生物的進化史是一個非常重要的問題。根據(jù)核酸和蛋白質(zhì)的序列信息,可以推斷物種之間的系統(tǒng)發(fā)生關(guān)系.基本原理: 從一條序列變?yōu)榱硪粭l序列所需要的變換越多,兩條序列的相關(guān)

11、性就越小,從共同祖先分歧的時間越早,進化距離越大;反之,兩個序列越相似,它們之間的進化距離可能越小.,所有的生物都可以追溯到共同的祖先,生物的產(chǎn)生和分化就象數(shù)一樣地生長, 分叉, 以樹的形式來表示生物之間的進化關(guān)系是非常自然的事.,系統(tǒng)發(fā)生樹是一種二叉樹(每個節(jié)點最多有兩個子節(jié)點), 由一系列的節(jié)點(nodes)和分支(branches)組成, 每個節(jié)點代表一個分類單元(物種或序列), 節(jié)點之間的連線表示物種之間的進化關(guān)系。枝長bran

12、ch length 通常代表在該分枝中曾發(fā)生過的變化數(shù)。,,,,,,,,,,,,,,系統(tǒng)樹可以是有根的rooted 也可以是無根的(unrooted). 在有根樹中存在一個被稱為根特殊節(jié)點由此導向任何別的節(jié)點都只有唯一圖. 每一途徑中的方向與進化時間相對應.而根則是所有正被研究的的共同祖先. 無根樹是一種只將各間的關(guān)系具體化而未定義進化途徑的樹圖.,系統(tǒng)發(fā)生樹性質(zhì): (1)如果是一棵有根樹,則樹根代表在進化歷史上是最早的、并

13、且與其它所有分類單元都有聯(lián)系的分類單元; (2)如果找不到可以作為樹根的單元,則系統(tǒng)發(fā)生樹是無根樹; (3)從根節(jié)點出發(fā)到任何一個節(jié)點的路徑指明進化時間或者進化距離。,直系同源(orthologs): 同源的基因是由于共同的祖先基因進化而產(chǎn)生的.旁系同源(paralogs): 同源的基因是由于基因復制產(chǎn)生的.,直系同源與旁系同源,必須了解的概念:,,,,paralogs,,,orthologs,,paralogs,,,,o

14、rthologs,思考: 用于分子進化的序列必須是直系 or 旁系同源才能真實反映進化過程?,,,,,,,Bacterium 1,Bacterium 3,Bacterium 2,Eukaryote 1,Eukaryote 4,Eukaryote 3,Eukaryote 2,,,,,,,Bacterium 1,Bacterium 3,Bacterium 2,Eukaryote 1,Eukaryote 4,Eukaryote 3,Euk

15、aryote 2,Phylograms show branch order and branch lengths進化樹,有分支和支長信息,進化分支圖,進化樹,Cladograms show branching order - branch lengths are meaningless進化分支圖,只用分支信息,無支長信息。,Rooted by outgroup,archaea,archaea,archaea,bacteria ou

16、tgroup,,root,,eukaryote,eukaryote,eukaryote,eukaryote,無根樹,archaea,archaea,archaea,,,有根樹,無根樹,外圍群,有根樹,外圍群,,,,,,a,b,c,d,,,,,,a,c,b,d,,,,,,a,d,b,c,考慮4個分類群時,共有3種可能的無根樹,考察類群數(shù)為 m ( m ? 3 )的系統(tǒng)樹,其可能的拓撲結(jié)構(gòu)數(shù)目為:,有根樹,無根樹,m=10:34,459,

17、425種,m=10: 2,027,025種,當 m較大時,選出真實樹的拓撲結(jié)構(gòu)十分困難。,分支數(shù)目:,有根樹,無根樹,內(nèi)部分支數(shù)目:,有根樹,無根樹,內(nèi)部節(jié)點數(shù)目:,有根樹,無根樹,無根樹和有根樹:潛在的數(shù)目,#Taxa 無根樹 有根樹,3 1 34 3

18、 155 15 1056 105 9457 945 10,395…30 ~3.58X1036 ~2.04X1038,Taxa增多,計算量急劇增加,因此,目前算法都為優(yōu)化算法

19、,不能保證最優(yōu)解,物種樹: 代表一個物種或群體進化歷史的系統(tǒng)發(fā)育樹 兩個物種分歧的時間:兩個物種發(fā)生生殖隔離的時間 基因樹: 由來自各個物種的一個基因構(gòu)建的系統(tǒng)發(fā)育樹(不完全等同于物種樹),表示基因分離的時間。,系統(tǒng)發(fā)育樹的種類——基因樹、物種樹,期望樹: 一個用無限長的序列或每一分支的期望替代數(shù)構(gòu)建的樹,理論上:假設(shè)所研究的序列無限長,從中隨機抽樣進行統(tǒng)計分析。,實際情況:

20、所研究的序列是短序列,統(tǒng)計得到的替代數(shù)目存在大量隨機誤差。,現(xiàn)實樹: 建立在實際替代數(shù)基礎(chǔ)上的樹,,,重建樹,,,構(gòu)樹方法,系統(tǒng)發(fā)育樹的種類——期望樹、現(xiàn)實樹和重建樹,構(gòu)建系統(tǒng)發(fā)育樹的數(shù)據(jù)1、特征數(shù)據(jù)(character data): 提供了基因、個體、群體或物種的信息2、距離數(shù)據(jù)(distance data)或相似性數(shù)據(jù)(similarity data): 涉及的則是成對基因、個體、

21、群體或物種的信息。 ? 距離矩陣,距離數(shù)據(jù)可以由特征數(shù)據(jù)計算得到。反之?,系統(tǒng)發(fā)育樹的構(gòu)建,構(gòu)造系統(tǒng)發(fā)育樹的主要方法,基于距離的構(gòu)建方法Fitch-Margoliash法 鄰接法(Neighbor Joining Method) 非加權(quán)組平均法 最小進化方法 基于離散特征的構(gòu)建方法最大簡約法 最大似然法 進化簡約法 相容性方法,構(gòu)建系統(tǒng)發(fā)育樹的主要過程拓撲結(jié)構(gòu)的

22、判別(從大量的拓撲結(jié)構(gòu)中搜尋、判別)一個既定拓撲結(jié)構(gòu)的分支長度的估計,,最優(yōu)原則,構(gòu)建進化樹的一般原則,第二節(jié) 系統(tǒng)發(fā)育樹的構(gòu)建方法之一距離法,1 Fitch-Margoliash方法 (FM法)2 鄰接法(Neighbor Joining Method)3 非加權(quán)分組平均法(Unweighted Pair Group Method with Arithmetic mean, UPGMA)3 最大簡約法(Maximum

23、 Parsimony Method)4 最大似然法(Maximum Likelihood Method),首先要獲得所有分類群之間的進化距離。系統(tǒng)發(fā)育樹的構(gòu)建是基于進化距離之間的關(guān)系。,如何獲得所有分類群之間的進化距離選定分類群共同的特征序列——氨基酸序列、核苷酸序列 例:人、馬、牛、袋鼠、蠑螈、鯉魚的血紅蛋白?鏈的氨基酸序 列(140aa); 人、獼猴、黑猩猩的線粒體DNA中細胞色素

24、b基因的核苷酸序列(1,125bp);比較兩兩序列之間的差異p (序列比對算法),根據(jù)不同的概率統(tǒng)計模型,由兩條序列的差異p值構(gòu)建它們的進化距離 氨基酸序列:PC(Poisson校正)距離、?距離 核苷酸序列:Jukes-Cantor模型、Kimura模型、HKY模型等……,簡單的距離矩陣,1. Fitch-Margoliash方法 (FM法),D和E最接近!,分成三組:D, E, 以及ABC,DE

25、距離=d+e (1)D到ABC間的平均距離=d+m (2)E到ABC間的平均距離=e+m (3)(2)-(3)+(1)d=4,e=6,C最接近DE!,分成三組:C, DE, 以及AB,c+g+(e+d)/2=19 (1)c+f+(a+b)/2=40 (2)(e+d)/2+(a+b)/2+f+g=41 (2)(1)+(2)-(3)得:c=9,c+g+(e+d)/2=19(e+d)/2=5,c=9

26、,則g=5,由:(a+b)/2+f+g+(d+e)/2=41 得:f=20由:a+f+c=39 得:a=10,則b=12,2. 鄰接法(Neighbor Joining Method),最小進化(ME)思想:在所有可能的拓撲結(jié)構(gòu)中,選擇分支長度和S最小作為最優(yōu)樹。(全局優(yōu)化思想)(Edwards & Cavalli-Sforza,1963)Saitou & Nei (1987):在每一階段應用最小進化原理,是ME

27、方法的簡化。,其中X為連接類群i, j的節(jié)點,LiX為類群i到X的分支長度。,定義:鄰居(neighbors) 無根樹中,一個節(jié)點所連接的兩個分類群互為鄰居 (1, 2); (5, 6); (1-2, 3); (1-2-3, 4) ……,其中X為連接互為鄰居的類群i, j的內(nèi)部節(jié)點,LiX為類群i到X的分支長度。,例子已知距離矩陣: 6個分類群的距離矩陣dij

28、,,,,,,初始系統(tǒng)樹的拓撲結(jié)構(gòu)為星狀樹,其分支長度總和為:,已知m個分類群,以及它們的距離矩陣dij(m?m),定義:Sij表示類群i和j為鄰居時的分支長度總和。如,其中:,S12=29.5,Sij的計算公式:,其中:,分支長度的計算公式:,確定一個內(nèi)部節(jié)點A (連接鄰居i, j)后,計算A與其它分類群k距離:,得到新的距離矩陣(維數(shù)減1)……,CommentsNJ法本質(zhì)上是一種尋找最優(yōu)拓撲結(jié)構(gòu)的譜系聚類算法。同時給出系統(tǒng)發(fā)育樹的

29、拓撲結(jié)構(gòu)以及分支的長度。優(yōu)點:1、可以較快地構(gòu)建系統(tǒng)樹;2、適用于分析較大的數(shù)據(jù)集;3、能夠較方便地進行自展(Bootstrap)檢驗。,NJ/鄰接法,與FM方法非常類似, 保證總的支長最短,總支長:a+b+c+d+e=314/4=78.5,找到距離最近的兩個點,1.任意兩個節(jié)點選為相鄰序列的總支長計算公式:,2.計算SAB, SBC, SCD, SDE…等所有可能的組合數(shù)值,3.該例中, SAB最小,把A、B看成一個新的復合

30、序列,構(gòu)建一個新的距離表,重復以上過程,,計算A, B的分支長度,AB組合出現(xiàn)3次,DE組合出現(xiàn)3次,CD、AC、BC組合各一次,則AB和DE各為兩對關(guān)系最近的鄰居。(關(guān)系最近的鄰居作為鄰居的次數(shù)最多),將鄰居看成一個新的復合序列,重復這個過程,3 非加權(quán)分組平均法(Unweighted Pair Group Method with Arithmetic mean, UPGMA),在非加權(quán)分組平均法中,在計算新分類到其它分類之間的平均

31、距離時按照各分類中分類單元的數(shù)目進行加權(quán)處理。,方法原理:譜系聚類,譜系聚類法的基本步驟首先將t個樣本各自視為一類:得到初始的分類G(1) (含有t類),計算t個樣本兩兩之間的距離,它們等價于初始的類間距離,得到初始的距離矩陣D(1) ; 將距離最近的兩類合并為一新類,得到新的分類G(2)(含有t-1類),并計算新類與其它類的類間距離,得到新的類間距離矩陣D(2) ,再按照最小距離準則并類,得到G(3)(含有t-2類)、D(

32、3),… 。直到所有樣本都并成一類 ; 畫出譜系聚類圖,決定分類的個數(shù)及各類的成員。,譜系聚類結(jié)果示意圖:,在基因替代速率恒定假設(shè)成立時,UPGMA方法比較適用;UPGMA方法適用于具有較小變異系數(shù)的距離測度;UPGMA是一種既構(gòu)建拓撲結(jié)構(gòu)又計算分支長度的方法;UPGMA方法既可以得到有根樹,也可以得到無根樹。,d=e=10/2=5,UPGMA法,,c=19/2=9.5g=c-d=9.5-5=4.5,a=b=22/

33、2=11,f1+a=f2+c=40.5/2=20.25f1=9.25 , f2=11.75,選擇外類群(Outgroup),選擇一個或多個已知與分析序列關(guān)系較遠的序列作為外類群外類群可以輔助定位樹根外類群序列必須與剩余序列關(guān)系較近,但外類群序列與其他序列間的差異必須比其他序列之間的差異更顯著。,bacteria outgroup,eukaryote,eukaryote,eukaryote,eukaryote,archaea,ar

34、chaea,archaea,外圍群,,可靠性分析,自展法,通過系統(tǒng)發(fā)生分析推斷出來的樹的不同部分可能有不同的置信度, 造成統(tǒng)計誤差的一個原因是數(shù)據(jù)采樣誤差.因此對分析的對象多次采樣,比較不同樣本得到的估計值. 具體做法:從原始數(shù)據(jù)中采集部分數(shù)據(jù)組新的數(shù)據(jù)集, 構(gòu)建系統(tǒng)發(fā)生樹,重復該過程,產(chǎn)生千百的重采樣數(shù)據(jù)集,并同時生成對應的自展樹, 檢驗自展樹對最終系統(tǒng)發(fā)生樹各分支的支持率.最后計算出來的數(shù)值為自展值(Bootstrap value)

35、.,進化樹的可靠性分析,自展法(Bootstrap Method),將最終系統(tǒng)樹與各個自展樹進行比較,其中在各個自展樹中都出現(xiàn)或大量出現(xiàn)的那些部分將具有高的置信度.比較耗時.,4 最大簡約法(Maximum Parsimony Method),MP算法基本思想(Fitch, 1971; Hartigan, 1973)考慮m個核苷酸(或氨基酸)序列(m ? 4),假定4種核苷酸(或20種氨基酸)可突變?yōu)榕c自身不同的任何一種。

36、1)對于任一給定的拓撲結(jié)構(gòu),可以推斷每個位點的祖先狀態(tài);2)對于該拓撲結(jié)構(gòu),可以計算出用來解釋整個進化過程所需的核苷酸(或氨基酸)的最小替代數(shù)目;3)對所有可能正確的拓撲結(jié)構(gòu)計算它們的最小替代數(shù)目,選擇其中最小的作為最優(yōu)拓撲結(jié)構(gòu)。,1)對于任一給定的拓撲結(jié)構(gòu),計算它的樹長(即所有位點的最小替代數(shù)目之和)L;2)選取具有最短樹長的拓撲結(jié)構(gòu)為最大簡約樹。,不變位點:在所有分類群中相同核苷酸或氨基酸的位點。

37、 不變位點不提供任何信息。,計算所有結(jié)構(gòu)樹并選取最短樹長,信息位點、趨同進化,進化通徑:考慮任意兩個密碼子之間變換的可能路徑,MP法決定系統(tǒng)樹的分支長度,進化通徑:考慮任意兩個密碼子之間變換的可能路徑,分支長度估計通過考慮每個非不變位點的所有進化通徑,并計算每個內(nèi)部分支或外部分支的平均替代數(shù)來估計MP樹的分支長度。(具體算法略),1. 信息位點,必須在至少2個taxa中具有相同的序列性狀2. 信息位點是指那些

38、至少存在2個不同堿基/氨基酸且每個不同堿基/氨基酸至少出現(xiàn)兩次的位點,信息位點 (Sites are informative),,,上例,1. Position 5, 7, 9為信息位點2. 基于position 5的三個MP樹: Tree 1長度1,Tree 2 & 3長度23. Tree 1更為簡約:總長:4 Tree 2長5;Tree 3長64. 計算結(jié)果:MP tree的最優(yōu)結(jié)果為tree 1,MP法評述

39、,MP法適用的問題理論基礎(chǔ)為奧卡姆剃刀 (Ockham)原則:計算所需替代數(shù)最小的那個拓撲結(jié)構(gòu),作為最優(yōu)樹在分析的序列位點上沒有回復突變或平行突變,且被檢驗的序列位點數(shù)很大的時候,最大簡約法能夠推導獲得一個很好的進化樹優(yōu)點:不需要在處理核苷酸或者氨基酸替代的時候引入假設(shè) (替代模型)缺點:分析序列上存在較多的回復突變或平行突變,而被檢驗的序列位點數(shù)又比較少的時候,可能會給出一個不合理的或者錯誤的進化樹推導結(jié)果,5 最大似然法

40、(Maximum Likelihood Method),ML算法基本思想(Felsenstein, 1981; Kishino, 1990)以一個特定的替代模型分析一組給定的核苷酸(或氨基酸)序列數(shù)據(jù),使獲得的每一個拓撲結(jié)構(gòu)的似然率均為最大,挑選其中最大似然率最大的拓撲結(jié)構(gòu),選為最終系統(tǒng)樹。ML法考察的既可以是拓撲結(jié)構(gòu),也可以是既定拓撲結(jié)構(gòu)的分支長度。ML法采用了標準的統(tǒng)計方法,以建立進化的概率模型。計算量非常大。

41、詳細內(nèi)容請參考《分子進化與系統(tǒng)發(fā)育》(高等教育出版社),最大似然法 (ML),1. 最大似然法(maximum likelihood, ML): 最早應用于對基因頻率數(shù)據(jù)的分析上2. 選取一個特定的替代模型來分析給定的一組序列數(shù)據(jù),使得獲得的每一個拓撲結(jié)構(gòu)的似然率都為最大值,然后再挑出其中似然率最大的拓撲結(jié)構(gòu)作為最優(yōu)樹3. 在最大似然法的分析中,所考慮的參數(shù)并不是拓撲結(jié)構(gòu)而是每個拓撲結(jié)構(gòu)的枝長,并對似然率求最大值來估計枝長4. 缺

42、點:費時,每個步驟都要考慮內(nèi)部節(jié)點的所有可能性5. 改進:啟發(fā)式算法,第3節(jié) 常用分子進化與系統(tǒng)發(fā)育分析的軟件,MEGA 5.0: www.megasoftware.net/,,,例1流程: 1)ClustalX多序列比較; 2)用ClustalX程序直接繪制NJ樹; 3)用Treeview程序打開.,例2流程:1)ClustalX多序列比較; 2)用MEGA程序轉(zhuǎn)換格式;

43、 3)選擇構(gòu)建方法; 4)MEGA查看.,For sequences:>OsSRZ1MNRKPGDWDCRACQHLNFSRRDLCQRCGGPRGAADRGSGGGGDYANFGGRGGSSFGGGFGTGSDVRPGDWYCNCGAHNFASRSSCFKCAAFKDDAAVNSGGAGAFDGGDMSRSRGYGFGSGAVRASRPGWKSGDWICTRSGCNEHNFASRMECFR

44、CNAPRDSGTEV>OsSRZ2MNIQRKPGDWNCKSCQHLNFSRRDYCQRCHTPRQDLPLGDGYVPGGVLSSLDIRPGDWYCNCGYHNFASRASCFKCGAIVKDLPAGQGGGVANGDFARALDSSAVRAGWKAGDWICTRPGCNVHNFASRIECYRCNAPREAGNVK>OsSRZ3METKAAAMAMRKPGDWSCRSCQYVNFCKREACQRCGEA

45、KLGVERTDYAAMGGGWEVKPGDWCCRCCAVNNYASRGSCFKCGAAKNDSAAAVAQGWGFSVASQAGWKNGDWICPRMECNVQNYANRTECFRCNFPRYYVD>AtSRZ1MSRPGDWNCRSCSHLNFQRRDSCQRCGDSRSGPGGVGGLDFGNFGGRAMSVFGFTTGSDVRPGDWYCTVGNCGTHNFASRSTCFKCGTFKDETGAGGGGGGIGGPA

46、MFDADIMRSRVPGNGGRSSWKSGDWICTRIGCNEHNFASRMECFRCNAPRDFSNRTSF>AtSRZ2MNRPGDWNCRLCSHLNFQRRDSCQRCREPRPGGISTDLLSGFGGRPVSSSFGFNTGPDVRPGDWYCNLGDCGTHNFANRSSCFKCGAAKDEFSCSSAAATTGFMDMNVGPRRGLFGFGGSSSGGGGTGRSPWKSGDWICPRSGCNEHNF

47、ASRSECFRCNAPKELATEPPY>AtSRZ3MSWTGGDWLCGACQHANFKKRESCQKCGYPKFGGVDVSTYLYNRTEVMAGDWYCGALNCGSHNYASRTSCYRCGMIKVEYTEQYYGAQMVAYGNDGAACPPGWKTGDWVCPRVGCGVHNYASRAECFKCKTTRDYGGV,Step OK?,Step OK?,Step OK?,生成.phb文件,,操作….,Part

48、II流程:1)ClustalX多序列比較; 2)用MEGA程序轉(zhuǎn)換格式; 3)選擇構(gòu)建方法; 4)MEGA查看.For example…,方法(2) 仍然進行多序列比對,獲得.aln文件,,方法(2),,生成.MEG文件,方法(2),,方法(2),方法(2),,,方法(2),,方法(2),程序流程:1) 獲得FASTA格式文件 2) ClustalX多序列比

49、較; 3)用ClustalX程序直接繪制NJ樹; 4)用Treeview程序打開.,II流程: 1)獲得FASTA格式文件   2)ClustalX多序列比較; 3)用MEGA程序轉(zhuǎn)換格式; 4)選擇構(gòu)建方法; 5)MEGA查看.,For sequences:>OsSRZ1MNRKPGDWDCRACQHLNFSRRDLCQRCGG

50、PRGAADRGSGGGGDYANFGGRGGSSFGGGFGTGSDVRPGDWYCNCGAHNFASRSSCFKCAAFKDDAAVNSGGAGAFDGGDMSRSRGYGFGSGAVRASRPGWKSGDWICTRSGCNEHNFASRMECFRCNAPRDSGTEV>OsSRZ2MNIQRKPGDWNCKSCQHLNFSRRDYCQRCHTPRQDLPLGDGYVPGGVLSSLDIRPGDWYCNCGYHNFASR

51、ASCFKCGAIVKDLPAGQGGGVANGDFARALDSSAVRAGWKAGDWICTRPGCNVHNFASRIECYRCNAPREAGNVK>OsSRZ3METKAAAMAMRKPGDWSCRSCQYVNFCKREACQRCGEAKLGVERTDYAAMGGGWEVKPGDWCCRCCAVNNYASRGSCFKCGAAKNDSAAAVAQGWGFSVASQAGWKNGDWICPRMECNVQNYANRTECFRCN

52、FPRYYVD>AtSRZ1MSRPGDWNCRSCSHLNFQRRDSCQRCGDSRSGPGGVGGLDFGNFGGRAMSVFGFTTGSDVRPGDWYCTVGNCGTHNFASRSTCFKCGTFKDETGAGGGGGGIGGPAMFDADIMRSRVPGNGGRSSWKSGDWICTRIGCNEHNFASRMECFRCNAPRDFSNRTSF>AtSRZ2MNRPGDWNCRLCSHLNFQRRDSC

53、QRCREPRPGGISTDLLSGFGGRPVSSSFGFNTGPDVRPGDWYCNLGDCGTHNFANRSSCFKCGAAKDEFSCSSAAATTGFMDMNVGPRRGLFGFGGSSSGGGGTGRSPWKSGDWICPRSGCNEHNFASRSECFRCNAPKELATEPPY>AtSRZ3MSWTGGDWLCGACQHANFKKRESCQKCGYPKFGGVDVSTYLYNRTEVMAGDWYCGALNCG

54、SHNYASRTSCYRCGMIKVEYTEQYYGAQMVAYGNDGAACPPGWKTGDWVCPRVGCGVHNYASRAECFKCKTTRDYGGV,Step OK?,自動生成.aln文件,打開MEGA軟件,仍然進行多序列比對,獲得.aln文件,,,生成.MEG文件 注意:一定要保存,,,,,,,,,第4節(jié)生物進化理論與分子進化的討論,1、分子進化的兩個特點,生物大分子進化速率的相對恒定分子進化速率 生物大

55、分子隨時間的改變主要表現(xiàn)為核苷酸、蛋白質(zhì)的一級結(jié)構(gòu)的改變,即分子序列中核苷酸、氨基酸的替換不同物種同源大分子的分子進化速率大體相同 例子:比較不同物種血紅蛋白氨基酸序列差異 人、馬——0.8?10-9/AA.a 人、鯉魚——0.6?10-9/AA.a分子進化速率遠遠比表型進化速率穩(wěn)定原因? 序列的核苷酸或氨基酸替換是否隨機過程?…,生物大分子進化的保守性保守

56、性 功能上重要的大分子或大分子的局部在進化速率上明顯低于那些在功能上不重要的大分子或者大分子局部。 (引起表型發(fā)生顯著改變的突變發(fā)生的頻率要低于無明顯表型發(fā)生顯著改變得突變發(fā)生的頻率。)氨基酸 例:血紅蛋白分子的外區(qū)的功能要次于內(nèi)區(qū)的功能,外區(qū)的進化速率是內(nèi)區(qū)進化速率的10倍。核苷酸 例:DNA密碼子的同義替代頻率高于非同義替代頻率;內(nèi)含子上的核苷酸替代頻率較高。

57、生物大分子進化并非完全隨機 存在某種制約因素,存在某種機制……?,2、分子進化中性論,Neutral theory of molecular evolution(Kimura & Ohta, 1968, 1971) (King & Jukes, 1969)提出分子層次上的“non-Darwinian evolution”“在生物分子層次上的進化改變不是由自然選擇作用于有利突變而引起的,而是在連續(xù)

58、的突變壓之下由選擇中性或非常接近中性的突變的隨機固定造成的。中性突變是指對當前適應度無影響的突變?!敝行酝蛔儭⑦B續(xù)突變壓、隨機固定否認自然選擇在分子進化中的作用,認為生物大分子的進化主要因素是機會和突變壓力。,分子進化中性論的若干依據(jù)分子層次上的大多數(shù)變異是選擇中性的 蛋白質(zhì)和核苷酸分子的進化速率高且相對恒定 突變壓在分子進化中的作用得到研究證實按照群體遺傳學的數(shù)學模型,自然選擇的

59、代價太高,分子進化中性論的討論1、中性論是解釋分子層次的進化現(xiàn)象 自然選擇只作用于表型,并不直接作用于分子。 衡量尺度的區(qū)別:分子的顯著性改變并不意味著表型的顯著性改變。 中性論只涉及生物大分子一級結(jié)構(gòu)單元的替換,并不包含和解釋分子層次的全部改變(如蛋白質(zhì)三級結(jié)構(gòu)、功能的改變)2、分子進化的保守性表明選擇仍然起作用 可能之一——負選擇的存在:任何

60、發(fā)生在重要功能的大分子或大分子保守區(qū)的突變,由于造成適應度的下降而被選擇淘汰。(隨機作用) 可能之二——存在某種機制阻止功能重要的大分子或大分子保守區(qū)的突變產(chǎn)生。(非隨機作用),3、選擇中性突變的復雜調(diào)控系統(tǒng) 中性突變的可能原因:復雜的調(diào)控機制。基因表達受到內(nèi)外因素的制約。 決定中性突變的調(diào)控系統(tǒng)受到自然選擇的影響。 4、選擇在分子的適應進化中起作用

61、 在分子層次上可能存在兩種進化形式: 中性進化(導致分子多樣性) 適應進化(通過選擇實現(xiàn),導致分子適應),能否打倒的Darwinian進化論,?,3、分子鐘(Molecular Clock),分子鐘 根據(jù)分子系統(tǒng)學研究與古生物學資料相結(jié)合,建立推論生物進化事件發(fā)生的時間表。,假定分子進化速率r恒定,則分子進化改變量(替代數(shù)目或替代率)與進化時間成正比。以兩條序列為例:d =

62、 2 r t其中,t是進化時間,d是這兩條序列每個位點的替代數(shù)目。,分子鐘成立的先決條件:分子進化速率恒定。,分子鐘成立的證據(jù):1、至少某些生物大分子(如珠蛋白)的進化速率在相當長的地質(zhì)時間內(nèi)的相對穩(wěn)定、均勻;2、許多不同物種的多種同源大分子在相當長時間內(nèi)的平均進化速率近似恒定。,建立分子鐘的大致步驟1、選擇所要比較的生物大分子種類 根據(jù)具體研究目標和已掌握的資料,選擇進化速率相對恒定、速率大小合適、分布范圍

63、能涵蓋各待比較物種的生物大分子。2、選擇所要比較的物種,確定各比較組合及其所代表的進化事件3、獲得生物大分子一級結(jié)構(gòu)的資料4、獲得有關(guān)的代表性進化事件發(fā)生的地質(zhì)時間數(shù)據(jù)5、通過比較大分子一級結(jié)構(gòu),選擇合適的數(shù)學模型,計算得到進化產(chǎn)生的分子差異d,通過回歸分析等統(tǒng)計方法得到大分子的進化速率r(t)6、由此可以推斷未知進化事件的發(fā)生時間,,關(guān)于分子鐘的討論和爭議1、對長期進化而言,不存在以恒定速率替換的生物大分子一級

64、結(jié)構(gòu);(基因功能的改變、基因數(shù)目的增加)2、不存在通用的分子鐘;3、爭議: 分子鐘的準確性 中性理論(分子鐘成立的基礎(chǔ)),課堂練習:下列哪些位點是信息位點? 位點1 2 3 4 5 6序列1 C A G G T A序列2 C A

65、 G A C A序列3 C G G C T A序列4 T G G T C G,課堂練習:2) 下列系統(tǒng)發(fā)生樹建立的方法中,基于序列特征分析的是? 基于距離的是?A. neighbor-joining methodB. UPGMAC.Maximum pari

66、smonyD.Maximum likelihood,課堂練習:3)給定一個距離距陣, 請用UPGMA法構(gòu)建系統(tǒng)發(fā)生樹.,A B C D E,A - 8 4 6 8B - - 8 8 4C - - - 6 8D - - -

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論