分子進(jìn)化分析講解課件_第1頁(yè)
分子進(jìn)化分析講解課件_第2頁(yè)
分子進(jìn)化分析講解課件_第3頁(yè)
分子進(jìn)化分析講解課件_第4頁(yè)
分子進(jìn)化分析講解課件_第5頁(yè)
已閱讀5頁(yè),還剩69頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第七章 分子進(jìn)化分析(Molecular

Evolution

Analysis)內(nèi)容+

分子進(jìn)化分析介紹+

系統(tǒng)發(fā)育樹重建方法+

常用分子進(jìn)化與系統(tǒng)發(fā)育分析的軟件第一節(jié) 分子進(jìn)化分析介紹進(jìn)化:是一種不斷改進(jìn)的過(guò)程?!懊總€(gè)生物每時(shí)每刻都在為生存進(jìn)行反復(fù)的斗爭(zhēng),如果在復(fù)雜多變的生存條件下該生物仍然能夠不斷改進(jìn)自己,那么其將有較大的生存可能性,并被自然選擇所保留。被自然選擇保留下來(lái)的物種都傾向于繁殖其已經(jīng)被改進(jìn)的新的生命形式”-----《特種起源》18世紀(jì)之前,神創(chuàng)論和物種不變論。18世紀(jì),相信物種是變化的。拉馬克用環(huán)境作用的影響、器官的用進(jìn)廢退和獲得性的遺傳等原理解釋生物進(jìn)化過(guò)程,創(chuàng)立了第一個(gè)比較嚴(yán)整的進(jìn)化理論。1859年達(dá)爾文發(fā)表《物種起源》,論證了地球上現(xiàn)存的生物都由共同祖先發(fā)展而來(lái),并提出自然選擇學(xué)說(shuō)以說(shuō)明進(jìn)化的原因,從而創(chuàng)立了科學(xué)的進(jìn)化理論。20世紀(jì)30年代,綜合進(jìn)化論,綜合了細(xì)胞遺傳學(xué)、群體遺傳學(xué)以及古生物學(xué)等學(xué)科的成就,進(jìn)一步發(fā)

展了進(jìn)化理論。20世紀(jì)60年代末,分子進(jìn)化中性學(xué)說(shuō),認(rèn)為種內(nèi)和種間大多數(shù)可見差異是適合度很小的隨機(jī)突變的固定所決定的。生物學(xué)家:WE

HAVE

A

DREAM…+

Tree

of

Life:重建所有生物的進(jìn)化歷史并以系統(tǒng)樹的形式加以描述夢(mèng)想走進(jìn)現(xiàn)實(shí):HOW?比較形態(tài)學(xué)和比較生理學(xué):確定大致的進(jìn)化框架

——

細(xì)節(jié)存很多的爭(zhēng)議最理想的方法:化石!——

零散、不完整夢(mèng)想走進(jìn)現(xiàn)實(shí):HOW?+

第三種方案:分子進(jìn)化1964年,Pauling等提出分子進(jìn)化理論:生命起源:有機(jī)分子由簡(jiǎn)單向復(fù)雜演變生物進(jìn)化:構(gòu)成生物體的生物大分子如蛋白質(zhì)、核酸的演變?;炯僭O(shè):核苷酸和氨基酸序列中含有生物進(jìn)化歷史的全部信息意義:分子進(jìn)化的研究可以為生物進(jìn)化過(guò)程提供佐證,為深入研究進(jìn)化機(jī)制提供重要依據(jù)從物種的一些分子特性出發(fā),構(gòu)建系統(tǒng)發(fā)育樹,進(jìn)而了解物種之間的生物系統(tǒng)發(fā)生的關(guān)系

——

tree

of

life,物種分類大分子功能與結(jié)構(gòu)的分析:同一家族的大分子,具有相似的三級(jí)結(jié)構(gòu)及生化功能,通過(guò)序列同源性分析,進(jìn)行大分子功能預(yù)測(cè)進(jìn)化速率分析:例如,HIV的高突變性,哪些位點(diǎn)易發(fā)生突變?分子進(jìn)化研究的目的TREE

OF

LIFE:

16SRRNA真細(xì)菌真核生物古生菌OUT

OF

AFRICA53個(gè)人的線粒體基因組(16,587bp)非洲人相對(duì)其他大陸上的人類在基因上極為多樣化人類遷移的路線隨著距非洲距離越來(lái)越長(zhǎng),遺傳多樣性的衰退程度,

正好沿著人類早期遷徙的

路線慢慢增大。+

系統(tǒng)發(fā)育樹:描述一組對(duì)象進(jìn)化歷史的一種圖表。+

分類單元:用來(lái)構(gòu)建系統(tǒng)發(fā)育樹的對(duì)象??梢允腔?、蛋白序列,或者是序列之外的數(shù)據(jù)(形態(tài)特征、酶切位點(diǎn)等)+

系統(tǒng)發(fā)育樹是一種二叉樹。由一系列節(jié)點(diǎn)(nodes)和分支(branches

)組成,其中每個(gè)節(jié)點(diǎn)代表一個(gè)分類單元(物種或序列),而節(jié)點(diǎn)之間的連線代表物種之間的進(jìn)化關(guān)系。一、系統(tǒng)發(fā)育樹(Phylogenetic

tree)+

樹的節(jié)點(diǎn)又分為外部節(jié)點(diǎn)(terminal

node)和內(nèi)部節(jié)點(diǎn)(internal

node)。+外部節(jié)點(diǎn):代表實(shí)際觀察到的分類單元。+內(nèi)部節(jié)點(diǎn):又稱為分支點(diǎn),代表分類單元進(jìn)化歷程中的祖先。ABCD分支/世系E節(jié)點(diǎn)1.

系統(tǒng)發(fā)育樹的分類依據(jù)樹是否有根可分為:+有根樹:從最早共同祖先(即根)開始,隨著時(shí)間的連續(xù)分歧事件引起的一組相關(guān)對(duì)象的分歧每個(gè)分支的進(jìn)化方向是確定的+無(wú)根樹:只表示分類單元之間的關(guān)系,不鑒別最早共同祖先不清楚內(nèi)部分支的祖先物種是從哪里來(lái)的,進(jìn)化方向不清楚archaeaarchaeaarchaeaeukaryoteeukaryoterooteukaryoteeukaryoteeukaryoteeukaryote無(wú)根樹eukaryoteeukaryotebacteria

outgrouparchaeaarchaeaarchaeaMonophyletic

group(單源支)Monophyleticgroup有根樹系統(tǒng)發(fā)育樹的種類: 有根樹、無(wú)根樹如何確定樹根?引入外圍支(Outgroup)輔助定位樹根。選擇外圍支:外圍支條件:序列必須與剩余序列關(guān)系較近,但外圍支序列與其他序列間的差異必須比其他序列之間的差異更顯著eukaryoteeukaryoteeukaryoteeukaryotearchaeaarchaeaMonophyletic

group(單源支)Monophyleticgroupbacteria

outgroup

外圍支archaeaRootedbyoutgroup1.2依據(jù)進(jìn)化關(guān)系可分為:基因樹:用于確定大基因家族內(nèi)基因或蛋白進(jìn)化關(guān)系的樹。物種樹:代表一個(gè)物種或群體進(jìn)化歷史的系統(tǒng)發(fā)育樹–

當(dāng)不同物種的直系同源基因序列被用來(lái)確定物種之間

的關(guān)系時(shí),會(huì)用物種名標(biāo)記分類單元,樹稱為物種數(shù)。2.

系統(tǒng)發(fā)育樹的表示方法+

有三種基本的表示方法:+

進(jìn)化分支樹(Cladogram):展示了分類單元之間的家系關(guān)系,但沒(méi)有任何時(shí)間和分歧程度。即無(wú)支長(zhǎng)信息。+

加性樹(additive

tree):除了展示家系關(guān)系,用分支長(zhǎng)度度量進(jìn)化分歧。–分支長(zhǎng)度的單位是任意的,與位點(diǎn)變異數(shù)成比例。+

等距離樹:除了加性樹的屬性外,它假設(shè)所有分支有同樣的變異速率(分子鐘)。二、系統(tǒng)發(fā)育樹性質(zhì)+如果是一棵有根樹,則樹根代表在進(jìn)化歷史上是最早的、并且與其它所有分類單元都有聯(lián)系的分類單元。+如果找不到可以作為樹根的單元,則系統(tǒng)發(fā)生樹是無(wú)根樹。+從根節(jié)點(diǎn)出發(fā)到任何一個(gè)節(jié)點(diǎn)的路徑指明進(jìn)化時(shí)間或者進(jìn)化距離。+

對(duì)于給定的分類單元數(shù),有很多棵可能的系統(tǒng)發(fā)生樹,但是只有一棵樹是正確的。系統(tǒng)發(fā)育分析的目標(biāo)——尋找這棵正確的樹第二節(jié)

系統(tǒng)發(fā)育樹的構(gòu)建+

分子進(jìn)化分析介紹+

系統(tǒng)發(fā)育樹重建方法+

常用分子進(jìn)化與系統(tǒng)發(fā)育分析的軟件—

、系統(tǒng)發(fā)育樹重建分析步驟選擇數(shù)據(jù)(核酸/蛋白質(zhì),外圍支)多序列比對(duì)(自動(dòng)比對(duì),手工比對(duì))選擇建樹方法及取代模型建立進(jìn)化樹進(jìn)化樹評(píng)估二、系統(tǒng)發(fā)育樹的構(gòu)建+從多重序列比對(duì)到構(gòu)建進(jìn)化樹有多種算法,可分兩大類:+基于距離的方法首先通過(guò)各個(gè)序列之間的比較,根據(jù)一定的假設(shè)(進(jìn)化距離模型)推導(dǎo)出分類群之間的進(jìn)化距離,構(gòu)建一個(gè)進(jìn)化距離矩陣。進(jìn)化樹的構(gòu)建則是基于這個(gè)矩陣中的進(jìn)化距離。+基于特征的方法不計(jì)算序列之間的距離,而是將序列中有差異的位點(diǎn)作為單獨(dú)的特征,并依據(jù)這些特征來(lái)建+

基于距離的方法非加權(quán)分組平均法(UPGMA)最小近乎距離(ME)鄰近法(NJ)+

基于特征的方法最大簡(jiǎn)約法(MP)最大似然法(ML)Bayesian+

計(jì)算速度1.

最大簡(jiǎn)約(MP)最大簡(jiǎn)約法(maximumparsimony)最

源于形態(tài)性狀研究,現(xiàn)在已經(jīng)推廣到分子序列的進(jìn)化分析中。最大簡(jiǎn)約法的理論基礎(chǔ)是奧卡姆(Ockham)原則,這個(gè)原則認(rèn)為:解釋一個(gè)過(guò)程的最好理論是所需假設(shè)數(shù)目最少的那一個(gè)。對(duì)所有可能的拓?fù)浣Y(jié)構(gòu)進(jìn)行計(jì)算,計(jì)算出所需替代數(shù)最小的那個(gè)拓?fù)浣Y(jié)構(gòu),作為最信息位點(diǎn)(Sites

areinformative)能將所有可能的樹區(qū)別出來(lái)的位點(diǎn)指那些至少存在2個(gè)不同堿基/氨基酸,且每個(gè)不同堿基/氨基酸至少出現(xiàn)兩次的位點(diǎn)例:

1,2,3,4四條序列代表4個(gè)分類單元上例+

Position

5,7,9為信息位點(diǎn)+

基于position 5的三個(gè)MP:Tree 1長(zhǎng)4,Tree

2& 3長(zhǎng)2+

同理,綜合所有信息位點(diǎn):Tree 1長(zhǎng)4,Tree 2長(zhǎng)5,Tree 3長(zhǎng)6+

計(jì)算結(jié)果:MP tree的最優(yōu)結(jié)果為Tree

11.

距離法+

又稱距離矩陣法,首先通過(guò)各個(gè)物種之間的比較,根據(jù)一定的假設(shè)(進(jìn)化距離模型)推導(dǎo)

得出分類群之間的進(jìn)化距離,構(gòu)建一個(gè)進(jìn)化

距離矩陣。進(jìn)化樹的構(gòu)建則是基于這個(gè)矩陣中的進(jìn)化計(jì)距算離序關(guān)列系的距離,建立距離矩陣通過(guò)距離矩陣建進(jìn)化樹簡(jiǎn)單的距離矩陣由進(jìn)化距離構(gòu)建進(jìn)化樹的方法有很多,常見有:Fitch-Margoliash

Method(FM法):對(duì)短支長(zhǎng)非常有效

Neighbor-JoiningMethod

(NJ法/鄰接法): 求最短支長(zhǎng),最通用的距離方法Unweighted Pair

Group

Method

(UPGMA法)通過(guò)矩陣建樹的方法示例:FM法+

分成三組:D,E及ABC。計(jì)算距離矩陣+

將DE合并,ABC單列,計(jì)算距離矩陣分成三組:C,DE及AB。計(jì)算距離矩陣3.

最大似然法(ML)+選取一個(gè)特定的替代模型來(lái)分析給定的一組序列數(shù)據(jù),使得獲得的每一個(gè)拓?fù)浣Y(jié)構(gòu)的似然率都為最大值,然后再挑出其中似然率最大的拓?fù)浣Y(jié)構(gòu)作為最優(yōu)樹。位置1位置2位置3…SUM拓?fù)錁銩L(A1)L(A2)L(A3)…Asum拓?fù)錁銪L(B1)L(B2)L(B3)…Bsum拓?fù)錁銫L(C2)L(C3)L(C3)…Csum………………似然值最大,即SUM最大的拓?fù)錁鋭t為最優(yōu)樹。三、構(gòu)建進(jìn)化樹的一般原則可靠的待分析數(shù)據(jù)準(zhǔn)確的多序列比對(duì)選擇合適的建樹方法:A.序列相似程度高,MP(最大簡(jiǎn)約法)B.序列相似程度較低,ML(最大似然法)C.序列相似程度太低,無(wú)意義

一般采用兩種及以上方法構(gòu)建進(jìn)化樹,無(wú)顯著區(qū)別可接受構(gòu)建進(jìn)化樹的一般原則進(jìn)化樹的可靠性分析進(jìn)化樹的可靠性分析:自展法(BootstrapMethod)(統(tǒng)計(jì)方法)。從排列的多序列中隨機(jī)有放回的抽取某一列,構(gòu)成相同長(zhǎng)度的新的排列序列重復(fù)上面的過(guò)程,得到多組新的序列對(duì)這些新的序列進(jìn)行建樹,再觀察這些樹與原始樹是否有差異,以此評(píng)價(jià)建樹第三節(jié) 常用分子進(jìn)化與系統(tǒng)發(fā)育分析的軟件一、常見的分子進(jìn)化分析程序Phylip由華盛頓大學(xué)遺傳學(xué)系開發(fā),是一個(gè)免費(fèi)的系統(tǒng)發(fā)育分析軟件包(版本3.69),可以通過(guò)以下地址下載。/phylip.ht

mlPAUP*最早是在蘋果機(jī)上開發(fā)的具有菜單界面的進(jìn)化分析軟件,早先版本只有MP法,后續(xù)版本已經(jīng)包括距離法和ML法,現(xiàn)今有mac,win,linux等多種版本,該軟件不是免費(fèi)軟件。軟件名稱網(wǎng)址說(shuō)明PHYLIPhttp://evolution.gs.washingt/phylip.htmlIt

includes

programs

to

carry

outparsimony,distance

matrix

methods,

maximumlikelihood,

and

other

methods

on

a

variety

oftypes

of

data,

including

DNA

and

RNAsequences,

protein

sequences,

restrictionsites,

0/1

discrete

characters

data,genefrequencies,

continuous

charactersanddistance

matrices.PAUP/It

includes

parsimony,

distance

matrix,invariants,

and

maximum

likelihood

methodsand

many

indices

and

statistical

tests.Tree

of

Lifehttp://phylogeny.arizona.edu/tree/program/program.htmlArizona大學(xué)開發(fā)的軟件MEGAhttp://www.megasoftware.n

et美國(guó)賓州州立大學(xué)Masatoshi

Nei開發(fā)

(It

carries

out

parsimony,

distance

matrixand

likelihood

methods

formoleculardata.)軟件名稱網(wǎng)址說(shuō)明MOLPHYhttp://www.ism.ac.jp/software/ismlib/softother.e.html#molphy日本國(guó)立統(tǒng)計(jì)數(shù)理研究所開發(fā)。(Carryingoutmaximum

likelihood

inference

of

phylogenies

foreither

nucleotide

sequences

or

protein

sequences.)PAMLhttp://abacus.gene.ucl.ac.uk/software/paml.html英國(guó)倫敦學(xué)院Z.H.YANG開發(fā)。(Apackage

ofprograms

for

the

ML

analysis

of

nucleotide

orprotein

sequences.)PUZZLEftp://fx.zi.biologie.uni-muenchen.de/pub/puzzle應(yīng)用Quarter

puzzling方法(一種最大簡(jiǎn)約法)構(gòu)建系統(tǒng)發(fā)育樹TreeViewhttp://taxonomy.zoology.gla.ac.uk/rod/treeview.htmlA

program

for

displaying

trees

on

AppleMacs

and

Windows

PCs.

It

can

drawrootedand

unrooted

trees,

display

bootstrap

values,and

supports

the

native

font

andgraphicsfile

formats

of

both

Macs

and

PCs.phylogenyhttp://www.ebi.ac.uk/phylogeny.htmlEBI的系統(tǒng)發(fā)育樹分析軟件二、PHYLIP軟件包介

紹+Phylip包含了35個(gè)獨(dú)立的程序,這些獨(dú)立的程序都實(shí)現(xiàn)特定的功能,這些程序基本上包括了系統(tǒng)發(fā)生分析的所有方面。+Phylip有多種不同平臺(tái)的版本包括Windows,Macintosh,DOS,Linux,Unix和OpenVMX)。+

Phylip是目前最廣泛使用的系統(tǒng)發(fā)生分析程序,主要包括以下幾個(gè)程序組:分子序列組,距離矩陣組,基因頻率組,離散字符組,進(jìn)化樹繪制組。分子序列組:蛋白質(zhì)序列:protpars,proml,promlk,protdist核酸序列:dnapenny,dnapars, dnamove,dnaml,dnamlk, dnainvar,dnadist,dnacomp+

距離矩陣組:Fitch,kitsch,neighbor+

基因頻率組:Gendist,contml+

離散字符組:

Pars,mix,move,penny,dollop,dolmove,dolpenny,clique,factor+

進(jìn)化樹繪制組:drawtree,drawgram+

其他:restdist,restml,seqboot,contrastPhylip安裝分析程序幫助文件Exe文件夾內(nèi)容三、PHYLIP軟件包的應(yīng)用1.

根據(jù)分析數(shù)據(jù),選擇適當(dāng)?shù)某绦蛉绻治龅氖荄NA數(shù)據(jù),就在核酸序列分析類中選擇程序(dnapenny,dnapars,dnamove,dnaml,dnamlk,dnainvar,dnadist,dnacomp

)如果分析的是離散數(shù)據(jù),如突變位點(diǎn)數(shù)據(jù),就在離散字符組里面選擇程序。選擇適當(dāng)?shù)姆治龇椒ㄈ绶治龅氖荄NA數(shù)據(jù),可以選擇簡(jiǎn)約法(dnapars),似然法(dnaml,dnamlk),距離法等(dnadist)。。。進(jìn)行分析選擇好程序后,執(zhí)行,讀入分析數(shù)據(jù),選擇適當(dāng)?shù)膮?shù),進(jìn)行分析,結(jié)果自動(dòng)保存為

outfile,outtree。Outfile是一個(gè)記錄文件,記錄了分析的過(guò)程和結(jié)果,可以直接用文本編輯器(如寫字板)打開。outtree是分析結(jié)果的樹文件,可以用

phylip提供的繪樹程序打開查看,也可以用其他的程序來(lái)打開,如treeview。構(gòu)建核酸樹的過(guò)程Alignment.phykitsch.exefitch.exeneighbor.exeDistdnadist.exednapars.exeMPdnamlk.exeMLdnaml.exeouttreeoutfileTreeviewconsen-se.exeouttree

outfile構(gòu)建蛋白質(zhì)樹的過(guò)程Alignment.phykitsch.exefitch.exeneighbor.exeDistprodist.exeprotpars.exeMPpromlk.exeMLproml.exeouttreeoutfileTreeviewconsen-se.exeouttree

outfile進(jìn)化樹的可靠性分析:

自展法(BootstrapMethod)四、實(shí)例:用PHYLIP

軟件推導(dǎo)進(jìn)化樹(1).進(jìn)入EXE文件夾,點(diǎn)擊SEQBOOT軟件,輸入DNA8.phy文件名,回車后,輸Y確認(rèn)參數(shù)。并在Random

numberseed

(must

be

odd)

?的下面輸入一個(gè)4N+1的數(shù)字如5,

程序開始運(yùn)行,并在EXE文件夾中產(chǎn)生文件outfile.(2).

得到一個(gè)文件outfile,把文件outfile改名為infile,

infile可用記事本打開,內(nèi)容如下:(3).

點(diǎn)擊DNADIST(PRODIST

for

蛋白序列)程序。輸入M更改參數(shù),輸入D選擇data

sets,輸入100。輸Y確認(rèn)參數(shù),程序開始運(yùn)行,并在EXE文件夾中產(chǎn)生outfile。建樹方法:距

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論