多序列聯(lián)配和系統(tǒng)進(jìn)化樹組織構(gòu)建課件_第1頁
多序列聯(lián)配和系統(tǒng)進(jìn)化樹組織構(gòu)建課件_第2頁
多序列聯(lián)配和系統(tǒng)進(jìn)化樹組織構(gòu)建課件_第3頁
多序列聯(lián)配和系統(tǒng)進(jìn)化樹組織構(gòu)建課件_第4頁
多序列聯(lián)配和系統(tǒng)進(jìn)化樹組織構(gòu)建課件_第5頁
已閱讀5頁,還剩118頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、多序列聯(lián)配和多序列聯(lián)配和系統(tǒng)進(jìn)化樹組織構(gòu)建系統(tǒng)進(jìn)化樹組織構(gòu)建序列同源性分析序列同源性分析 當(dāng)我們在研究一個蛋白質(zhì)或基因時,經(jīng)常會考慮這樣一個很基本當(dāng)我們在研究一個蛋白質(zhì)或基因時,經(jīng)常會考慮這樣一個很基本的問題:它與其他蛋白質(zhì)的同源性關(guān)系如何?的問題:它與其他蛋白質(zhì)的同源性關(guān)系如何?序列同源性分析:序列同源性分析: 是將待研究序列加入到一組與之同源,但來自不同物種的序列中是將待研究序列加入到一組與之同源,但來自不同物種的序列中進(jìn)行多序列同時比較,以確定該序列與其它序列間的同源性大小。這進(jìn)行多序列同時比較,以確定該序列與其它序列間的同源性大小。這是理論分析方法中最關(guān)鍵的一步。是理論分析方法中最關(guān)鍵

2、的一步。 由于同源序列通常保持了相似的結(jié)構(gòu)和功能,因而多序列比對就由于同源序列通常保持了相似的結(jié)構(gòu)和功能,因而多序列比對就顯得很有意義。顯得很有意義。 盡管可以對蛋白質(zhì)、盡管可以對蛋白質(zhì)、DNA序列進(jìn)行多重比對,但是很多數(shù)據(jù)庫序列進(jìn)行多重比對,但是很多數(shù)據(jù)庫的比對只針對蛋白質(zhì)家族。的比對只針對蛋白質(zhì)家族。實際應(yīng)用中常進(jìn)行氨基酸序列的多序列比對,然后轉(zhuǎn)化成相應(yīng)的實際應(yīng)用中常進(jìn)行氨基酸序列的多序列比對,然后轉(zhuǎn)化成相應(yīng)的DNA比對比對多序列比對的定義多序列比對的定義 蛋白家族的特征是用存在一組同源序列的多重比對來定義的。蛋白家族的特征是用存在一組同源序列的多重比對來定義的。一個多重比對就是一組可以部

3、分或整體對齊的蛋白質(zhì)或核苷酸一個多重比對就是一組可以部分或整體對齊的蛋白質(zhì)或核苷酸序列序列(3個或個或3個以上個以上)。 相同或相似的氨基酸殘基排在同一列上,這些對齊的殘基在相同或相似的氨基酸殘基排在同一列上,這些對齊的殘基在進(jìn)化意義上是同源的:來自共同的祖先。并且還可假定從結(jié)構(gòu)進(jìn)化意義上是同源的:來自共同的祖先。并且還可假定從結(jié)構(gòu)角度看,這些殘基也是同源的:在三維結(jié)構(gòu)中,對齊的殘基也角度看,這些殘基也是同源的:在三維結(jié)構(gòu)中,對齊的殘基也傾向于占據(jù)對應(yīng)的位置。傾向于占據(jù)對應(yīng)的位置。 對于關(guān)系很近的一組序列,很容易產(chǎn)生多序列比對,甚至可對于關(guān)系很近的一組序列,很容易產(chǎn)生多序列比對,甚至可以直接觀

4、察得到。但當(dāng)序列間出現(xiàn)一些分歧時,多序列比對過以直接觀察得到。但當(dāng)序列間出現(xiàn)一些分歧時,多序列比對過程中出現(xiàn)的問題就很難解決了,如程中出現(xiàn)的問題就很難解決了,如gap數(shù)量和位置的估計就比數(shù)量和位置的估計就比較困難。較困難。 那么如何確定某些氨基酸殘基是否對齊了呢?那么如何確定某些氨基酸殘基是否對齊了呢? 可根據(jù)下面可根據(jù)下面4個特征來判斷相應(yīng)氨基酸殘基是否已經(jīng)對齊:個特征來判斷相應(yīng)氨基酸殘基是否已經(jīng)對齊: (1)一些高度保守的殘基一些高度保守的殘基(如參與形成二硫鍵的半胱氨酸如參與形成二硫鍵的半胱氨酸); (2)形成保守基序或結(jié)構(gòu)域,如跨膜結(jié)構(gòu)域和免疫球蛋白結(jié)構(gòu)域形成保守基序或結(jié)構(gòu)域,如跨膜結(jié)

5、構(gòu)域和免疫球蛋白結(jié)構(gòu)域等。等。 (3)蛋白質(zhì)二級結(jié)構(gòu)的保守特征,如參與形成蛋白質(zhì)二級結(jié)構(gòu)的保守特征,如參與形成-螺旋、螺旋、-折疊和折疊和可變區(qū)的殘基;可變區(qū)的殘基; (4)顯示出一致插入或缺失模式的區(qū)域。顯示出一致插入或缺失模式的區(qū)域。多序列比對的定義多序列比對的定義多序列比對的意義多序列比對的意義u 用于分析同一基因或蛋白質(zhì)在不同物種中用于分析同一基因或蛋白質(zhì)在不同物種中的進(jìn)化的進(jìn)化u 通過分析多個基因或蛋白質(zhì)序列之間的同通過分析多個基因或蛋白質(zhì)序列之間的同源性確定它們在進(jìn)化上的關(guān)系源性確定它們在進(jìn)化上的關(guān)系u 分析基因或蛋白質(zhì)的功能分析基因或蛋白質(zhì)的功能70 Mya70 Mya200 M

6、ya200 MyaWGD 14 and 42 MyaWGD 14 and 42 Mya67.7 Mya67.7 MyaPhylogenetic Phylogenetic analysisanalysisEo, Eo, 棕櫚棕櫚; Ma, ; Ma, 香蕉香蕉; Zo, ; Zo, 姜姜; ; Cl, Cl, 姜黃姜黃72 Mya72 Mya多序列比對的典型應(yīng)用和實際策略多序列比對的典型應(yīng)用和實際策略 什么時候使用和為什么使用多重比對什么時候使用和為什么使用多重比對若所研究的蛋白質(zhì)或基因與另一組蛋白質(zhì)有聯(lián)系,那么這若所研究的蛋白質(zhì)或基因與另一組蛋白質(zhì)有聯(lián)系,那么這些蛋白質(zhì)可以提供可能的功能、結(jié)構(gòu)

7、、進(jìn)化方面的信息;些蛋白質(zhì)可以提供可能的功能、結(jié)構(gòu)、進(jìn)化方面的信息;大多數(shù)蛋白質(zhì)家族中有遠(yuǎn)緣的成員。與兩兩比對相比,多大多數(shù)蛋白質(zhì)家族中有遠(yuǎn)緣的成員。與兩兩比對相比,多序列比對能夠更敏感地發(fā)現(xiàn)同源關(guān)系;序列比對能夠更敏感地發(fā)現(xiàn)同源關(guān)系;在檢查某次數(shù)據(jù)庫搜索結(jié)果時,多重比對形式的結(jié)果能更在檢查某次數(shù)據(jù)庫搜索結(jié)果時,多重比對形式的結(jié)果能更容易顯示保守殘基與基序;容易顯示保守殘基與基序;如果研究如果研究cDNA克隆,按照慣例我們會對相應(yīng)序列進(jìn)行測序??寺?,按照慣例我們會對相應(yīng)序列進(jìn)行測序。多序列比對可以顯示結(jié)果中是否有矛盾之處;多序列比對可以顯示結(jié)果中是否有矛盾之處;分析物種數(shù)據(jù)可以揭示很多生物學(xué)問

8、題(如進(jìn)化、結(jié)構(gòu)和分析物種數(shù)據(jù)可以揭示很多生物學(xué)問題(如進(jìn)化、結(jié)構(gòu)和功能等方面)。功能等方面)。Entrez的的PopSet部分包含了核酸和蛋白質(zhì)部分包含了核酸和蛋白質(zhì)的物種數(shù)據(jù)集,可以多重比對的形式顯示。的物種數(shù)據(jù)集,可以多重比對的形式顯示。多序列比對的典型應(yīng)用和實際策略多序列比對的典型應(yīng)用和實際策略 什么時候使用和為什么使用多重比對什么時候使用和為什么使用多重比對6. 當(dāng)一個物種的基因組被完整測序,數(shù)據(jù)分析的一個主要部分當(dāng)一個物種的基因組被完整測序,數(shù)據(jù)分析的一個主要部分是定義所有基于產(chǎn)物所歸屬的蛋白家族。數(shù)據(jù)庫搜索進(jìn)行高效是定義所有基于產(chǎn)物所歸屬的蛋白家族。數(shù)據(jù)庫搜索進(jìn)行高效的多重比對,

9、將每一個新蛋白或基因與其他所有家族的蛋白質(zhì)的多重比對,將每一個新蛋白或基因與其他所有家族的蛋白質(zhì)進(jìn)行比較。進(jìn)行比較。7. 利用多序列比對數(shù)據(jù)構(gòu)建系統(tǒng)發(fā)生樹。建樹的一個最關(guān)鍵的利用多序列比對數(shù)據(jù)構(gòu)建系統(tǒng)發(fā)生樹。建樹的一個最關(guān)鍵的步驟就是產(chǎn)生最佳的多序列比對。步驟就是產(chǎn)生最佳的多序列比對。8. 很多基因的調(diào)節(jié)區(qū)含有轉(zhuǎn)錄因子結(jié)合的共有序列。很多基因的調(diào)節(jié)區(qū)含有轉(zhuǎn)錄因子結(jié)合的共有序列。9. 功能分歧分析、分子進(jìn)化分析等。功能分歧分析、分子進(jìn)化分析等。10.其他應(yīng)用,如構(gòu)建其他應(yīng)用,如構(gòu)建profile,打分矩陣等。,打分矩陣等。HMMER就是利用就是利用已知同源序列的多序列比對結(jié)果構(gòu)建已知同源序列的多

10、序列比對結(jié)果構(gòu)建profile,然后再利用該,然后再利用該profile去搜索蛋白數(shù)據(jù)庫查找相應(yīng)蛋白的同源序列。去搜索蛋白數(shù)據(jù)庫查找相應(yīng)蛋白的同源序列。多序列比對的方法多序列比對的方法 同源性分析中常常要通過多序列比對來找出序列之間的相互關(guān)系,和blast的局部匹配搜索不同,多序列比對大多都是采用全局比對的算法。這樣對于采用計算機程序的自動多序列比對是一個非常復(fù)雜且耗時的過程,特別是序列數(shù)目多,且序列長的情況下。多序列比對的方法多序列比對的方法2. 計算機程序自動比對計算機程序自動比對 通過特定的算法(如同步法,漸進(jìn)法等),由計算機程序自動搜索最佳的多序列比對狀態(tài)?;旧隙嘈蛄斜葘梢苑譃榛?/p>

11、上多序列比對可以分為:1. 手工比對(輔助編輯軟件如手工比對(輔助編輯軟件如 bioedit,seaview,Genedoc等)等) 通過輔助軟件的不同顏色顯示不同殘基,靠分析者的觀察來改變比對的狀態(tài)。Se-Al自動多序列比對的算法自動多序列比對的算法1. 同步法同步法 將序列兩兩比對時的二維動態(tài)規(guī)劃矩陣擴展到三維矩陣。即用矩陣的維數(shù)來反映比對的序列數(shù)目。這種方法的計算量很大,對于計算機系統(tǒng)的資源要求比較高,一般只有在進(jìn)行少數(shù)的較短的序列的比對的時候才會用到這個方法。2. 步進(jìn)法步進(jìn)法 最常見的就是clustal所采用的方法。 其基本思想就是基于相似序列通常具有進(jìn)化相關(guān)性相似序列通常具有進(jìn)化相

12、關(guān)性的這一假設(shè)。 Clustal的漸進(jìn)比對過程的漸進(jìn)比對過程 在比對過程中,先對所有的序列進(jìn)行兩兩比對并計算它們相似性分值,然后根據(jù)相似性分值將它們分成若干組,并在每組之間進(jìn)行比對,計算相似性分值。根據(jù)相似性分值繼續(xù)分組比對,直到得到最終比對結(jié)果。在比對過程中,相似性程度較高的序列先進(jìn)行比對而距離較遠(yuǎn)的序列添加在后面。多序列比對常用軟件多序列比對常用軟件1. Clustal W/ Clustal X2. MUSCLE3. MAFFT4. T-Coffee5. ProbCons6. POA7. DIALIGN性能比較 1. ClustalW/X: 最經(jīng)典、最被廣泛接受的工具 2. MUSCLE:

13、 目前最流行的多序列比對工具 3. DIALIGN: 序列相似性低時最準(zhǔn)確 4. POA:性能接近T-Coffee和DIALIGN,速度最快(As sequences varied considerably in length, POA (Lee et al. 2002), which treats long indels very accurately, was the alignment program of choice.) 5. ProbCons:目前綜合性能比較好 6. T-Coffee:序列相似性高時最準(zhǔn)確 7. MAFFT:綜合性能比較好Clustal工具工具 Clustal是一

14、個單機版的基于漸進(jìn)比對的多序列比對工具,由Higgins D.G. 等開發(fā)。有應(yīng)用于多種操作系統(tǒng)平臺的版本,包括linux版,DOS版的clustalw,clustalx等。 CLUSTAL是一種漸進(jìn)的比對方法,先將多個序列兩兩比對構(gòu)建距離矩陣,反映序列之間兩兩關(guān)系;然后根據(jù)距離矩陣計算產(chǎn)生系統(tǒng)進(jìn)化指導(dǎo)樹,對關(guān)系密切的序列進(jìn)行加權(quán);然后從最緊密的兩條序列開始,逐步引入臨近的序列并不斷重新構(gòu)建比對,直到所有序列都被加入為止。Clustal的工作原理Clustal輸入多個序列輸入多個序列快速的序列兩兩比對,計算序列間的距離,快速的序列兩兩比對,計算序列間的距離,獲得一個距離矩陣。獲得一個距離矩陣。

15、鄰接法鄰接法(NJ)構(gòu)建一個樹(引導(dǎo)樹)構(gòu)建一個樹(引導(dǎo)樹)根據(jù)引導(dǎo)樹,漸進(jìn)比對多個序列。根據(jù)引導(dǎo)樹,漸進(jìn)比對多個序列。Clustal的比對模式多序列比對模式多序列比對模式Profile比對模式比對模式:先對不同的亞家族成員進(jìn)行多序:先對不同的亞家族成員進(jìn)行多序列比對,然后將兩個多序列比對進(jìn)行整合。列比對,然后將兩個多序列比對進(jìn)行整合。Clustalx的工作界面(多序列比對模式多序列比對模式)Clustalx的工作界面(profile比對模式比對模式)Clustal X的應(yīng)用1. 輸入輸出格式輸入輸出格式 輸入序列的格式比較靈活,可以是前面介紹過的FASTA格式,還可以是PIR、SWISS-P

16、ROT、GDE、Clustal、GCG/MSF、RSF等格式。 輸出格式也可以選擇,有ALN、GCG、PHYLIP和NEXUS等,用戶可以根據(jù)自己的需要選擇合適的輸出格式。2. 兩種工作模式兩種工作模式a. 多序列比對模式b. profile比對模式多序列比對實例輸入文件的格式(fasta): HvNIP2-1MASNSRSNSRATFSSEIHDIGTVQNSTTPSMVYYTERSIADYFPPHLLKKVVSEVVSTFLLVFVTCGAAAISAHDVTRISQLGQSVAGGLIVVVMIYAVGHISGAHMNPAVTLAFAIFRHFPWIQVPFYWAAQFTGAICASFVL

17、KAVLHPITVIGTTEPVGPHWHALVIEVVVTFNMMFVTLAVATDTRAVGELAGLAVGSSVCITSIFAGAVSGGSMNPARTLGPALASNRYPGLWLYFLGPVLGTLSGAWTYTYIRFEDPPKDAPQKLSSFKLRRLQSQSVAADDDELDHIPVHvNIP2-2MSVTSNTPTRANSRVNYSNEIHDLSTVQDGAPSLAPSMYYQEKSFADFFPPHLLKKVISELVATFLLVFVTCGAASIYGADVTRVSQLGQSVVGGLIVTVMIYATGHISGAHMNPAVTLSFACFRHFPWIQVPFYWAAQFT

18、GAMCAAFVLRAVLHPITVLGTTTPTGPHWHALVIEIIVTFNMMFITCAVATDSRAVGELAGLAVGSAVCITSIFAGPVSGGSMNPARTLAPAVASGVYTGLWIYFLGPVIGTLSGAWVYTYIRFEEEPSVKDGPQKLSSFKLRRLQSQRSMAVDEFDHVOsNIP2-1MASNNSRTNSRANYSNEIHDLSTVQNGTMPTMYYGEKAIADFFPPHLLKKVVSEVVATFLLVFMTCGAAGISGSDLSRISQLGQSIAGGLIVTVMIYAVGHISGAHMNPAVTLAFAVFRHFPWIQVPFYWAAQ

19、FTGAICASFVLKAVIHPVDVIGTTTPVGPHWHSLVVEVIVTFNMMFVTLAVATDTRAVGELAGLAVGSAVCITSIFAGAISGGSMNPARTLGPALASNKFDGLWIYFLGPVMGTLSGAWTYTFIRFEDTPKEGSSQKLSSFKLRRLRSQQSIAADDVDEMENIQVOsNIP2-2MASTTAPSRTNSRVNYSNEIHDLSTVQSVSAVPSVYYPEKSFADIFPPNLLKKVISEVVATFLLVFVTCGAASIYGEDMKRISQLGQSVVGGLIVTVMIYATGHISGAHMNPAVTLSFAFFRHFPWI

20、QVPFYWAAQFTGAMCAAFVLRAVLYPIEVLGTTTPTGPHWHALVIEIVVTFNMMFVTCAVATDSRAVGELAGLAVGSAVCITSIFAGPVSGGSMNPARTLAPAVASNVYTGLWIYFLGPVVGTLSGAWVYTYIRFEEAPAAAGGAAPQKLSSFKLRRLQSQSMAADEFDNV讀入序列數(shù)據(jù)讀入序列數(shù)據(jù)設(shè)置多序列設(shè)置多序列比對參數(shù)比對參數(shù)Profile多序列比對步驟多序列比對步驟1:先讀入文件:先讀入文件1,并對文件,并對文件1中的序列進(jìn)行中的序列進(jìn)行比對,將比對結(jié)果進(jìn)行保存;比對,將比對結(jié)果進(jìn)行保存;然后讀入文件然后讀入文件2,并

21、對文件,并對文件2中的序列進(jìn)行多序列比對,將比對結(jié)果中的序列進(jìn)行多序列比對,將比對結(jié)果進(jìn)行保存。進(jìn)行保存。Profile多序列比對步驟多序列比對步驟2:分別讀入文件:分別讀入文件1多序列比對結(jié)果多序列比對結(jié)果(profile1)及文件)及文件2多序列比對結(jié)果(多序列比對結(jié)果(profile2) 。Profile多序列比對步驟多序列比對步驟3:將文件:將文件1多序列比對結(jié)果及文件多序列比對結(jié)果及文件2多序列多序列比對結(jié)果進(jìn)行比對。比對結(jié)果進(jìn)行比對。Clustal WClustalW is a general purpose multiple sequence alignment program

22、for DNA or proteins. It produces biologically meaningful multiple sequence alignments of divergent sequences. It calculates the best match for the selected sequences, and lines them up so that the identities, similarities and differences can be seen. Evolutionary relationships can be seen via viewin

23、g Cladograms or Phylograms. 原理同原理同Clustal X軟件。軟件。Clustal X是是Clustal W的圖形界面版本,的圖形界面版本,在開發(fā)了在開發(fā)了Clustal W之后,之后,Thompson等又再等又再Clustal W基礎(chǔ)上增加基礎(chǔ)上增加了圖形界面便有了了圖形界面便有了Clustal X,它的操作更加直觀簡單。它的操作更加直觀簡單??上螺d到可下載到PC機,使用方法同機,使用方法同Clustal X輸出輸出格式格式設(shè)定參數(shù)設(shè)定參數(shù)其他多其他多序列比序列比對工具對工具的鏈接的鏈接粘貼序列粘貼序列或以文件的格式上傳或以文件的格式上傳部分參數(shù)定義部分參數(shù)定義

24、Gap opening penalty:增大數(shù)值使:增大數(shù)值使 gap 數(shù)目減少數(shù)目減少Gap extention penalty:增大數(shù)值使:增大數(shù)值使 gap 長度變短長度變短Weight transition:AG 轉(zhuǎn)換或轉(zhuǎn)換或 CT 轉(zhuǎn)換轉(zhuǎn)換(multiple DNA sequence alignment)Hydrophilic gap:選擇:選擇“on” 將增加形成將增加形成 gap 的機會的機會(multiple protein sequence alignment)Residue-specific gap penalties:選擇:選擇“ on” 將增加在某些氨將增加在某些氨基酸

25、殘基處形成基酸殘基處形成 gap 的機會,而減少在另一些氨基酸殘基處形的機會,而減少在另一些氨基酸殘基處形成成 gap 的機會的機會(multiple protein sequence alignment)此比對結(jié)此比對結(jié)果文件可果文件可下載下載Phylip輸出格輸出格式,可用于進(jìn)式,可用于進(jìn)化樹構(gòu)建化樹構(gòu)建可將輸出結(jié)果可將輸出結(jié)果重新進(jìn)行排序重新進(jìn)行排序以彩以彩色形色形式顯式顯示示Clustal W產(chǎn)生的進(jìn)化樹。由產(chǎn)生的進(jìn)化樹。由鄰接法獲得,多沒有經(jīng)過可鄰接法獲得,多沒有經(jīng)過可靠性檢驗,不建議直接使用靠性檢驗,不建議直接使用MUSCLE MUSCLE stands for MUltiple

26、Sequence Comparison by Log-Expectation. MUSCLE is claimed to achieve both better average accuracy and better speed than ClustalW2 or T-Coffee (在速度和精在速度和精確性上優(yōu)于確性上優(yōu)于clustalw和和T-Coffee), depending on the chosen options.http:/www.ebi.ac.uk/Tools/muscle/以圖形形式顯示聯(lián)配結(jié)果以圖形形式顯示聯(lián)配結(jié)果MAFFT個人比較喜歡的軟件個人比較喜歡的軟件可改變序列的

27、輸出順序可改變序列的輸出順序選擇多序列比對策略(自動選擇多序列比對策略(自動的或人工的)的或人工的)若不選擇,則若不選擇,則MAFFT程序可根據(jù)輸入的序列情況自動選擇比較合適的策略程序可根據(jù)輸入的序列情況自動選擇比較合適的策略調(diào)整比對參數(shù)調(diào)整比對參數(shù)可通過可通過blast查詢查詢swissprot數(shù)據(jù)數(shù)據(jù)庫搜索同源序列庫搜索同源序列自主選擇合適自主選擇合適的比對策略的比對策略作多序列比對時應(yīng)注意的問題作多序列比對時應(yīng)注意的問題 多序列比對結(jié)果直接影響到接下來的分析結(jié)果的準(zhǔn)確性,因此,多序列比對結(jié)果直接影響到接下來的分析結(jié)果的準(zhǔn)確性,因此,作多序列比對時應(yīng)注意:作多序列比對時應(yīng)注意: 1、根據(jù)序

28、列間同源性的高低有針對性的選擇多序列比對工具。、根據(jù)序列間同源性的高低有針對性的選擇多序列比對工具。比如比如DIALIGN在序列相似性低時最準(zhǔn)確,而在序列相似性低時最準(zhǔn)確,而T-Coffee在序列相似在序列相似性高時最準(zhǔn)確。性高時最準(zhǔn)確。 2、對于同一組序列,應(yīng)通過不斷調(diào)整選擇參數(shù),比如打分矩陣、對于同一組序列,應(yīng)通過不斷調(diào)整選擇參數(shù),比如打分矩陣和和gap opening penalty等,得到多個比對結(jié)果,結(jié)合等,得到多個比對結(jié)果,結(jié)合motif和和domain等信息從中選擇準(zhǔn)確度最高的比對。等信息從中選擇準(zhǔn)確度最高的比對。 3、對比對結(jié)果應(yīng)根據(jù)目標(biāo)蛋白的二級結(jié)構(gòu)、三級結(jié)構(gòu)及保守的、對比對

29、結(jié)果應(yīng)根據(jù)目標(biāo)蛋白的二級結(jié)構(gòu)、三級結(jié)構(gòu)及保守的氨基酸殘基、氨基酸殘基、domain等信息進(jìn)行適當(dāng)?shù)娜斯ふ{(diào)整。比如利用等信息進(jìn)行適當(dāng)?shù)娜斯ふ{(diào)整。比如利用Se-Al工具工具(http:/tree.bio.ed.ac.uk/software/seal/)。 Se-Al is an application for creating multiple sequence alignments from nucleotide and amino acid sequences. At the moment it does not do any automatic alignments but is inten

30、ded for the production of hand alignments and for preparing input for alignment programs such as CLUSTAL and phylogeny reconstruction programs such as PHYLIP and PAUP. It is particularly useful for manipulating protein coding DNA/RNA sequences.若認(rèn)為有必要對產(chǎn)生的多序列比對若認(rèn)為有必要對產(chǎn)生的多序列比對結(jié)果進(jìn)行人工調(diào)整,此軟件非常有結(jié)果進(jìn)行人工調(diào)整,此軟

31、件非常有用,但目前只有針對蘋果的版本。用,但目前只有針對蘋果的版本。將氨基酸多序列比對轉(zhuǎn)換成相應(yīng)的核苷酸比對將氨基酸多序列比對轉(zhuǎn)換成相應(yīng)的核苷酸比對設(shè)定參數(shù)設(shè)定參數(shù)download多序列比對結(jié)果的顯示與編輯多序列比對結(jié)果的顯示與編輯導(dǎo)入其他格式文件導(dǎo)入其他格式文件此圖可直接放到文章中使用(植物此圖可直接放到文章中使用(植物NIP2基因的多序列比對結(jié)果)基因的多序列比對結(jié)果)系統(tǒng)進(jìn)化樹的構(gòu)建系統(tǒng)進(jìn)化樹的構(gòu)建分子進(jìn)化研究的目的分子進(jìn)化研究的目的從物種的一些分子特性出發(fā),從而了解物種之間從物種的一些分子特性出發(fā),從而了解物種之間的生物系統(tǒng)發(fā)生的關(guān)系。的生物系統(tǒng)發(fā)生的關(guān)系。 蛋白和核酸序列通過序列同源

32、性的比較進(jìn)而了解基因的進(jìn)化以及生物系統(tǒng)發(fā)生的內(nèi)在規(guī)律。從分子水平上研究生物的進(jìn)化具有以下優(yōu)點:從分子水平上研究生物的進(jìn)化具有以下優(yōu)點:(1)對分子進(jìn)化的分析可以數(shù)量化,因此根據(jù)生物所具有)對分子進(jìn)化的分析可以數(shù)量化,因此根據(jù)生物所具有的核酸和蛋白質(zhì)在結(jié)構(gòu)上的差異程度,比其他方法更精確地的核酸和蛋白質(zhì)在結(jié)構(gòu)上的差異程度,比其他方法更精確地估測生物種類的進(jìn)化時期和速度;估測生物種類的進(jìn)化時期和速度;(2)它是研究微生物進(jìn)化的有效方法;)它是研究微生物進(jìn)化的有效方法;(3)它可以比較親緣關(guān)系疏遠(yuǎn)的類型之間的進(jìn)化信息,這)它可以比較親緣關(guān)系疏遠(yuǎn)的類型之間的進(jìn)化信息,這是其他方法難以做到的。是其他方法難

33、以做到的。 系統(tǒng)發(fā)生與系統(tǒng)發(fā)生學(xué)系統(tǒng)發(fā)生與系統(tǒng)發(fā)生學(xué) 系統(tǒng)發(fā)生(phylogeny) 是指生物形成或進(jìn)化的歷史 系統(tǒng)發(fā)生學(xué)(phylogenetics) 研究物種之間的進(jìn)化關(guān)系 系統(tǒng)發(fā)育樹是什么? 對一組實際對象的世系關(guān)系的描述(如基因,物種等)。末端物種頂端中間節(jié)點中間枝條根末端分支葉子節(jié)點AB CDEFG樹只代表分支的拓?fù)浣Y(jié)構(gòu)FGCDEAB分子進(jìn)化研究的基礎(chǔ) 核苷酸和氨基酸序列中含有生物進(jìn)化歷史的全部信息。 在各種不同的發(fā)育譜系及足夠大的進(jìn)化時間尺度中,許多序列的進(jìn)化速率幾乎是恒定不變的。(分子鐘理論, 1965 ) 雖然很多時候仍然存在爭議,但是分子進(jìn)化確實能闡述一些生物系統(tǒng)發(fā)生的內(nèi)在規(guī)

34、律。 直系同源(orthologs): 同源的基因是由于共同的祖先基因進(jìn)化而產(chǎn)生的. 旁系同源(paralogs): 同源的基因是由于基因復(fù)制產(chǎn)生的. (以上定義源自Fitch, W.M. (1970) Distinguishing homologous from analogous proteins. Syst. Zool. 19, 99113) 直系同源與旁系同源paralogsorthologsparalogsorthologsErik L.L. Sonnhammer Orthology,paralogy and proposed classification for paralog s

35、ubtypes TRENDS in Genetics Vol.18 No.12 December 2002 以上兩個概念代表了兩個不同的進(jìn)化事件。 用于分子進(jìn)化分析中的序列必須是直系同源必須是直系同源的,才能真實反映進(jìn)化過程。Bacterium 1Bacterium 3Bacterium 2Eukaryote 1Eukaryote 4Eukaryote 3Eukaryote 2Bacterium 1Bacterium 3Bacterium 2Eukaryote 1Eukaryote 4Eukaryote 3Eukaryote 2Phylograms show branch order and

36、branch lengths進(jìn)化樹,有分支和支長信息2.進(jìn)化分支圖,進(jìn)化樹進(jìn)化分支圖,進(jìn)化樹Cladograms show branching order - branch lengths are meaningless進(jìn)化分支圖,只用分支信息,無支長信息。3.有根樹,無根樹,外圍群有根樹,無根樹,外圍群 (1)如果是一棵有根樹,則樹根代表在進(jìn)化歷史上是最早的、并且與其它所有分類單元都有聯(lián)系的分類單元; (2)如果找不到可以作為樹根的單元,則系統(tǒng)發(fā)生樹是無根樹。所謂無根,是指樹系中代表時間上最早的部位(最早的共同祖先)不能確定,只反映分類單元之間的距離而不涉及誰是祖先問題。 (3)從根節(jié)點出發(fā)

37、到任何一個節(jié)點的路徑指明進(jìn)化時間或者進(jìn)化距離。Rooted by outgrouparchaeaarchaeaarchaeaeukaryoteeukaryoteeukaryoteeukaryotebacteria outgrouprooteukaryoteeukaryoteeukaryoteeukaryote無根樹無根樹archaeaarchaeaarchaeaMonophyletic group(單源群單源群)Monophyleticgroup3.有根樹,無根樹,外圍群有根樹,無根樹,外圍群有根樹有根樹外圍群外圍群 4.基因樹,物種樹基因樹,物種樹We often assume that g

38、ene trees give us species treesabcABCGene treeSpecies treeWe Know the “Species Tree”ratmousehumanFor exampleTherfore We Can Infer Gene Losses, Deletions, (or lack of detection)ratmousehumanratmousehumanratmousehuman基因基因丟失丟失兩種老鼠間的親緣兩種老鼠間的親緣關(guān)系相對比較近關(guān)系相對比較近系統(tǒng)發(fā)育樹重建分析步驟多序列比對(自動比對,手工比對)建立取代模型(建樹方法)建立進(jìn)化樹進(jìn)化樹

39、評估系統(tǒng)發(fā)育樹重建的基本方法 最大簡約法(maximum parsimony,MP) 距離法(distance) 最大似然法(maximum likelihood,ML)最大簡約法(MP)最大簡約法(maximum parsimony,MP)最早源于形態(tài)性狀研究,現(xiàn)在已經(jīng)推廣到分子序列的進(jìn)化分析中。最大簡約法的理論基礎(chǔ)是奧卡姆(Ockham)哲學(xué)原則,這個原則認(rèn)為:解釋一個過程的最好理論是所需假設(shè)數(shù)目最少的那一個。對所有可能的拓?fù)浣Y(jié)構(gòu)進(jìn)行計算,對所有可能的拓?fù)浣Y(jié)構(gòu)進(jìn)行計算,并計算出所需替代數(shù)最小的那個拓?fù)浣Y(jié)構(gòu),作并計算出所需替代數(shù)最小的那個拓?fù)浣Y(jié)構(gòu),作為最優(yōu)樹。為最優(yōu)樹。 最大簡約法(MP)優(yōu)

40、點:最大簡約法不需要在處理核苷酸或者氨基酸替代的時不需要在處理核苷酸或者氨基酸替代的時候引入假設(shè)(替代模型)。候引入假設(shè)(替代模型)。此外,最大簡約法對于分析某些特殊的分子數(shù)據(jù)如插入、缺失等序列有用。缺點:在分析的序列位點上沒有回復(fù)突變或平行突變,且被檢驗的序列位點數(shù)很大的時候,最大簡約法能夠推導(dǎo)獲得一個很好的進(jìn)化樹。然而在分析序列上存在較多的回復(fù)突變或平行突變,而被檢驗的序列位點數(shù)又比較少的時候,最大簡約法可能會給出一個不合理的或者錯誤的進(jìn)化樹推導(dǎo)結(jié)果。最大簡約法適用于以下條件下的系統(tǒng)樹構(gòu)建: 所要比較的序列的堿基差別小,即同源性高;所要比較的序列的堿基差別小,即同源性高; 對于序列上的每一

41、個堿基有近似相等的變異率;對于序列上的每一個堿基有近似相等的變異率; 沒有過多的顛換和轉(zhuǎn)換的傾向;沒有過多的顛換和轉(zhuǎn)換的傾向; 所檢驗的序列的堿基數(shù)目較多(大于幾千個堿基)。所檢驗的序列的堿基數(shù)目較多(大于幾千個堿基)。 總之,最大簡約法適合構(gòu)建比對序列較長,分類群的進(jìn)總之,最大簡約法適合構(gòu)建比對序列較長,分類群的進(jìn)化位置靠近的系統(tǒng)樹?;恢每拷南到y(tǒng)樹。距離法距離法又稱距離矩陣法,首先通過各個物種之間的比較,根根據(jù)一定的假設(shè)(進(jìn)化距離模型)推導(dǎo)得出分類群之間的進(jìn)化距離,據(jù)一定的假設(shè)(進(jìn)化距離模型)推導(dǎo)得出分類群之間的進(jìn)化距離,構(gòu)建一個進(jìn)化距離矩陣。構(gòu)建一個進(jìn)化距離矩陣。進(jìn)化樹的構(gòu)建則是基于這

42、個矩陣中的進(jìn)化距離關(guān)系 。計算序列的距離,建立距離矩陣通過距離矩陣建進(jìn)化樹通過矩陣建樹的方法由進(jìn)化距離構(gòu)建進(jìn)化樹的方法有很多,常見有:1.Fitch-Margoliash Method(FM法)2. Neighbor-Joining Method (NJ法/鄰接法)3. Neighbors Relaton Method(鄰居關(guān)系法)4.Unweighted Pair Group Method (UPGMA法)最大似然法(ML)最大似然法(maximum likelihood,ML)最早應(yīng)用于系統(tǒng)發(fā)育分析是在對基因頻率數(shù)據(jù)的分析上,后來基于分子序列的分析中也已經(jīng)引入了最大似然法的分析方法。最大似

43、然法分析中,選取一個特定的替代模型來分析給選取一個特定的替代模型來分析給定的一組序列數(shù)據(jù),使得獲得的每一個拓?fù)浣Y(jié)構(gòu)的似然率定的一組序列數(shù)據(jù),使得獲得的每一個拓?fù)浣Y(jié)構(gòu)的似然率都為最大值,然后再挑出其中似然率最大的拓?fù)浣Y(jié)構(gòu)作為都為最大值,然后再挑出其中似然率最大的拓?fù)浣Y(jié)構(gòu)作為最優(yōu)樹最優(yōu)樹。在最大似然法的分析中,所考慮的參數(shù)并不是拓?fù)浣Y(jié)構(gòu)而是每個拓?fù)浣Y(jié)構(gòu)的枝長,并對似然率求最大值來估計枝長 。最大似然法(ML)最大似然法的建樹過程是個很費時的過程,因為在分析過程中有很大的計算量,每個步驟都要考慮內(nèi)部節(jié)點的所有可能性。最大似然法是一個比較成熟的參數(shù)估計的統(tǒng)計學(xué)方法,具有很好的統(tǒng)計學(xué)理論基礎(chǔ),在當(dāng)樣本量

44、很大的時候,似然法可以獲得參數(shù)統(tǒng)計的最小方差。只要使用了一個合理的、正確的替代模型,最大似然法可以推導(dǎo)出一個很好的進(jìn)化樹結(jié)果。 所以在構(gòu)建進(jìn)化樹之前,首先要對目標(biāo)多序列聯(lián)配進(jìn)行分析,所以在構(gòu)建進(jìn)化樹之前,首先要對目標(biāo)多序列聯(lián)配進(jìn)行分析,以選擇最佳的建樹模型以選擇最佳的建樹模型最大似然法(ML)由于最大似然法的分析過程需要耗費較多的時間,針對這種情況,發(fā)展出了許多優(yōu)化的可以加快最大似然法尋找最優(yōu)樹的搜索方法,如啟發(fā)式搜索,分枝交換搜索等。最大似然法具有堅實的統(tǒng)計學(xué)理論基礎(chǔ),充分的使用了分析序列中的信息資源,只要采用了合理的替代模型,可以得出很好的進(jìn)化樹分析結(jié)果。important構(gòu)建進(jìn)化樹的一般

45、原則 1. 可靠的待分析數(shù)據(jù)(核苷酸或蛋白質(zhì)序列) 2. 準(zhǔn)確的多序列比對 3. 選擇合適的建樹方法: A. 序列相似程度高,MP首先 B. 序列相似程度較低,ML首先 C. 序列相似程度太低,無意義 4. 一般采用兩種及以上方法構(gòu)建進(jìn)化樹,無顯著區(qū)別可接受構(gòu)建進(jìn)化樹的一般原則 (2)選擇外類群(Outgroup)選擇一個或多個已知與分析序列關(guān)系較遠(yuǎn)的序列作為外類群外類群可以輔助定位樹根外類群序列必須與剩余序列關(guān)系較近,但外類群序列與其他序列間的差異必須比其他序列之間的差異更顯著。bacteria outgroupeukaryoteeukaryoteeukaryoteeukaryotearch

46、aeaarchaeaarchaea外圍群外圍群進(jìn)化樹的可靠性分析進(jìn)化樹的可靠性分析(一)自舉法(Bootstrap Method)從排列的多序列中隨機又放回的抽取某一列,構(gòu)成相同長度的新的排列序列重復(fù)上面的過程,得到多組新的序列對這些新的序列進(jìn)行建樹,再觀察這些樹與原始樹是否有差異,以此評價建樹的可靠性 自舉檢驗因其具有較嚴(yán)格的統(tǒng)計學(xué)背景,加之計算機自舉檢驗因其具有較嚴(yán)格的統(tǒng)計學(xué)背景,加之計算機模擬技術(shù)的迅速發(fā)展,該方法已經(jīng)成為系統(tǒng)發(fā)生分析中很模擬技術(shù)的迅速發(fā)展,該方法已經(jīng)成為系統(tǒng)發(fā)生分析中很受歡迎的算法,并在分子進(jìn)化與系統(tǒng)發(fā)育分析研究中發(fā)揮受歡迎的算法,并在分子進(jìn)化與系統(tǒng)發(fā)育分析研究中發(fā)揮愈

47、來愈重要的作用。但自舉檢驗也有幾點不足之處:愈來愈重要的作用。但自舉檢驗也有幾點不足之處: 非常耗時;非常耗時; 次數(shù)太少時重復(fù)產(chǎn)生的結(jié)果常常不可靠;次數(shù)太少時重復(fù)產(chǎn)生的結(jié)果常常不可靠;具有低估置信度的傾向。具有低估置信度的傾向。(二)參數(shù)檢驗(二)參數(shù)檢驗(parameter test) 參數(shù)檢驗是簡約分析法構(gòu)建的系統(tǒng)樹的常用檢驗方法。該檢參數(shù)檢驗是簡約分析法構(gòu)建的系統(tǒng)樹的常用檢驗方法。該檢驗方法假設(shè)比對中的各個信息位點彼此獨立而且等價,并用兩驗方法假設(shè)比對中的各個信息位點彼此獨立而且等價,并用兩棵系統(tǒng)樹的最小替換數(shù)之差棵系統(tǒng)樹的最小替換數(shù)之差D作為檢驗統(tǒng)計量,分別考慮每個信作為檢驗統(tǒng)計量,

48、分別考慮每個信息位點,按下式計算反映息位點,按下式計算反映D變化程度的變化程度的V值:值:V=n/(n-1)Di -(1/n)(Dk)2 其中其中n是信息位點的數(shù)目。是信息位點的數(shù)目。n-1個自由度的個自由度的t檢驗,可以用來檢驗空假設(shè),檢驗,可以用來檢驗空假設(shè),即兩棵系統(tǒng)樹的替換數(shù)相等的情況:即兩棵系統(tǒng)樹的替換數(shù)相等的情況:t=(D/n)/(v) 1/2n1/2常見的分子進(jìn)化分析程序1. Phylip 由華盛頓大學(xué)遺傳學(xué)系開發(fā),是一個免費的系統(tǒng)發(fā)育分析軟件包,可以通過以下地址下載。/phylip.html2. PA

49、UP* 最早是在蘋果機上開發(fā)的具有菜單界面的進(jìn)化分析軟件,早先版本只有MP法,后續(xù)版本已經(jīng)包括距離法和ML法,現(xiàn)今有mac,win,linux等多種版本,該軟件不是免費軟件,使用者需要向開發(fā)者購買。MP法可適用于蛋白序列,其它法需用核苷酸序列。3. MEGA4. Phyml (最大似然法建樹最大似然法建樹)5. Tree puzzle6. Mrbayes (貝葉斯法建樹貝葉斯法建樹) 。Phylip軟件包介紹軟件包介紹 Phylip是一個免費的系統(tǒng)發(fā)生(phylogenetics)分析軟件包。以下鏈接可以下載: http:/evolution.genetics,/p

50、hylip.html 由華盛頓大學(xué)遺傳學(xué)系開發(fā),1980年首次公布,目前的版本是3.6(2000年6月)。 Phylip包含了35個獨立的程序,這些獨立的程序都實現(xiàn)特定的功能,這些程序基本上包括了系統(tǒng)發(fā)生分析的所有方面。 Phylip有多種不同平臺的版本(包括windows,Macintosh,DOS,Linux,Unix和OpenVMX)。 Phylip是目前最廣泛使用的系統(tǒng)發(fā)生分析程序,主要包括一下幾個程序組:分子序列組,距離矩陣組,基因頻率組,離散字符組,進(jìn)化樹繪制組。Phylip軟件包分組介紹分子序列組: 1.蛋白質(zhì)序列:protpars,proml,promlk, protdist

51、2.核酸序列:dnapenny,dnapars, dnamove,dnaml,dnamlk, dnainvar,dnadist,dnacompPhylip軟件包分組介紹距離矩陣組:Fitch,kitsch,neighbor基因頻率組:Gendist,contml離散字符組Pars,mix,move,penny,dollop,dolmove,dolpenny,clique,factor進(jìn)化樹繪制組:drawtree,drawgram其他:restdist,restml,seqboot,contrast treedist,consense,retreePhylip軟件包的文檔 Phylip軟件包的

52、文檔是非常詳細(xì)的,對于每個獨立的程序,都有一個獨立的文檔,詳細(xì)的介紹了該程序的使用及其說明。 此外,Phylip軟件包還包括程序的源代碼(c語言)。Phylip軟件包的應(yīng)用1、根據(jù)你的分析數(shù)據(jù),選擇適當(dāng)?shù)某绦?如,你分析的是DNA數(shù)據(jù),就在核酸序列分析類中選擇程序(dnapenny,dnapars, dnamove,dnaml,dnamlk, dnainvar,dnadist,dnacomp ); 如果分析的是離散數(shù)據(jù),如突變位點數(shù)據(jù),就在離散字符組里面選擇程序。Phylip軟件包的應(yīng)用2、選擇適當(dāng)?shù)姆治龇椒?如你分析的是DNA數(shù)據(jù),可以選擇簡約法(DNAPARS),似然法(DNAML, DN

53、AMLK),距離法等(DNADIST)。3、進(jìn)行分析 選擇好程序后,執(zhí)行,讀入分析數(shù)據(jù),選擇適當(dāng)?shù)膮?shù),進(jìn)行分析,結(jié)果自動保存為outfile,outtree。 Phylip軟件包的應(yīng)用Outfile是一個記錄文件,記錄了分析的過程和結(jié)果,可以直接用文本編輯器(如寫字板)打開。outtree是分析結(jié)果的樹文件,可以用phylip提供的繪樹程序打開查看,也可以用其他的程序來打開,如treeview,MEGA實例實例利用距離法構(gòu)建進(jìn)化樹利用距離法構(gòu)建進(jìn)化樹具體步驟:具體步驟:Seqboot.exeProtdist.exe (dnadist)Neighbor.exeConsensus.exe步驟一步

54、驟一 用用PHYLIP構(gòu)建系統(tǒng)發(fā)育樹構(gòu)建系統(tǒng)發(fā)育樹 首先使用SEQBOOT.EXE工具輸入多序列比對文檔lesson7.phySeqboot 工具工具輸入輸入lesson7.phy 在Random number seed (must be odd) ?提示下輸入任何4N+1的數(shù)字, 如101 其他選項設(shè)置默認(rèn),輸入Y,回車 運算并生成outfile文件隨機種子數(shù)隨機種子數(shù)輸入輸入4N+1的數(shù)字的數(shù)字統(tǒng)計檢驗的方法統(tǒng)計檢驗的方法重復(fù)抽樣的次數(shù)重復(fù)抽樣的次數(shù)10010000接受默認(rèn)設(shè)置接受默認(rèn)設(shè)置輸入輸入Y 將outfile更名results1后,雙擊打開PROTDIST.EXE工具把把outfi

55、le更名為更名為results1打開打開PROTDIST工具工具 輸入results1 選擇修改M選項,輸入100 其他設(shè)置默認(rèn),輸入Y,回車 計算生成新的outfile文件輸入輸入results1距離模型距離模型是否處理多樣本數(shù)是否處理多樣本數(shù)據(jù)集,默認(rèn)為否據(jù)集,默認(rèn)為否選擇選擇M,要處理多樣本數(shù)據(jù)集,要處理多樣本數(shù)據(jù)集輸入多樣本數(shù)據(jù)集的樣本集數(shù)輸入多樣本數(shù)據(jù)集的樣本集數(shù)目,與目,與Seqboot中的設(shè)置要一致中的設(shè)置要一致M選項以發(fā)生改變選項以發(fā)生改變其他設(shè)置默認(rèn),輸入其他設(shè)置默認(rèn),輸入Y 將outfile更名results2后,雙擊打開NEIGHBOR.EXE工具把把outfile更名為

56、更名為results2打開打開NEIGHBOR工具工具 輸入results2 修改O選項,輸入23 選擇修改M選項,輸入100 其他設(shè)置默認(rèn),輸入Y,回車 計算生成outfile和treefile文件輸入輸入results2選用的距離法選用的距離法選擇外類群選擇外類群是否處理多樣本數(shù)據(jù)集,默認(rèn)為否是否處理多樣本數(shù)據(jù)集,默認(rèn)為否輸入輸入O,要設(shè)置外類群,要設(shè)置外類群輸入輸入23,表示是第,表示是第23條序列作為外類群條序列作為外類群選擇選擇M,要處理多樣本數(shù)據(jù)集,要處理多樣本數(shù)據(jù)集,輸入多樣本數(shù)據(jù)集的樣本集數(shù)目,輸入多樣本數(shù)據(jù)集的樣本集數(shù)目,與前面步驟中的設(shè)置要一致與前面步驟中的設(shè)置要一致其他設(shè)

57、置默認(rèn),輸入其他設(shè)置默認(rèn),輸入Youtfiletreefile構(gòu)建的系統(tǒng)構(gòu)建的系統(tǒng)發(fā)育樹,每發(fā)育樹,每個樣本對應(yīng)個樣本對應(yīng)一個系統(tǒng)樹一個系統(tǒng)樹 將treefile更名results3后,雙擊打開CONSENSE.EXE工具把把treefile更名為更名為results3打開打開CONSENSE工具工具 輸入results3 修改O選項,輸入23 默認(rèn)R選項,構(gòu)建無根樹 其他設(shè)置默認(rèn),輸入Y,回車 計算生成outfile和treefile文件輸入輸入O,設(shè)置外類群,設(shè)置外類群,輸入輸入23,表示是第,表示是第23條序列作為外類群條序列作為外類群輸入輸入results3選擇外類群選擇外類群構(gòu)建無根樹構(gòu)建無根樹其他設(shè)置默認(rèn),輸其他設(shè)置默認(rèn),輸入入Y 使用TreeView打開treefileTreeView http:/taxonomy.zoolo

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論