系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用_第1頁
系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用_第2頁
系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用_第3頁
系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用_第4頁
系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用_第5頁
已閱讀5頁,還剩30頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用什么是系統(tǒng)進(jìn)化樹系統(tǒng)進(jìn)化樹又稱為演化樹,是表明被認(rèn)為具有共同祖先的各物種間演化關(guān)系的樹.在樹中每個節(jié)點代表其各個分支的最近共同祖先,而節(jié)點的線段長度對應(yīng)了其演化的距離。()系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用直系同源和旁系同源直系同源:同源的基因是由共同的祖先基因進(jìn)化而產(chǎn)生的。 旁系同源:同源的基因是由于基因復(fù)制產(chǎn)生的。這也就告訴我們用于分子進(jìn)化分析中的序列必須是直系同源的才可以真實的反映其進(jìn)化的過程。系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用系統(tǒng)進(jìn)化樹的分類根據(jù)樹是否有根,進(jìn)化樹可以分為有根樹和無根樹兩類。系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用有根樹和無根樹

2、的進(jìn)化層面上的意義有根樹反應(yīng)了樹上物種或者基因進(jìn)化的時間順序,通過分析有根樹的長度,可以了解不同的物種或者基因以什么方式和速率進(jìn)化。無根樹只反映分類單元之間的距離,而不涉及誰是誰的祖先問題做有根樹需要指定outgroup。所謂out group , 就是你所分析的東西之外的一個group。比如你分析人類的不同人種,就選個chimpanzee,你要分析哺乳動物,就選個鱷魚烏龜之類,總之保證它在 你要分析的group之外,但又不太遠(yuǎn)就行了。將你選定的東西指定為outgroup,做出來的樹就是有根樹。out group可以不只一個,它是一個group。系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用系統(tǒng)進(jìn)化樹的結(jié)構(gòu)n

3、odenodebranchbranch進(jìn)化樹的結(jié)構(gòu)主要分為三部分: 樹葉 樹枝 節(jié)點其中我們把從同一個節(jié)點上分出的兩個分支叫做sister group.Sister group 從結(jié)構(gòu)上可以理解為從進(jìn)化史上看兩者非常接近,其次兩者擁有唯一的共同的祖先。系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用系統(tǒng)進(jìn)化樹的結(jié)構(gòu)cdbadcbadbca從結(jié)構(gòu)上看,我們認(rèn)為這三個樹是等價的系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用構(gòu)建系統(tǒng)進(jìn)化樹的理論方法最大簡約法(maximum parsimony,MP)最早源于形態(tài)性狀研究,現(xiàn)在已經(jīng)推廣到分子序列的進(jìn)化分析中。最大簡約法的理論基礎(chǔ)是奧卡姆哲學(xué)原則,這個原則認(rèn)為:解釋一個過程的最好理論是

4、所需假設(shè)數(shù)目最少的那一個。對所有可能的拓?fù)浣Y(jié)構(gòu)進(jìn)行計算,并計算出所需替代數(shù)最小的那個拓?fù)浣Y(jié)構(gòu),作為最優(yōu)樹。優(yōu)點:最大簡約法對于分析某些特殊的分子數(shù)據(jù)如插入、缺失等序列有用。在分析的序列位點上沒有回復(fù)突變或平行突變,且被檢驗的序列位點數(shù)很大的時候,最大簡約法能夠推導(dǎo)獲得一個很好的進(jìn)化樹。缺點:在分析序列上存在較多 的回復(fù)突變或平行突變,而被檢驗的序列位點數(shù)又比較少的時候,最大簡約法可能會給出一個不合理的或者錯誤的進(jìn)化樹推導(dǎo)結(jié)果。系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用構(gòu)建系統(tǒng)進(jìn)化樹的理論方法最大似然法(maximum likelihood,ML)最早應(yīng)用于系統(tǒng)發(fā)育分析是在對基因頻率數(shù)據(jù)的分析上,后來基于分

5、子序列的分析中也已經(jīng)引入了最大似然法的分析方法。當(dāng)樣本量很大的時候,似然法可以獲得參數(shù)統(tǒng)計的最小方差。最大似然法分析中,選取一個特定的替代模型來分析給定的一組序列數(shù)據(jù),使得獲得的每一個拓?fù)浣Y(jié)構(gòu)的似然率都為最大值,然后再挑出其中似然率最大的拓?fù)浣Y(jié)構(gòu) 作為最優(yōu)樹。最大似然進(jìn)化模型簡單假設(shè)所有核苷酸(或者氨基酸)之間相互轉(zhuǎn)變的概率是一樣的程序會把所有可能的核苷酸輪流置于進(jìn)化樹的內(nèi)部節(jié)點上,并且計算每個這樣的序列產(chǎn)生實際數(shù)據(jù)的可能性。所有可能再現(xiàn)的幾率被加總,產(chǎn)生一個特定點的似然值,然后這個數(shù)據(jù)集的所有比對位點的似然值的加和就是整個進(jìn)化樹的似然值。 系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用構(gòu)建系統(tǒng)進(jìn)化樹的理論方

6、法 鄰近法(Neighbor-Joining Method,NJ )該方法通過確定距離最近(或相鄰)的成對分類單位來使系統(tǒng)樹的總距離達(dá)到最小。相鄰是指兩個分類單位在某一無根分叉樹中僅通過一個節(jié)點(node)相連。通過循序地將相鄰點合并成新的點,就可以建立一個相應(yīng)的拓?fù)錁洹O到y(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用構(gòu)建系統(tǒng)進(jìn)化樹的所涉及的工具PHYLIPMEGARMatlabBioEditTreeViewPHYMLClustalX系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用構(gòu)建系統(tǒng)進(jìn)化樹的所涉及的工具PHYLIP由美國華盛頓大學(xué)Felsenstein開發(fā),可以免費下載,適用于絕大多數(shù)操作系統(tǒng)PAUP由美國simthson

7、ion institute開發(fā),僅適用于Apple-Macintosh和UNIX操作系統(tǒng)MEGA美國賓夕法尼亞州立大學(xué)MasatoshiNei開發(fā)的分子進(jìn)化遺傳學(xué)軟件,圖形化,集成的進(jìn)行分析工具,不包括MLMOLPHY日本國立統(tǒng)計數(shù)理研究所開發(fā),最大似然法構(gòu)樹PAML英國University college London開發(fā),最大似然法構(gòu)樹和分子進(jìn)化模型系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用構(gòu)建系統(tǒng)進(jìn)化樹的所涉及的工具PUZZLE應(yīng)用quarter puzzling方法(一種最大簡約法)構(gòu)建系統(tǒng)樹TreeView英國University of Glasgow開發(fā),進(jìn)化樹顯示工具Phylogeny歐洲生

8、物信息研究所(EBI)的系統(tǒng)發(fā)育分析軟件PHYML快速的建樹工具M(jìn)rBayes基于貝葉斯方法的建樹工具M(jìn)AC5基于貝葉斯方法的建樹工具系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用構(gòu)建樹,可以用PHYLIP或者M(jìn)EGA構(gòu)建MP樹,可以使用PHYLIP或者M(jìn)EGA構(gòu)建ML樹可以使用PHYML,速度快,同時構(gòu)建ML樹還可以用PHYLIP,或者可以使用BioEdit貝葉斯的算法以MrBayes為代表,不過速度比較慢關(guān)于系統(tǒng)發(fā)育分析的更多知識請參閱:系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用構(gòu)建系統(tǒng)進(jìn)化樹的主要步驟大體來說構(gòu)建系統(tǒng)進(jìn)化樹的步驟有三步:序列比對 (ClustalX2)系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用構(gòu)建系統(tǒng)進(jìn)化樹的主

9、要步驟2. 掐頭去尾 選取所需序列 轉(zhuǎn)換格式(BioEdit or ClustalX2) ExampleExample:3. 利用相關(guān)軟件繪制系統(tǒng)進(jìn)化樹(BioEdit,MEGA) 系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用實例講解下面的內(nèi)容將教大家如何來構(gòu)建自己的系統(tǒng)進(jìn)化樹。首先我們需要弄清楚一個很重要的問題,什么是Fasta 格式? 在生物信息學(xué)中,F(xiàn)ASTA格式(又稱為Pearson格式),是一種基于文本用于表示核苷酸序列或氨基酸序列的格式。在這種格式中堿基對或氨基酸用單個字母來編碼,且允許在序列前添加序列名及注釋。序列文件的第一行是由大于號“”或分號“;”打頭的任意文字說明(習(xí)慣常用“”作為起始)

10、,用于序列標(biāo)記。從第二行開始為序列本身,只允許使用既定的核苷酸或氨基酸編碼符號。系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用 構(gòu)建我們自己的Fasta 文件很多情況下,F(xiàn)asta文件是直接可以從數(shù)據(jù)庫中下載得到的,但是根據(jù)實際要求的不同,有時候我們需要自己構(gòu)建Fasta文件,如果您已近有了想用來構(gòu)建進(jìn)化樹的序列,您可以如右圖所示構(gòu)建自己的文件,文件的保存格式是: 文件名.txt系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用實例講解下面我們以禽流感病毒為例,構(gòu)建系統(tǒng)進(jìn)化樹。首先我們要下載我們所需的序列。系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用實例講解請在Define search set: 中選擇我們想要的禽流感病毒的Type, Ho

11、st, Country/Region, Subtype.這里我們選在了A型禽流感病毒,當(dāng)然在這次練習(xí)中您喜歡的任意類型。系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用實例講解請在Define search set: 中選擇我們想要的禽流感病毒的Type, Host, Country/Region, Subtype.這里我們選在了A型禽流感病毒,當(dāng)然在這次練習(xí)中您喜歡的任意類型。當(dāng)您確定之后請點擊 Show resultsShow results系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用實例講解 當(dāng)您點擊完 Show results 之后你要做的就是選在我們所需的序列了系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用實例講解 因為禽流感病毒

12、不像別的很多別的病毒只有核苷酸序列,它擁有八個或者七個Negative -sense RNA。系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用實例講解這里我們只要選中其中一種就可以了,比如說,我們可以選擇個樣本來構(gòu)建系統(tǒng)進(jìn)化樹。樣本選 擇 完 之 后 請 點 擊Download, 文件類型選擇Nucleotide (Fasta),并把文件保存在計算機(jī) 您 熟 悉 的 地 方 。(當(dāng)然根據(jù)需求的不同您也可以選在蛋白序列)系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用實例講解 文件下載完之后,下載的Fasta 文件直接用 ClustalX 2.0.12打開系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用實例講解 在進(jìn)行多序列比對之前我們需要對軟件進(jìn)

13、行一些設(shè)置1.選擇Alignment標(biāo)簽2.選擇Output format options請將Clustalw sequences numbers選項設(shè)置為 On之后點擊 Ok ,在返回主界面之后請點擊Alignment 標(biāo)簽選擇 Do Complete Alignment選項選擇保存路徑之后點擊ok,剩下的時間可以去喝點咖啡休息一下。系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用實例講解從圖中我們可以發(fā)現(xiàn)起始序列最短的是從位置22開始的,而尾端序列最短的是在位置1738,通過設(shè)置我們可以保存這樣一批已經(jīng)經(jīng)過掐頭去尾后的序列,保存格式為:文件名.aln。當(dāng)然我們也可以直接保存為Fasta format, 如果

14、選擇前者我們需要用BioEdit轉(zhuǎn)換格式,如果是后者我們可以直接進(jìn)入建樹階段。點 擊 主 界 面中的 File標(biāo)簽選擇 Save as選 項 , 并 按照 例 子 設(shè) 置參數(shù)系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用實例講解 經(jīng)過ClustalX2掐頭去尾后的序列可以用BioEdit軟件打開,選擇FileSave as保存類型為:文件名.fasta. 當(dāng)我們查詢結(jié)果的時候可以發(fā)現(xiàn)這和用ClustalX2保存的fasta文件是一致的。系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用實例講解 下一步我們將介紹如何用MEGA構(gòu)建我們的進(jìn)化樹,首先請大家用MEGA軟件將我們之前保留的Fasta文件打開。系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)

15、用實例講解 下一步我們將介紹如何用MEGA構(gòu)建我們的進(jìn)化樹,首先請大家用MEGA軟件將我們之前保留的Fasta文件打開這時候會有兩個窗口,選擇File標(biāo)簽-Convert to Mega.系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用實例講解選擇File標(biāo)簽-Convert to Mega.當(dāng)給出相應(yīng)的文件路徑之后點擊ok ,然后制定輸出文件格式:文件名.meg系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用實例講解雙擊剛才保存的meg文件.選擇數(shù)據(jù)類型,在本次測試中我們用的是核苷酸序列,對于右邊的參數(shù)信息請點擊help按鈕。更具實際的情況我們這里選擇No選項系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用實例講解下一步進(jìn)入建樹的最后階段在Pl

16、ylogeny中選擇建樹方法,這里我們選擇NJ法。參數(shù)設(shè)置好之后點擊compute.蛋白質(zhì)序列一般選擇Poisson Correction(泊松校正),對于核苷酸序列一般采用Kimura-2模型系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用實例講解根據(jù)Mega的計算最終我們得到了序列中的進(jìn)化關(guān)系。Mega軟件還可以自動提供一份簡要的分析報告,你只需要點擊Caption按鈕報告便可以自動生成。如果Bootstrap Value 70我們認(rèn)為這個分支是可靠的 系統(tǒng)進(jìn)化樹的構(gòu)建方法與軟件應(yīng)用進(jìn)化樹評估優(yōu)化方法簡介:常用的兩種方法就是Bootstrap和Jackknife。 所謂Bootstraping法 就是從整個序列的堿基(氨基酸)中任意選取一半,剩下的一半序列隨機(jī)補(bǔ)齊組成一個新的序列。這樣,一個序列就可以變成了許多序列,一個多序列組也就可以變 成許多個多序列組。根據(jù)某種算法(最大簡約性法、最

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論