原核生物系統(tǒng)發(fā)生關(guān)系的k串組分距離研究_第1頁
原核生物系統(tǒng)發(fā)生關(guān)系的k串組分距離研究_第2頁
原核生物系統(tǒng)發(fā)生關(guān)系的k串組分距離研究_第3頁
原核生物系統(tǒng)發(fā)生關(guān)系的k串組分距離研究_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

原核生物系統(tǒng)發(fā)生關(guān)系的k串組分距離研究

由于缺乏形態(tài)特征,原核生物系統(tǒng)分類成為微生物的面臨挑戰(zhàn)。20世紀(jì)70年代,w地殼等人通過在核糖體上形成小亞甲基鈉序列(ssurrna)后,他們證實(shí)了系統(tǒng)的關(guān)系,并取得了突破。古細(xì)胞菌和它們支持著生命領(lǐng)域的三個超邊界:老細(xì)胞菌,它們支持著綠色身體和瘦長神的內(nèi)部環(huán)境。這是rrna結(jié)構(gòu)樹研究的主要成就。建立基于surrna的分子系統(tǒng)生成樹是基于斯urna的。在《伯杰系統(tǒng)細(xì)菌學(xué)手冊》(第二版)中,“基于分析不規(guī)則程度序列的系統(tǒng)生成框架是基于斯urrna的非表面特征的?!保▍⒖迹?。然而,近年來對單獨(dú)使用SSUrRNA推斷系統(tǒng)發(fā)生關(guān)系的可靠性產(chǎn)生了質(zhì)疑.這些大約有1500bp的核苷酸序列,不可能提供足夠的系統(tǒng)發(fā)生信息來分辨生命之樹的所有分支,甚至有證據(jù)表明這些保守的RNA也可能存在水平轉(zhuǎn)移.此外,自1995年開始不斷增加的原核生物完全基因組,對分子系統(tǒng)發(fā)生關(guān)系的分析帶來更多的問題.因而現(xiàn)在的一般看法是,不同的基因反映不同的歷史,基因樹不能等同于物種樹.特別是在分子系統(tǒng)發(fā)生學(xué)上,基因橫向傳遞和世系之間保守基因的丟失已經(jīng)成為討論的熱點(diǎn).為了充分利用不斷增加的基因組數(shù)據(jù),最近發(fā)展出許多基于全基因組的方法.介于使用單基因和全基因組兩種極端之間,還提出了基于聯(lián)合蛋白質(zhì)序列的方法.不過,所有這些方法在不同階段或明或暗地需要序列聯(lián)配和打分方案,因此依賴于許多參數(shù)和微調(diào).為了避免序列聯(lián)配和對基因的特殊選擇,我們發(fā)展了一種基于K串的組分距離方法,從完全基因組出發(fā)推斷系統(tǒng)發(fā)生關(guān)系.該方法已被成功地應(yīng)用于原核生物、葉綠體和冠狀病毒的進(jìn)化研究.然而,使用完全基因組數(shù)據(jù)同時也可以視為這種方法的缺點(diǎn).因此,文中我們采用兩組蛋白質(zhì),它們包含的系統(tǒng)發(fā)生信息可能十分不同.核糖體蛋白質(zhì)和rRNA交織成復(fù)合大分子,作為一個整體來行使功能,因此它們不易與別的物種發(fā)生橫向傳遞.用連接核糖體蛋白質(zhì)序列的方法很自然地產(chǎn)生合理的系統(tǒng)發(fā)生關(guān)系.相反,氨酰tRNA合成酶作為獨(dú)立的分子行使功能,在不同物種之間發(fā)生橫向傳遞沒有很大障礙.事實(shí)上,人們已經(jīng)知道它不適合用于系統(tǒng)發(fā)生推斷.如果單獨(dú)使用20種不同的氨酰tRNA合成酶產(chǎn)生20種不同的樹,有一些甚至不能區(qū)分開生命之樹上古細(xì)菌、細(xì)菌和真核生物三個超界[17~19].然而我們的結(jié)果表明收集一個物種所有的氨酰tRNA合成酶可以產(chǎn)生與核糖體蛋白質(zhì)樹和全蛋白質(zhì)組樹相一致的系統(tǒng)發(fā)生樹.本文的目的有三個方面.第一,說明組分距離方法不必要求完全蛋白質(zhì)組數(shù)據(jù),選取一個合適家族的蛋白質(zhì)序列也可行.第二,提供一種新的分子系統(tǒng)發(fā)生分析方法,它獨(dú)立于但支持基于SSUrRNA序列的“標(biāo)準(zhǔn)”方法.第三,代替僅僅使用自舉法或刀切法的穩(wěn)定性和一致性測試,通過與細(xì)菌分類學(xué)結(jié)果的嚴(yán)格比較,驗(yàn)證這種新方法.1trna共聚合成酶鏈的計(jì)算在NCBI數(shù)據(jù)庫中存在兩套原核生物基因組,一套位于Ganbank目錄下,是作者提交的原始序列;另一套經(jīng)NCBI人員重新整理和注釋過,索取號帶有前綴NC_以示區(qū)別.我們使用后一套中所有的原核生物完全基因組,截止日期到2003年6月10日;除去一個物種Pasteurellamultocida,因?yàn)樵谒淖⑨屩袥]有核糖體蛋白質(zhì)和氨酰tRNA合成酶的信息.附錄中給出物種名字、縮寫、NCBI索取號以及在《伯杰手冊》中的位置.我們采用基于K串的組分矢量方法計(jì)算距離矩陣,見文獻(xiàn),因此,下面只給出方法的簡潔概述.第一步,從一個蛋白質(zhì)家族或者完全基因組中收集所有的氨基酸序列.第二步,計(jì)算定長為K的寡肽出現(xiàn)的頻度.為了減弱在分子水平上隨機(jī)中性突變的影響和突出選擇進(jìn)化的后果,用(K-2)階的Markov模型從這些頻度中減除隨機(jī)背景.第三步,將這些規(guī)范處理后的頻度按固定次序排放,為每個物種形成一個20K維的組分矢量.第四步,物種A和B的相關(guān)性C(A,B)由兩者的組分矢量之間的夾角余弦決定.因此,如果兩個矢量相同,則相關(guān)性最高,C=1;如果它們沒有共同的組分,則相關(guān)性C=0,兩個矢量成正交關(guān)系.最后,兩個物種之間的距離可以定義為D=(1-C)/2.一旦獲得了距離矩陣,則采用標(biāo)準(zhǔn)方法,如Phylip軟件包中的鄰接算法來構(gòu)建親緣樹.隨著K值的增加和對蛋白質(zhì)序列再抽樣檢驗(yàn),樹的拓?fù)浣Y(jié)構(gòu)也趨于穩(wěn)定.關(guān)于統(tǒng)計(jì)檢驗(yàn)和方法的更多介紹參看文獻(xiàn)[13,14].2種間競爭:從屬性到結(jié)構(gòu)性圖1為基于核糖體蛋白質(zhì)的親緣樹,基于氨酰tRNA合成酶的親緣樹見圖2.計(jì)算包括所有123個物種,然而由于相同種的不同菌株和同一屬下不同的種總是形成一組,因此在最后的圖中僅僅保留了每個屬下的一個物種作為代表.因此,圖1和2相當(dāng)于屬的進(jìn)化樹.我們的親緣樹描述了121個原核生物,涵蓋了67個屬,55個科,46個目,25個綱和25個原核生物門中的14個門,因而可以與細(xì)菌學(xué)家的分類做一個詳盡且更嚴(yán)格的比較.事實(shí)上,我們要和3種不同而又相關(guān)的樹作比較:SSUrRNA樹,它是一棵合成樹,包含253個物種;RDP-Ⅱ骨干樹8.0版,包括217個序列,代表《伯杰手冊》(第2版)的203個科中的187個;最后是《伯杰手冊》本身,它主要基于SSUrRNA模型,但是也考慮了傳統(tǒng)的分類.一般來說,基于核糖體蛋白質(zhì)的親緣樹和SSUrRNA樹的一致性較高,而基于氨酰tRNA合成酶的親緣樹與SSUrRNA樹的一致性較低[17~19].然而,后者在本文結(jié)果中的表現(xiàn)遠(yuǎn)好于基于單個氨酰tRNA合成酶的樹.特別是,兩組進(jìn)化樹都劃分出生命領(lǐng)域的三大超界,這是它們一致的顯著特征.由于屬到科、到目的分支基本上與SSUrRNA樹一致,因此我們集中討論在不同分類水平上的差異,尤其是可能對分類提出修正的顯著差異.種間的詳細(xì)位置關(guān)系在屬樹上看不到.RDP-Ⅱ骨干樹和我們的進(jìn)化樹(圖1和2)都是如此,但是有兩個細(xì)節(jié)反映在我們的更詳細(xì)的物種樹上.第一,解脲支原體Urepa插入到另一個支原體屬M(fèi)ycoplasma中,在SSUrRNA樹中也存在同樣的現(xiàn)象.第二,志賀氏痢疾桿菌Shifl插入到大腸桿菌屬Escherichia中.后者尚有待于新的SSUrRNA樹的驗(yàn)證.在高層分類水平上,SSUrRNA樹中變形菌Proteobacteria的Beta綱插在Gamma綱中,這同樣反映在本文和文獻(xiàn)的親緣樹上.進(jìn)一步觀察會發(fā)現(xiàn)Gamma綱被Beta綱隔開的兩個屬(Buchnera和Wigglesworthia)擁有較小的基因組,后者在氨酰tRNA合成酶樹(圖2)上遠(yuǎn)離主要的Proteobacteria門.在所有這些樹中具有較小基因組的物種,形成處于更深層次的亞組.小基因組自然應(yīng)該進(jìn)化更早,這可能是真實(shí)進(jìn)化史的表現(xiàn).總之,基因組大小所帶來的影響不易清楚地表現(xiàn)在過去基于單基因的進(jìn)化樹上.所有3個螺旋菌(Spirochetes,Burbu,Trepa和Lepin),雖然在圖1和《伯杰手冊》中都被歸為一組,但是在圖2和蛋白質(zhì)組樹上,Lepin卻遠(yuǎn)離螺旋菌門.Lepin的基因組比另外兩個大很多,不過,我們?nèi)匀徊荒軘喽ㄟ@是否由基因組大小的顯著差異所造成.古細(xì)菌Methanopyruskandleri(Metka)曾在SSUrRNA進(jìn)化樹分析中,被預(yù)測遠(yuǎn)離其他的產(chǎn)甲烷古細(xì)菌.但在圖1和2中它均和那些產(chǎn)甲烷菌形成一個分支;在它的基因組報告中,基因成分和基因?qū)Φ姆治鼋Y(jié)果也表明如此.另外,Crenarchaeota門所含的3個屬:Pyrae,Aerpe和Sulso總是處于一個分支.但是Euryarchaeota門所含的Halsp和Theac所處位置不穩(wěn)定,有時在別的樹上也觀察到類似行為.以O(shè)ceih為代表的新屬Oceanobacillus,曾是惟一一個跨門的差別.在圖1和2與K=5,K=6的蛋白質(zhì)組樹上,它位于B13門(Firmicutes),與Bacillus屬(Bergey’s代碼為B13.3.1.1)的位置較近.這同NCBI分類一致,但是在2002年《伯杰手冊概要》中卻將它分入Gammaproteobacteria(B12.3.8.1.6),同時帶著這樣一個腳注:“Oceanospirillales在ARB樹上的位置不明確”.然而,2003年發(fā)表的《伯杰手冊概要》將Oceih移動到B13.3.1.1.12,相應(yīng)地,附錄表2中Oceih也已調(diào)整到它的正確位置.我們將簡要地提一下高層分支問題.高層分支的劃分和定位遠(yuǎn)非原核生物而是一般分類上的常見爭論問題.在諸如《伯杰手冊》的分類系統(tǒng)中,許多門并列于古細(xì)菌和細(xì)菌超界之下.將文獻(xiàn)和本文的進(jìn)化樹與SSUrRNA樹,RDP-Ⅱ骨干樹,與別的全基因組方法獲得的進(jìn)化樹相比較,能夠識別出一批這些進(jìn)化樹在高層分支上的共同特征,因而它們不像是偶然的假象.(ⅰ)兩個門Aquificae(B1)和Thermotogae(B2)總是緊密相連,形成一個分支,然后再加入進(jìn)化樹的主干.(ⅱ)Chlorobi(B11)和Bacteroides(B20)門先聚成一個分支,在文獻(xiàn)和中也是如此.(ⅲ)Chlamydiae(B16)門和Spirochaetes(B17)門連接到進(jìn)化樹的分支點(diǎn)總是相距很近(除了一些進(jìn)化樹上Lepin遠(yuǎn)離B17的例外).(ⅳ)Deinococcus-Thermus(B4)和Actinobacteria(B14)在許多進(jìn)化樹上出現(xiàn)在一起.(ⅴ)Mycoplasma屬獨(dú)立于Firmicutes(B13)門,形成單獨(dú)的分支,在許多全基因組樹包括我們的進(jìn)化樹上,這都是一個顯著特征.然而,應(yīng)該注意到目前14個門中有6個門僅有一個代表物種,以后有廣闊分類背景的基因組數(shù)據(jù)時,高層分支的關(guān)系將進(jìn)一步得到驗(yàn)證.組分距離方法作為一種新的推斷系統(tǒng)發(fā)生關(guān)系的方法,無需序列聯(lián)配和參數(shù)調(diào)節(jié),它和傳統(tǒng)的SSUrRNA分析一起應(yīng)能給出原核生物分類的統(tǒng)一的分子基礎(chǔ).附錄:我們的工作中使用了16個古細(xì)菌、105個細(xì)菌和2個真核生物的數(shù)據(jù),所有物種的名字、縮寫和索取號列于下面的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論