




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
生物信息學(xué)課件
郜剛
EST對(duì)應(yīng)基因產(chǎn)物的系統(tǒng)分析—COG分析觀點(diǎn)祖先序列在漫長(zhǎng)的進(jìn)化過(guò)程中,可能產(chǎn)生直系同源和旁系同源兩類蛋白質(zhì)。直系同源:簡(jiǎn)而言之,由不同物種的垂直家系進(jìn)化而來(lái)的蛋白質(zhì),具有祖先蛋白質(zhì)類似的功能旁系同源:從相關(guān)物種基因組中復(fù)制的蛋白質(zhì),可能會(huì)產(chǎn)生新的功能種系發(fā)生學(xué)中的同源(Homology)
傳統(tǒng)的種系發(fā)生學(xué)是研究生物的形態(tài)結(jié)構(gòu)為主的,所以認(rèn)為如果兩個(gè)或多個(gè)結(jié)構(gòu)具有相同的祖先,則稱它們同源(Homology)。這里相同的祖先既可以指進(jìn)化論意義上的祖先,即兩個(gè)結(jié)構(gòu)由一個(gè)共同的祖先進(jìn)化而來(lái)(翅膀與手臂是同源的),強(qiáng)調(diào)了結(jié)構(gòu)的相似性,不強(qiáng)調(diào)功能的相似性也可以指發(fā)育意義上的祖先,即兩個(gè)結(jié)構(gòu)由胚胎時(shí)期的同一組織發(fā)育而來(lái)(乳房與睪丸同源)。人類鳥(niǎo)類蛙類蜥蜴蝙蝠貓科鯨類肱骨橈骨腕骨尺骨脊椎動(dòng)物除了魚(yú)類之外,是兩棲類、爬蟲(chóng)類、哺乳類及鳥(niǎo)類在演化是具有系統(tǒng)性的,其同源器官(homologousorgans)即使功能不同但在結(jié)構(gòu)上仍保有原本的原始架構(gòu)。其外觀上的差異仍是建立于原始架構(gòu)之上。進(jìn)化上強(qiáng)調(diào)了結(jié)構(gòu)的相似性種系發(fā)生學(xué),進(jìn)化,強(qiáng)調(diào)結(jié)構(gòu)的相似性,不強(qiáng)調(diào)功能的相似性同源這一概念需與相似區(qū)分開(kāi)來(lái)。比如說(shuō),昆蟲(chóng)的翅膀、蝙蝠的翅膀和鳥(niǎo)類的翅膀是功能相似的,但卻不同源,這種現(xiàn)象被稱為非同源相似(或同形質(zhì),英文:Homoplasy)。這些相似的結(jié)構(gòu)由不同的渠道演化而來(lái),這種演化過(guò)程叫做趨同演化。遺傳學(xué)中的同源
在經(jīng)典遺傳學(xué)中,同源這一概念既不強(qiáng)調(diào)結(jié)構(gòu)相似性,也不強(qiáng)調(diào)功能相似性,只是強(qiáng)調(diào)親子關(guān)系的有無(wú)或者親緣關(guān)系的遠(yuǎn)近。比如同源染色體,異卵雙生、同卵雙生的雙胞胎等。只有當(dāng)遺傳學(xué)中涉及到DNA水平的序列時(shí),才逐漸強(qiáng)調(diào)了DNA結(jié)構(gòu)的相似性。生物信息學(xué)中的同源生物信息學(xué)中,尤其是比較基因組學(xué)中,涉及到蛋白質(zhì)和DNA的同源性時(shí),常常通過(guò)它們序列結(jié)構(gòu)的相似性來(lái)判定,并且強(qiáng)調(diào)結(jié)構(gòu)相似、功能相似、進(jìn)化上來(lái)源的祖先的相似??紤]的比較多,比較麻煩,homolog因此就有了Ortholog和Paralog之分。所以我們要澄清的有幾個(gè)方面:相似性(similarity)和同源性(homology)是兩個(gè)完全不同的概念數(shù)據(jù)庫(kù)搜索的基礎(chǔ)是序列的相似性比對(duì),而尋找同源序列則是數(shù)據(jù)庫(kù)搜索的主要目的之一。我們經(jīng)常用相似性描述同源性,但是,相似性(similarity)和同源性(homology)是兩個(gè)完全不同的概念。同源與相似的區(qū)別相似性是指序列比對(duì)過(guò)程中用來(lái)描述序列之間相同DNA堿基或氨基酸殘基順序所占比例的高低。相似性不要求與進(jìn)化起源是否同一,不要求與親緣關(guān)系的遠(yuǎn)近,不要求與結(jié)構(gòu)、功能有什么聯(lián)系。而同源就恰好相反,它要強(qiáng)調(diào)這些。同源或者同源序列,是指從某一共同祖先經(jīng)趨異進(jìn)化而形成的不同序列。同源性可以用來(lái)描述染色體—“同源染色體”、基因—“同源基因”和基因組的一個(gè)片斷—“同源片斷”同源與相似的聯(lián)系同源性是要用相似性來(lái)描述的。當(dāng)相似程度高于50%時(shí),比較容易推測(cè)檢測(cè)序列和目標(biāo)序列可能是同源序列;而當(dāng)相似性程度低于20%時(shí),就難以確定或者根本無(wú)法確定其是否具有同源性。但是類似于“具有xx%同源性”,或“這些序列高度同源”等說(shuō)法,都是不確切的,應(yīng)該避免使用。要么同源,要么不同源,沒(méi)有高度低度之分。生物信息學(xué)中的同源有兩類Ortholog
Homolog
Paralog同源直系同源旁系同源垂直方向的水平方向的Orthology通常譯作直系同源、直向同源、垂直同源;Paralogy通常譯作旁系同源、并系同源、橫向同源。直系同源(orthology)是比較基因組學(xué)中最重要的定義。直系同源的定義是:在進(jìn)化上,同一個(gè)始祖基因垂直傳遞(verticaldescent)的到兩種或兩種以上物種的基因組,結(jié)構(gòu)上高度相似,功能上高度保守乃至相同,甚至在近緣物種可以相互替換;而且在發(fā)育上具有組織特異性與亞細(xì)胞分布相似。旁系同源(paralogy)是指同一基因組(或同系物種的基因組)中,由于某個(gè)始祖基因的加倍(復(fù)制)而橫向(horizontal)產(chǎn)生的幾個(gè)同源基因。有平行的意思直系同源旁系同源直系同源同源直系與旁系的最大的共同點(diǎn)是同源,都源于各自的始祖基因。其區(qū)別在于:在進(jìn)化起源上,直系同源是強(qiáng)調(diào)在不同基因組中的垂直傳遞,旁系同源則是在同一基因組中的橫向加倍;在功能上,直系同源要求功能高度相似,而旁系同源在定義上對(duì)功能上沒(méi)有嚴(yán)格要求,可能相似,但也可能并不相似(盡管結(jié)構(gòu)上具一定程度的相似),甚至于沒(méi)有功能(如基因家族中的假基因)。旁系同源的功能變異可能是橫向加倍后的重排變異或進(jìn)化上獲得了另一功能,其功能相似也許只是機(jī)械式的相關(guān)(mechanisticallyrelated),或非直系同源基因取代新產(chǎn)生的非親緣或遠(yuǎn)緣蛋白在不同物種具有相似的功能。9、鑒定直系同源的實(shí)際操作標(biāo)準(zhǔn)(practicalcriteria)如基因組Ⅰ中的A基因與基因組Ⅱ中的A‘基因被認(rèn)為是直系同源,則要求:(1)A‘的產(chǎn)物比任何在基因組Ⅱ中所發(fā)現(xiàn)的其它基因產(chǎn)物都更相似于A產(chǎn)物;(2)A‘與A的相似程度比在任何一個(gè)親緣關(guān)系較遠(yuǎn)的基因組中的任一基因都要高;(3)A編碼的蛋白與A‘編碼的蛋白要從頭到尾都能并排比較,即含有相似以至于相同的模序(motif)關(guān)于“同源”的解釋earlyglobingeneA-chaingene B-chaingenefrogAchickAmouseAmouse
BchickBfrogBparalogsorthologsorthologsgeneduplicationhomologsIntroductiontoCOGsGeneralTopicsWhatareCOGs?HowareCOGscreated?WherecanIgetmoreinformation?UsingCOGsWhatkindofinformationcanbeobtainedusingtheCOGdatabase?HowdoIfindaparticularproteinintheCOGdatabase?SelectingCOGsHowcanaparticularsetofCOGsbeselected?AretherewaystocombinecriteriatoselectasubsetofCOGs?COGnamesWhatshouldIknowaboutCOGnames?WhatdothevariousabbreviationsinCOGnamesstandfor?ProteinnamesWhatshouldIknowaboutproteinnames?Whatisthesignificanceofanunderscoreandanumberappendedtoaproteinname?Howweregenesnamedwithrespecttothespeciesoforigin?Terminology/GlossaryWhatterminologywillIneedtoknowtousethesepageseffectively?什么是COG?
“COG”是ClusterofOrthologousGroupsofproteins(蛋白相鄰類的聚簇,蛋白質(zhì)直系同源簇)的縮寫(xiě)。COG蛋白質(zhì)直系同源簇(COGs)數(shù)據(jù)庫(kù)是對(duì)細(xì)菌、藻類和真核生物的66個(gè)(截止到2009年9月9日)完整基因組的編碼蛋白,根據(jù)系統(tǒng)進(jìn)化關(guān)系分類構(gòu)建而成。COG庫(kù)對(duì)于預(yù)測(cè)單個(gè)蛋白質(zhì)的功能和整個(gè)新基因組中蛋白質(zhì)的功能都很有用。利用COGNITOR程序,可以把某個(gè)蛋白質(zhì)與所有COGs中的蛋白質(zhì)進(jìn)行比對(duì),并把它歸入適當(dāng)?shù)腃OG簇。COG庫(kù)提供了對(duì)COG分類數(shù)據(jù)的檢索和查詢,基于Web的COGNITOR服務(wù),系統(tǒng)進(jìn)化模式的查詢服務(wù)等。COGClustersofOrthologousGroupsofproteins(COGs)weredelineatedbycomparingproteinsequencesencodedincompletegenomes,representingmajorphylogeneticlineages.EachCOGconsistsofindividualproteinsorgroupsofparalogsfromatleast3lineagesandthuscorrespondstoanancientconserveddomain.實(shí)質(zhì)
Phylogeneticclassificationofproteinsencodedincompletegenomes緣起/COG
大范圍重視是從NCBI建立蛋白質(zhì)直系同源簇?cái)?shù)據(jù)庫(kù)的時(shí)候。最初,蛋白質(zhì)直系同源簇(COGs)數(shù)據(jù)庫(kù)是對(duì)細(xì)菌、藻類和真核生物的21個(gè)完整基因組的編碼蛋白,根據(jù)系統(tǒng)進(jìn)化關(guān)系分類構(gòu)建而成。COG數(shù)據(jù)
構(gòu)成每個(gè)COG的蛋白都是被假定為來(lái)自于一個(gè)祖先蛋白,并且因此或者是orthologs或者是paralogs。Orthologs是指來(lái)自于不同物種的由垂直家系(物種形成)進(jìn)化而來(lái)的蛋白,并且典型的保留與原始蛋白有相同的功能。Paralogs是那些在一定物種中的來(lái)源于基因復(fù)制的蛋白,可能會(huì)進(jìn)化出新的與原來(lái)有關(guān)的功能。請(qǐng)參考文獻(xiàn)獲得更多的信息。都是homeologCOG的建立及特點(diǎn)?建立:COG是通過(guò)把所有完整測(cè)序的基因組的編碼蛋白一個(gè)一個(gè)的互相比較確定的。因此需要用完整的基因組來(lái)定義COG,這正是它的限制性特點(diǎn):在考慮來(lái)自某一個(gè)特定基因組的某一個(gè)特定蛋白時(shí),COG通過(guò)同源比較,就能夠找到其他基因組中與之最相似的蛋白每一個(gè)COG必須包含來(lái)自于3個(gè)種系發(fā)生上有關(guān)系的基因組的同一個(gè)蛋白。因此,完全測(cè)序的全基因組的物種越多,COG才越有價(jià)值瀏覽NCBI-COG網(wǎng)站基本上是原核生物的真核生物的原核生物的COG真核生物的COGClustersoforthologousgroupsforeukaryoticcompletegenomes擬南芥ath線蟲(chóng)cel果蠅dme人hsa面包酵母sce裂殖酵母spo微孢子蟲(chóng)ecu視網(wǎng)膜母細(xì)胞瘤蛋白LIN-9/chromatin-associated染色質(zhì)相關(guān)通路蛋白EST對(duì)應(yīng)蛋白質(zhì)產(chǎn)物的COG分析登錄COG網(wǎng)站/COG/選擇初始版本initialversion(在這里可以把EST對(duì)應(yīng)的蛋白質(zhì)進(jìn)行COG蛋白同源簇分析)在COGnitor中輸入EST所對(duì)應(yīng)的基因產(chǎn)物的氨基酸序列在COGnitor中輸入氨基酸序列,然后點(diǎn)擊comparetoCOGsSaccharomycescerevisiae
Alcoholdehydrogenasemssvtgfyippisffgegaleetadyiknkdykkalivtdpgiaaiglsgrvqkmleerdlnvaiydktqpnpnianvtaglkvlkeqnseivvsigggsahdnakaiallatnggeigdyegvnqskkaalplfainttagtasemtrftiisneekkikmaiidnn
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年勞動(dòng)合同范文官方
- 2025年藥師受聘合同樣本
- 外籍員工保密協(xié)議合同
- 苗木種植基地采購(gòu)合同范例
- 2025年企業(yè)勞動(dòng)合同延續(xù)辦法
- 2025年充電樁場(chǎng)地租賃合同官方版模板
- 2025年創(chuàng)新建筑策劃合作協(xié)議書(shū)示范文本
- 建筑工程鋼筋采購(gòu)合同模板
- 2025年養(yǎng)雞場(chǎng)飼養(yǎng)工作服務(wù)合同范本
- 家庭不動(dòng)產(chǎn)贈(zèng)與合同模板
- 新產(chǎn)品開(kāi)發(fā)(toshiba案例分析組)
- 4.1.1 有理數(shù)指數(shù)冪-參考課件
- 人教版六年級(jí)數(shù)學(xué)下冊(cè)全冊(cè)大單元教學(xué)任務(wù)單
- JJF(新) 112-2023 微量殘?zhí)繙y(cè)定儀校準(zhǔn)規(guī)范
- 2024銷售人員年終工作總結(jié)2篇
- 2024年牛排行業(yè)分析報(bào)告及未來(lái)發(fā)展趨勢(shì)
- 食品投訴處理培訓(xùn)課件
- 血液科品管圈PDCA案例合集
- 創(chuàng)傷患者護(hù)理和評(píng)估
- 【全套】醫(yī)院智能化系統(tǒng)報(bào)價(jià)清單
- 北師大版五年級(jí)數(shù)學(xué)上冊(cè)典型例題系列之期中專項(xiàng)練習(xí):分段計(jì)費(fèi)問(wèn)題(解析版)
評(píng)論
0/150
提交評(píng)論