比較基因組學(xué)原理及應(yīng)用_第1頁
比較基因組學(xué)原理及應(yīng)用_第2頁
比較基因組學(xué)原理及應(yīng)用_第3頁
比較基因組學(xué)原理及應(yīng)用_第4頁
比較基因組學(xué)原理及應(yīng)用_第5頁
已閱讀5頁,還剩85頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

沒火譬比

學(xué)

應(yīng)

用成員:韓柳閻

偉黃繼

馬壽光

朱琳

南李春麗十

宰波火譬比較基因組學(xué)相

關(guān)

念韓柳十基因組(genome)泛指一個(gè)有生命體、病毒或細(xì)胞器的全部

遺傳物質(zhì);在真核生物,基因組是指一套染色

(

)

DNA?;蚪M學(xué)(genomics)就是發(fā)展和應(yīng)用DNA

制圖、測序新技術(shù)以

及計(jì)算機(jī)程序,分析生命體(包括人類)全部基

因組結(jié)構(gòu)及功能。基

學(xué)

疇十亞

領(lǐng)

域內(nèi)

容結(jié)構(gòu)基因組學(xué)整個(gè)基因組的遺傳制圖、物理制圖及DNA測序。功能基因組學(xué)認(rèn)識、分析整個(gè)基因組所包含的基因、非基因序列及其功能。比較基因組學(xué)比較不同物種的整個(gè)基因組,增強(qiáng)對各個(gè)基因組功能及發(fā)育相關(guān)性的認(rèn)識?;蚪M學(xué)概念十

基因組學(xué)

念·

定義:

比較基因組學(xué)(Comparative

Genomics)是

基于基因

組圖

礎(chǔ)上,

對已知的

基因

基因組結(jié)

構(gòu)

進(jìn)

行比較,

來了

基因的功能、表達(dá)

機(jī)

進(jìn)

化的

學(xué)

。·

研究內(nèi)容:

種間的比較基因組學(xué)和種內(nèi)的比較

因組學(xué)十全長cDNA預(yù)測序15%,工作草圖90%,全長100%第22號染色體

第21號染色體ESTs微星遺傳圖物理圖轉(zhuǎn)錄圖序列圖遺傳圖物理圖轉(zhuǎn)錄圖序列圖全長cDNA預(yù)測序SNPs細(xì)菌基因組H.m線蟲果蠅擬南芥小

人類其它基因組39個(gè)物種大腸桿菌釀酒酵母微星SNPsESTs1、

過比較

功能的

。2、

在數(shù)據(jù)庫中有相匹配的蛋白,但不知道其

功能

。3、在現(xiàn)有的數(shù)據(jù)庫中找不到任何相匹配的蛋

白質(zhì)序列的新基因。十2、BLAST3、CLUSTAL基

:工

:概念1、FASTAW物種完成年份總長度/Mp已完成總長的百分?jǐn)?shù)/%占常染色質(zhì)百分?jǐn)?shù)/Mb基因數(shù)/Mb酵母19961293100483線蟲19989699100197果蠅20001166497117擬南芥200011592100221人類第21染色體200034751007人類第22染色體199934709716人類全基因組(Public

Sequence)20012693849012人類全基因組(Celera

Sequence)200126548399-9315基本完成DNA序列分析的真核生物基因組比較V28

V29-1O

10

20(B)

酵母GLKI

SRO9

HiS4FUSIO

IO20(C)玉米O

1O

20(D)

菌thrB

IS186

ISlthrA

thrC

dnaKO

10

20KEY外

顯子

假基因TRY430AGPI

C3.0Adhl-F30CarB30重

復(fù)序

列部分真核、原核生物基因組成成份分析(A)

人類50

kb50

kb50

kb50

kb40404040BUD3TRY5fixATy2·例子:·尿殖道支原體帶有已知最小的基因組,可依此確定能自我復(fù)制的細(xì)胞必需的一套最少的

基因

。·流感嗜血桿菌的基因組為1.83MB,尿殖道支

原體的基因組只有0.58Mb,

二者相差3倍多

,

那么,基因組是大小影響了基因的數(shù)目還

基因的

?通

數(shù)

據(jù)

進(jìn)

學(xué)

究十●流感嗜血桿菌的基因大小平均900bp,尿殖道支

原體的基因?yàn)?040bp,他們基因大小差不多·流感嗜血桿菌中平均1024bp有一個(gè)基因,尿殖

道支原體平均1

235

bp有一個(gè)基因?!そY(jié)論:

基因尺度減小并不引起基因密度的增加

和基因本身尺寸的減小。二者的差別在于基因數(shù)量上,流感嗜血

桿菌基因有1743個(gè)ORF,而尿殖道支原體只有

4

7

0

個(gè)ORF十比較基因組有助于解決進(jìn)化距離問題十激火譬測

術(shù)

與比

學(xué)閻永偉十比較基因組學(xué)是在基因組圖譜和測序的基礎(chǔ)上,利用某個(gè)基因組研究獲得的信息推測其他原核生

物、真核生物類群中的基因數(shù)目、位置、功能、表達(dá)機(jī)制和物種進(jìn)化的學(xué)科。該學(xué)科的發(fā)展及所取得的成果與序列的積累相同步,尤其是人類全基因組序列的分析與比較使

比較基因組學(xué)成為整個(gè)生物學(xué)領(lǐng)域最新、最重要、進(jìn)展最快和影響最大的學(xué)科之一。H1.

已完成的測序比較基因組學(xué)從一開始就是人類基因組計(jì)劃的

分。人類基因組計(jì)劃的原始計(jì)劃是測定人類和一部分模式生物(如細(xì)菌,酵母,果蠅,秀麗隱桿

線蟲,小鼠等)

的全基因組序列。十2010年全部完成Lander

et

al.2005

;Waterston

et

al.

2002;Gibbset

al.

2004;Adams

et

al.2000

;Blattner

et

al.

1997Goffeau

et

al.1996Dehal

et

al.2002,Small

et

al.2007;Stain

et

al.2003,Stein

et

al.

1998

。HomoPanMusRattussapienstroglodytesmusculusnorvegicusDrosophilamelanogasterEscherichiacoliSaccharomycescerevisiaeCaenorhabditiselegansCiona

intestinalisHGP

完成

以后

:Gallus

gallusBos

taurusCanis

familiarisApismelliferaAnthocidaris

crassispinaMacaca

mulattaBlattner

et

al.2004

,Elsik

et

al.2009,Lindblad-Tohetal.2005,Lindblad-Toh

et

al.2006,Sodergren

et

al.2006Gibbs

et

al.

2007蜜蜂紫海丹恒河猴十雞

狗InEntrez

Genome,1000

completeProkaryoticGenomes

are

available!Archaea91

3

pclah

mid

somessosmroEukaryota1335

chromosomes7

lasor

aidnsellesp7Eukaryota2483BacteriaWiroids41Viroids41Total

records(12518)Total

species

(6621)統(tǒng)

計(jì)

序完成情況Viruses3703chromosomesViruses2423Plasmids40plasmidsPlasmids

39Bacteria25462135Archaea15331022.測

術(shù)

述絕大多數(shù)生物的遺傳物質(zhì)為DNA,然而遺傳信息卻僅僅由四種堿基——A,T,C,G

排列組合而成。自從DNA的雙螺旋結(jié)構(gòu)被發(fā)現(xiàn)以后,能夠知道DNA分子上四種堿基的順序就成為了一個(gè)新的熱點(diǎn)。于是,繼蛋白質(zhì)和RNA測序之后,又出現(xiàn)了DNA

。十自1977年出現(xiàn)DNA測序技術(shù)至今,第

術(shù)第

術(shù)第

術(shù)十(1)測序技術(shù)的出現(xiàn)及第一代測序技術(shù)1)測序技術(shù)的出現(xiàn)1975年,

Sanger

和Coulson

發(fā)明了“加減法”測定DNA序列;

1977年,又引入ddNTP,發(fā)明了雙脫氧終止法;1977,Maxam

和Gilbert發(fā)明了化學(xué)降解法測定DNA序列。十DNA題合牌4Klenaw)dNTP1

物—CH?O

t(A..G.T-)H

H

ddNTP一CH?O

R&(A.C.G.T.)H

HddNTPFig1.

雙脫氧終止法測序①T

T②ACG

T

A

A

A

TCGAT

ACG

TAA

G

A之

應(yīng)

應(yīng)ACGT

A

A

T

C

aA

C

A

dd

Add.AddA

1dd

AddATPddCTP

ddGTP

ddTTP己ddATP

ddCP

ddGTp

ddT

TP模極DNA標(biāo)

引物十ToTTeoTTtoaTDNAH〇2)第

術(shù)傳統(tǒng)的化學(xué)降解法、雙脫氧鏈終止法以及在它們的基礎(chǔ)上發(fā)展來的各種DNA測序技術(shù)統(tǒng)稱為第一

代DNA測序技術(shù)。第一代測序技術(shù)在分子生物學(xué)研究中發(fā)揮過重要的作用,如人類基因組計(jì)劃主要基于第一代DNA

測序技術(shù)

。十目前基于熒光標(biāo)記和Sanger

的雙脫氧鏈終止法原理的熒光自動(dòng)測序儀(如ABI

3730XL)仍被

廣泛地應(yīng)用。雜交測序技術(shù)也是第一代測序技術(shù),但是并非基于以上兩種原理。速度快,但是誤差大。十Fig.2ABI

3730XL十(2)第二代測序技術(shù)后基因組時(shí)代亦即功能基因組時(shí)代的測序技術(shù),顯著特征

量、

低成

。主要包括羅氏454公司的GS

FLX測序平臺、Illumina

公司的Solexa

Genome

Analyzer測序平臺和ABI公司的SOLiD測序平臺。十Fig.3Roche454GSFLX

臺十m;cnd

PRm=FAB+PCR

Reagents

*Emulsion

olBreakmicrocextorsate

DMA

sontainng

be

adsGensrate"waterin-oil'*mulsionmiero

e3ctorsPertermemuision

PCRCapture

beadswthinmiao-L**40NAbead

into

PeermerPie**a

dapterEadaptarAnneal

ssDA

Captuetemplate

te

EeadsL*Bd

fntyme*XXreadorsHprldormif

BSSDNA

LDray又又isol889AFig.4

lluminaSolexa

臺十Extend

first

base.read,and

deblock中

e

r

ve↓<

Generate

base

calsandaboextend

stpeat

steptoRFragmentDNARepair

ends◎

Solect

ligated

DNAAddA

overhangO

Ligate

adapters3

SEQUENCING1-3days

single-read

run30minutes

hands-on

time8

po

(

n

amplernu96eltoerflowanes,uPlG

Attach

DNA

to

flow

celllGPorform

bridge

amplifcationGenerate

clustars

LIBRARY

PREPARATION6houms3

hours

hands-on

time2

CLUSTERGENERATION

4

hours30minutes

hands-on

timeCD—+3-7days

Paired-end

run4Annealprimersequencing↓△十,→Fig.5

ABISOLiD

平臺十Raad

Position0123S6T910111212151617e192021222242526272829381

Unnereal

sog

primer

(n)3er2Univogal

*9primor

in-1

TrrnTmrT)Univorsal

seq

pnmar

(n-2)

3errret4Unversal

seq

prmar(n-3)3

mmmsUnwersal3seq

prmer

ln-4)rrrrm3-

#e:s

C--=Primr35Adap'ar3”,Baad

—5.aIndfcareaponitionaofintenogatknLigatkonCreie?寫3,Baad-—5SaquengeTamydyteSanueneeSequencelenplteSecueneeCHeavage-*mGT5

和的

的第2E06…101056……83Tonplite

Sequanca-

3'-C-AH0-0-GT山忙SaquanoePrinwerAdageerAdapter貌

猶noPPnmerBead分-FEm-333測

術(shù)454SolexaSOLiD上

時(shí)

間200520072007價(jià)

(

元2

0

0

7

)504.559單次反應(yīng)數(shù)據(jù)量(G)0.42050讀

(

b

p

)40050×250優(yōu)

勢長

長低

價(jià)比高

,

準(zhǔn)確度參考

獻(xiàn)

:DNA測序技術(shù)的發(fā)展歷史與最新進(jìn)展,解增言等

; DNA測序技術(shù)發(fā)展及其展

,孫

。表

1

三種第二代測序技術(shù)對比(3

)

術(shù)以

特點(diǎn)

;如:

BioScienceCorporation的HeliScopeSingleMolecular

Sequencer;

Pacific

Biosciences的SingleMoleculeRealTime(SMRT)DNAsequencingtechnology(正在研制);Oxford

Nanopore

Technologies

Ltd的納米孔單分子測序技術(shù)。中科院北京基因組研究所,2013年,第一

臺國產(chǎn)樣機(jī)十3.

術(shù)

學(xué)4.

DNA測序已經(jīng)成為分子生物學(xué)研究中一

種基本的研究手段與工具,對于這種手段的需要也

已經(jīng)極大地促進(jìn)了DNA測序技術(shù)的進(jìn)步與發(fā)展。5.

在此基礎(chǔ)上,將會有更多的生物的全基因組序列被測定,那么針對任何一種生物的比較基

因組學(xué)研究將會變得更加簡單。十沒

譬基因組序列分析的計(jì)算方法1.

言2.

點(diǎn)

圖3.兩

對4.多序

對5.數(shù)據(jù)庫搜索朱

琳十人類基因組計(jì)劃(

HGP)遺傳圖、物理圖、序列圖和轉(zhuǎn)錄圖區(qū)分兩個(gè)概念:同源性---------共同的祖先相似性---------定量特征高度相似很可能是同源序列;相似性很低的序列也可能具

有同源序列引言十ACTGTTAGAOCOTQ⊙⊙T⊙⊙⊙TQ⊙○A⊙G⊙C⊙點(diǎn)陣圖A

C

T

G

T

T

A

GI

l

HA

C

T

-

T

T

A

G面臨的問題:進(jìn)化的過程中同源序列可經(jīng)過多次的插

入或缺失,導(dǎo)致它們長度不同,這就給比對

帶來了麻煩。要解決的問題:最優(yōu)比對算法-----尋找最佳的缺失方式使比對序列的相似度達(dá)到整體最大兩

對十Needleman-wunsch全

法首先構(gòu)建具有m行n列的矩陣M,

根據(jù)殘基配對的函數(shù),給每個(gè)矩陣單元格賦值,將矩陣初始化。再進(jìn)行變換操作,

規(guī)則是將某單元格右下方路徑中的最大值疊加到該單元格即M(I,j)=M(I,j)+max[M(i+1,j+1);M(i+1,j+2,...,jmax)-gappenalty;M(i+2,.,imaxj+1)-gap

penalty]使用最簡單的打分系統(tǒng)進(jìn)行比對,殘基相同時(shí)分值是1,

不同時(shí)分值為0,空位罰分。此外還有Smith-waterman

算法十基因組比對只能對序列密切相關(guān)或非常相似的基因

組比對,序列太長,既有的算法無能為力方法:suffix

tree

數(shù)據(jù)結(jié)構(gòu)軟件MUMer

能找出兩個(gè)基因組的DNA序列

上最大且唯一的匹配區(qū)域,然后除去序列中用Smith-waterman

最佳局部比對算法對大量插

入序列、重復(fù)序列、短變異區(qū)域進(jìn)行局部鑒定時(shí)插入的空位,完成這兩個(gè)基因組序列的比對。十三條或多條序列的同時(shí)比對是序列的分析中最常用的技術(shù)之一。通過一系列同源序列的全局比對來實(shí)現(xiàn)的遞進(jìn)法:

基本思想是同源序列與系統(tǒng)發(fā)育相關(guān)。具體步驟:1、比對所有可能的序列對。2、用相鄰連接法使用兩兩比對的相似度分值構(gòu)建(tree)。

3、

這種樹用于指導(dǎo)遞進(jìn)的多序列比對。多序列比對十DGenomeAnalysesGBGenomeinfomation

brakerGIB-VGB

far

WrusesGTPSRearnotaticn

pf

bacterial

genomes

using

a

nen

oammonprotocolGTOPGenometopratein

structure

and

functimDNextGererationSequenceAnalysisDDBJ

ReadAnnotation

PipelineHish-trro.ehputdataaralysisafnexteeneraticnseq.ence

eta

(Login

D

is

requirsd)getentryData

retrieual

by

aocess

on

numbers,etc.ARSAAll-TourdRetrievalofSequence

and

AmotatinIXSearchRetrieval

of

unified

taocromg

datataseBLASTHomologySearchDDBJVectorScreeningSystem】PhylogereticsClustalWMultple

alenment

and

Tree-making數(shù)據(jù)庫搜索Ddtabases

ToolsENAHomBEMEL-Bank

HomeAoasSDocumentalion1NewsSubmissiorPublicalionsn

PeoplemContactEMBL

FetchFechanEMBL

recond

byidGo三大核酸數(shù)據(jù)庫:GenBank、

EMBL、

DDBJResourcesNCB

HomeA

Resources(A-Z)Chemicals8

BipassasData&SotwseDNA8RNADomains&StucuresGenes8

Eypression

Geneics

&MedaneGenomes8WapsHomologrLteraturePrateinsSequenceAnalysisTavnampTrairing&TutoriasAccessionDNf

FroteinAllDesIaxonomrSiteSearchAccessionnumbersGo@oveJ

unFrotOrceOovoOrre

FNent

>>mseFTP/WebAF]

Repart/Statistics

Cantact

Le

)

naneseSequenceRDATAEEioSysterDaiGenBankThethe

the

adThecatInfuenzaPresetputEB|>EMThe

EEuno;

sequsequThe

t

the

D

TepordailyUefAputThe

Eby旦8NCBINaiorslCemterfarBiotedhnolbgy

htormaticnen

Rest

Q

Cheus.DDBJDNA

Data

Bank

ef

JapanALDatanasesNCB

ResoucsHOMESubmissicnHowtollseEntarTaxtHereHwToHOME>Search

and

AralysisBLBSearch/Analysis思能

SDatabaseSearchSearh

Al

Daiatast數(shù)據(jù)庫搜索使用的最廣泛的算法:FASTA算法和BLAST算法。FASTA算法運(yùn)用一種包括四個(gè)連續(xù)階段的

啟發(fā)式方法來檢測被查序列與一組序列是相

似性

。BLAST

算法采用非??斓乃惴▉聿檎覕?shù)據(jù)

庫中與預(yù)查詢序列最相似是序列?;舅枷?/p>

是:兩個(gè)同源序列即使有很大的差異,也有

可能共有高分值的相似片段,這使我們可以理解可靠的區(qū)分相關(guān)和非相關(guān)的序列。十蛋白質(zhì)序列分析對新蛋白質(zhì)序列進(jìn)行分析的第一步是用BLAST進(jìn)行數(shù)

據(jù)庫搜索?!袢绻忻黠@相似性可以推測其序列的功能●如果沒有,可用模式識別方法根據(jù)特定的結(jié)構(gòu)域或蛋白

質(zhì)家族的特征進(jìn)行搜索。-----模式數(shù)據(jù)庫已經(jīng)成為識別新序列的特

定功能活性的重要工具。

InterPro數(shù)據(jù)庫是最重要的蛋白

質(zhì)模式數(shù)據(jù)庫之一。十此外還有·蛋白質(zhì)信號肽的識別及亞細(xì)胞定位的預(yù)測

·預(yù)測卷曲螺旋和螺旋-轉(zhuǎn)角-螺旋結(jié)構(gòu)·蛋白質(zhì)折疊的識別與分類等十沒火譬種內(nèi)比較基因組學(xué)

模式生物姜南十·種內(nèi)基因組的比較·同種群體內(nèi)基因組存在大量的變異和多態(tài)性,正是這種基

因組序列的差異構(gòu)成了不同個(gè)體與群體對疾病的易感性和

對藥物與環(huán)境因子不同反應(yīng)的遺傳學(xué)基礎(chǔ)。十·

我總結(jié)了:·凡是能夠用來研究同一種群內(nèi)兩個(gè)個(gè)體基因組的不同的分

子手段都屬于種內(nèi)比較基因組學(xué)的范疇?!ぶ髁鞣椒ㄊ欠肿訕?biāo)記技術(shù):RAPD,RFLP,AFLP

,基因芯片。。。·

回顧分子標(biāo)記十水

產(chǎn)

例·李太武老師等用20

條隨機(jī)引物對皺紋盤鮑、雜色鮑進(jìn)行

RAPD分析,結(jié)果均能產(chǎn)生清晰可重復(fù)擴(kuò)增產(chǎn)物,計(jì)算出各

群體擴(kuò)增位點(diǎn)的多態(tài)性比例分別為43.66%和53.05%,

體平均遺傳雜合度分別為0.1557

和0.1686,

群體間的遺傳

距離0.2898,

表明皺紋盤鮑與雜色鮑的親緣關(guān)系較遠(yuǎn)。十模

物·基因進(jìn)化上的保守往性和遺傳密碼的通用性,從某一生物

得到的有關(guān)基因性質(zhì)或功能方面的信息往往也適用于其他

物。·個(gè)體小,易操作,易培養(yǎng),繁殖快?!げ《荆竽c桿菌,酵母,線蟲,果蠅,斑馬魚,小鼠,擬

南芥十

沒火譬種間比較基因組學(xué)研究馬壽光黃繼十通過對不同親緣關(guān)系物種的基因組序列進(jìn)行

比較,

能夠鑒定出編碼序列、非編碼調(diào)控序列

及給定物種獨(dú)有的序列。而基因組范圍之內(nèi)的

序列比對,可以了解不同物種在核苷酸組成、

同線性關(guān)系和基因順序方面的異同,進(jìn)而得到

基因分析預(yù)測與定位、生物系統(tǒng)發(fā)生進(jìn)化關(guān)系

面的

。十·1

基因組的比較研究·

2系統(tǒng)

發(fā)

生的

進(jìn)

關(guān)系

析十·比較基因組學(xué)的基礎(chǔ)是相關(guān)生物基因組的

相似性。兩種具有較近共同祖先的生物,它們之間具有種屬差別的基因組是由祖先

基因組進(jìn)化而來,兩種生物在進(jìn)化的階段

上越接近,它們的基因組相關(guān)性就越高。如果生物之間存在很近的親緣關(guān)系,那么它們的基因組就會表現(xiàn)出同線性(synteny),

即基因序列的部分或全部保守。1.全基因組的比較研究十·

Synteny可以

設(shè)

,

小鼠

動(dòng)

物有一個(gè)共同的祖先,在漫長的進(jìn)化中,

染色體發(fā)生斷裂,重排,加上基因內(nèi)部的

化,

。

發(fā)生斷

排的

段內(nèi)

部的

基因

織和連鎖順序在不同的物種中保持不變,這就是synteny,是

基因組比較作圖

礎(chǔ)

。十·在各種不同的物種中,絕大多數(shù)的核心生物功能是

由相當(dāng)數(shù)量的orthologous蛋白承擔(dān),所謂or-thologous蛋白就是一些在不同物種中有共同祖先

的蛋白質(zhì)。在不同的物種中這些蛋白的數(shù)量十分

相似,它們主要是在生物體中執(zhí)行中介代謝,DNA,RNA

代謝,蛋白折疊,trafficking,和降解的

功能。在較為復(fù)雜的生物中,隨著功能不斷地復(fù)雜,

就會出現(xiàn)許多蛋白以執(zhí)行其復(fù)雜的功能,而維持最

基本生命活動(dòng)的蛋白是保守的。兩種物和中蛋自

總數(shù)上的差別是由承擔(dān)各自特有任務(wù)的蛋白數(shù)目的不同而造成的。十·

可以

基因

之間

結(jié)

構(gòu)

上的同源性,通過已知基因組的作圖信息

定位另外基因組中的基因,從而揭示基因

潛在的功能、

闡明物種進(jìn)化關(guān)系及基因組

的內(nèi)在結(jié)構(gòu)。十·人類與多個(gè)靈長類動(dòng)物的比較基因組學(xué)研

究,在闡明靈長類特異基因調(diào)節(jié)元件和劃

分多基因的外顯子方面顯示出了很大的優(yōu)

?!ち帜究膳c擬南芥(已經(jīng)獲得了全基因組序

列,

一些基因的功能已被注釋)和毛果楊

等功能基因組研究較深入的物種進(jìn)行比較

基因組學(xué)研究,這將為林木上相關(guān)基因功

能的研究提供便利。十·生物最本質(zhì)的特征是進(jìn)化,

比較基因組學(xué)同樣以進(jìn)化理論作為理論基石,

同時(shí)其研究結(jié)果又前所未有地豐富和發(fā)展了進(jìn)化理論

?!ぎ?dāng)在兩種以上的基因組間進(jìn)行序列比較時(shí),

實(shí)質(zhì)上就得到了序列在系統(tǒng)發(fā)生樹中的進(jìn)化關(guān)系?;蚪M信息的增多使得在基因組

水平上研究分子進(jìn)化、基因功能成為可能。2.

系統(tǒng)發(fā)

的進(jìn)

關(guān)

析十·通過對多種生物基因組數(shù)據(jù)及其垂直進(jìn)化、

水平演化過程進(jìn)行研究,就可以對與生命

至關(guān)重要的基因的結(jié)構(gòu)及其調(diào)控作用有所

了解。但由于生物基因組中約有1.5%~

14.5%

的基因與“橫向遷移現(xiàn)象”有關(guān),

即基因可以在同時(shí)存在的種群間遷移,這

樣就會導(dǎo)致與進(jìn)化無關(guān)的序列差異。十·

橫向遷移現(xiàn)象·對人類基因組的分析發(fā)現(xiàn),有幾十個(gè)人的

基因只

細(xì)

基因

似,

蠅、

線蟲

中都不存在。如果以人的這些基因序列來

研究進(jìn)化將會得到荒謬的結(jié)論。所以在當(dāng)

前的分子進(jìn)化研究中必須選擇垂直進(jìn)化的

分子作為樣本。并且在系統(tǒng)發(fā)生分析中需

要建立較完整的生物進(jìn)化模型,以避免基

因轉(zhuǎn)移和欠缺合適的多物種共有保守序列

影響

。十·

Z

曲線的GC

輪廓圖方法·基因組序列變換為等價(jià)的三維空間曲線——Z

線,經(jīng)過適當(dāng)?shù)耐队昂妥鶚?biāo)旋轉(zhuǎn)后得到Z’曲

線,后者又稱為累積GC

圖(

CumulativeGCprofile)

。定

義:在基因組某一堿基處的G+C含量正比于Z’曲線在該點(diǎn)切線的斜率。而在某一窗

口中的平均G+C含量則正比于此量在該窗口內(nèi)的

定積分

?!τ谌我唤o定的DNA

序列,有唯一的一條Z

曲線

與之對應(yīng);反之,給定一條Z

曲線,它所代表的

DNA

序列可以唯一地導(dǎo)出。因此,

Z曲線攜帶了

DNA

序列的全部息。對兩個(gè)基因組或染色體序列

的比較,可以通過對它們所對應(yīng)的Z曲線的比較

來進(jìn)行?!ぴ谘芯课锓N間的進(jìn)化關(guān)系時(shí),傳統(tǒng)的分子進(jìn)化研究方法一

般選取一個(gè)大分子(如16SRNA)

的序列為標(biāo)準(zhǔn),研究其在各個(gè)物種同源序列之間的差異,并以此構(gòu)建進(jìn)化樹。但

一個(gè)物種的基因組編碼了成千上萬個(gè)序列,以其

中一個(gè)序

列的差異來代表整個(gè)生物體的差異是不全面的。因此,從

全基因組的水平來研究生物的進(jìn)化應(yīng)該更為合理。利

較基因組學(xué)的方法在基因組水平上構(gòu)建的進(jìn)化樹將會更加合理的闡述物種之間的進(jìn)化關(guān)系。十·物種序列的優(yōu)化選擇:當(dāng)在比較

40~80

My

進(jìn)化距離的DNA

序列時(shí),其編碼序列與一

保守

的,如人與鼠。然而至今在這一進(jìn)化距離內(nèi)保守的非編碼序

列中只有少數(shù)被鑒定為有特征性的功能元件,其它的僅被認(rèn)

為是臨近或

200

kb

附近基因的轉(zhuǎn)錄調(diào)控元件。在進(jìn)化距離

較遠(yuǎn)(

450

My)

的序列比較時(shí),將主要揭示保守的編碼序刻

主要是因?yàn)榈鞍踪|(zhì)要維持其功能,因此對替換更為嚴(yán)謹(jǐn)保需進(jìn)化的稍慢一點(diǎn)。所以在建立多序列比較時(shí)加入一支稍遠(yuǎn)的物種序列(

450

My

)將提高保守序列的鑒別能力。比較分析較近的物種序列如:人與himpanzees或與其它的類人

猿可以用來鑒定在近期進(jìn)化史上發(fā)生的基因改變和重組等。

因此在建立多序列的比較分析中加入一支近距離的物種序

列不僅有助于編碼和非編碼的功能序列的譚制,也能揭示那

些相關(guān)物種特征的基因組信息、十·在進(jìn)行

DNA

序列比較而鑒定保守序列時(shí),有兩種比較分析手段:局部比對和整體比對。局部比對是對序列亞區(qū)分析獲得最高一致性的計(jì)算方法,其基本原理是在兩序列排隊(duì)時(shí)采用不同的比對方法,排除了從頭到尾的單一匹配方式。例如當(dāng)兩長序列進(jìn)行匹配時(shí),可能內(nèi)含的同源基因亞區(qū)的排列順序或基因的走向不同,因此對這種比對采用多種方式進(jìn)行搜索分析的結(jié)果將比較準(zhǔn)確,常用的分析工具是PipMarker服務(wù)器。整體比對是尋找所要比較的整個(gè)基因序列上的最大的同源性分值,它適用于高度分化但組織結(jié)構(gòu)同源的序列比對,整體比對適用于基因序列整體上同源性較高的比較分析,如保守片斷(

conserved

segments)的比對,可以使用

VISTA

進(jìn)行分析。十Smith-Waterman算法時(shí)間復(fù)雜度O(n2);·Sij

=maxof(xi,yj)左到右)

上到下)·本例中:gap:d=12

,線性罰分模型。十例

5:

Smith-Waterman

法進(jìn)行雙序列局部

比對·

:工

D

SCHG

ES工C

K□目標(biāo):使用局部優(yōu)化算法尋找比對的結(jié)果十例

5

:Smith-Waterman

法進(jìn)行雙

部比對·兩條序列如下:工

D

S

C

HG

E

S

工C

K□目標(biāo):使用局部優(yōu)化算法尋找比對的結(jié)果十Smith-Waterman算法Gap

L

D

S

CHGap0

0000G

0E

0

Smith-Waterman算法;S

0

Dij

=

max

oiL0C

0K

0十GapLDSCHGap00000GOE0S0L0C00Smith-Waterman算法GapLDSCHGap0O0G0E0SOL0C00Smith-Waterman算法GapLDSCHGap0000OOGO00000E00200OSO02○OOL04O50C0010920O008Smith-Waterman算法GapLDSCHGap00O0O0GO00000E00200SO06OLO4O50C0O12K0O0O8

局部比對結(jié)果:

D

S

C

H

G

ES

工C

K局就代化比對。十二·

中性突變與隨機(jī)漂移學(xué)說的核心就是認(rèn)為大部分對生物種群的遺傳結(jié)

構(gòu)與進(jìn)化有貢獻(xiàn)的分子突變在自然選擇的意義上都是中性或近中性的,

因而自然選擇對這些突變并不起到篩選的作用。中性突變產(chǎn)生后是通

過一代一代的隨機(jī)漂移,或者被固定在種群中并占有一定的比例,或者消失。

生物種群內(nèi)的遺傳多樣性,如蛋白質(zhì)(酶)以及DNA的多態(tài)

性,都是通過這類中性或近中性突變的隨機(jī)漂移而產(chǎn)生的。中性理論并不是說所有突變都是中性的,實(shí)際上,相當(dāng)大的一部分突變是有害

的,這一部分突變具體有多少與有關(guān)分子本身可容許的變化程度有關(guān)。

有害的突變產(chǎn)生后,會影響攜帶這些突變的蛋白質(zhì)以及基因的正常功能,影響生物的生存與繁殖,因此很快就會被淘汰掉,從而在進(jìn)化上是沒有意義的。另一方面,對生物有利的所謂正突變其實(shí)是很少的,從而對種群的遺傳結(jié)構(gòu)也沒有什么貢獻(xiàn),不能說明分子進(jìn)化中的多態(tài)

性現(xiàn)象。

自然選擇只對那些對種群的遺傳結(jié)構(gòu)并不重要的有變和

正突變起作用,卻不能決定對種群的遺傳結(jié)構(gòu)起重要作用的中性或近

中性突變的命運(yùn),中性或近中性突變的命運(yùn)是面隨機(jī)因素決定的。因此,又可以把中性理論看作是一種“幸運(yùn)者生存”的學(xué)說。1

·

3從模式生物基因組研究中得出一些規(guī)律·

3.1模式生物基因組一般都比較小,但是編碼基因的比例較高,重復(fù)順序和非編碼順序較少,是一些“壓縮”的基因組·

3.2模式生物基因組的G+C%比較高同時(shí)

CpG

島的比例也比較高。Fugurubripes的G+C

%時(shí)44·2%(這是脊椎動(dòng)物種最高的),而人類則是

40·3%。這可能是因?yàn)榈偷壬镏芯幋a順序的比例比較高,另一個(gè)原因

與模式生物的密碼子第三位的堿基選擇有關(guān)?!?/p>

3.3模式生物的基因組中,內(nèi)含子和外顯子的結(jié)構(gòu)組織比較保立勇切應(yīng)

點(diǎn)在多種生

一致。這是Fugu

rubripes和現(xiàn)有的哺乳動(dòng)物的基因組

順序比較的結(jié)果·

3.4在幾種模式生物都發(fā)現(xiàn)了重復(fù)(duplication)。

同時(shí)存在兩份或兩份以上的順序一致或十分相似的編碼蛋白的DNA

順序,稱為冗余。理解

重復(fù)的真正本質(zhì)是闡明基因組中基因生物功能和物種進(jìn)化的前提。·

3.5生物體的復(fù)雜性一般表現(xiàn)在“生物學(xué)”的復(fù)雜性,與基因組的

C

大小及基因數(shù)量未必一定呈線性關(guān)系。十·首先比較基因組學(xué)建立的基礎(chǔ)是功能元件由于選擇的作用

其進(jìn)化的速率稍慢一點(diǎn),這有背于中性理論;其次在序列的

比較中對保守區(qū)域的thresholds(length

and

percentidentity)的選擇還沒有一套有效的方法,往往兩個(gè)物種不

同區(qū)域的thresholds

各異十比較基肉組學(xué)的應(yīng)用揭

列發(fā)

現(xiàn)

因發(fā)現(xiàn)功能性SNP闡述物種間的進(jìn)化史闡

機(jī)

制李春麗十古細(xì)菌---產(chǎn)甲烷球菌●

與原核生物共同之處:1染色體組織與結(jié)構(gòu):環(huán)狀基因組、基因的操縱子結(jié)構(gòu)等

2能量產(chǎn)生和固氮基因與細(xì)菌基因有很高的同源3與細(xì)胞分裂有關(guān)的蛋白質(zhì)、20多個(gè)編碼無機(jī)離子運(yùn)輸?shù)?/p>

白的ORF與細(xì)菌基因同源4調(diào)控模式類似于原核生物●

與真核生物共同之處:1

細(xì)胞遺傳信息傳遞,尤其是轉(zhuǎn)錄和翻譯系統(tǒng)

2分泌系統(tǒng)●說明該細(xì)菌與真核生物親緣關(guān)系較近。比較基因組學(xué)與進(jìn)化十·

比較基因組學(xué)提供的結(jié)果表明,在進(jìn)化系統(tǒng)樹上,

古細(xì)菌與真核生物親緣關(guān)系比原核生物更近?!?/p>

自養(yǎng)生物的三個(gè)分支,細(xì)菌、古細(xì)菌和真核

生物中,細(xì)菌的分化發(fā)生較早。比

學(xué)

進(jìn)

化十比

學(xué)

應(yīng)

策略·序列的比對分析·

確定基因組序列的進(jìn)化關(guān)系·基

性synteny:·染色體片段的分析·物種序列的優(yōu)化選擇·

對DNA

序列的信息注釋◎

比較基因組學(xué)研究舉例·

原核模式生物比較基因組學(xué)·

釀酒酵母基因組·

人類基因組十@

點(diǎn)●1模式生物基因組一般都比較小,但編碼基因的

比例較高,重復(fù)序列和非編碼序列較少,是

“壓

縮”的基因組。●2模式生物基因組中G+C%

含量高,同時(shí)CpG

的比例也比較高?!?/p>

3一些模式生物,特別在人的基因組中發(fā)現(xiàn)了重

復(fù)

?!?各種不同的物種中,大多數(shù)重要生物學(xué)功能是

由相當(dāng)數(shù)量的同源序列基因蛋白承擔(dān)。●

5同線(syn

teny)連鎖的同源基因在不同物種基因

組中有相同連鎖關(guān)系。十@模

究●尿殖道支原體是已知最小的基因組0.58Mb

,由此可能確

定能自我復(fù)制的細(xì)胞必需的一套最少的核心基因?!?/p>

流感嗜血桿菌的基因組為1.83Mb流感嗜血桿菌基因大小平均900

bp,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論