比較基因組學(xué)原理及應(yīng)用

上傳人：1*** IP屬地：湖南上傳時(shí)間：2024-05-08 格式：PPTX 頁數(shù)：90 大?。?7.62MB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩85頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

沒火譬比

較

基

因

組

學(xué)

原

理

及

應(yīng)

用成員：韓柳閻

永

偉黃繼

馬壽光

朱琳

姜

南李春麗十

宰波火譬比較基因組學(xué)相

關(guān)

概

念韓柳十基因組(genome)泛指一個(gè)有生命體、病毒或細(xì)胞器的全部

遺傳物質(zhì)；在真核生物，基因組是指一套染色

體

(

單

倍

體

)

DNA?；蚪M學(xué)(genomics)就是發(fā)展和應(yīng)用DNA

制圖、測序新技術(shù)以

及計(jì)算機(jī)程序，分析生命體(包括人類)全部基

因組結(jié)構(gòu)及功能。基

因

組

學(xué)

概

念

及

范

疇十亞

領(lǐng)

域內(nèi)

容結(jié)構(gòu)基因組學(xué)整個(gè)基因組的遺傳制圖、物理制圖及DNA測序。功能基因組學(xué)認(rèn)識、分析整個(gè)基因組所包含的基因、非基因序列及其功能。比較基因組學(xué)比較不同物種的整個(gè)基因組，增強(qiáng)對各個(gè)基因組功能及發(fā)育相關(guān)性的認(rèn)識?；蚪M學(xué)概念十

比

較

基因組學(xué)

概

念·

定義：

比較基因組學(xué)(Comparative

Genomics)是

基于基因

組圖

譜

和

測

序

基

礎(chǔ)上，

對已知的

基因

和

基因組結(jié)

構(gòu)

進(jìn)

行比較，

來了

解

基因的功能、表達(dá)

機(jī)

理

和

物

種

進(jìn)

化的

學(xué)

科

。·

研究內(nèi)容：

種間的比較基因組學(xué)和種內(nèi)的比較

基

因組學(xué)十全長cDNA預(yù)測序15%,工作草圖90%,全長100%第22號染色體

第21號染色體ESTs微星遺傳圖物理圖轉(zhuǎn)錄圖序列圖遺傳圖物理圖轉(zhuǎn)錄圖序列圖全長cDNA預(yù)測序SNPs細(xì)菌基因組H.m線蟲果蠅擬南芥小

鼠

人類其它基因組39個(gè)物種大腸桿菌釀酒酵母微星SNPsESTs1、

通

過比較

確

知

其

功能的

。2、

在數(shù)據(jù)庫中有相匹配的蛋白，但不知道其

功能

。3、在現(xiàn)有的數(shù)據(jù)庫中找不到任何相匹配的蛋

白質(zhì)序列的新基因。十2、BLAST3、CLUSTAL基

因

組

分

類

：工

具

：概念1、FASTAW物種完成年份總長度/Mp已完成總長的百分?jǐn)?shù)/%占常染色質(zhì)百分?jǐn)?shù)/Mb基因數(shù)/Mb酵母19961293100483線蟲19989699100197果蠅20001166497117擬南芥200011592100221人類第21染色體200034751007人類第22染色體199934709716人類全基因組(Public

Sequence)20012693849012人類全基因組(Celera

Sequence)200126548399-9315基本完成DNA序列分析的真核生物基因組比較V28

V29-1O

20(B)

酵母GLKI

SRO9

HiS4FUSIO

IO20(C)玉米O

20(D)

大

腸

桿

菌thrB

IS186

ISlthrA

thrC

dnaKO

20KEY外

顯子

假基因TRY430AGPI

C3.0Adhl-F30CarB30重

復(fù)序

列部分真核、原核生物基因組成成份分析(A)

人類50

kb50

kb40404040BUD3TRY5fixATy2·例子：·尿殖道支原體帶有已知最小的基因組，可依此確定能自我復(fù)制的細(xì)胞必需的一套最少的

核

心

基因

。·流感嗜血桿菌的基因組為1.83MB,尿殖道支

原體的基因組只有0.58Mb,

二者相差3倍多

，

那么,基因組是大小影響了基因的數(shù)目還

是

基因的

尺

度

?通

過

基

因

組

數(shù)

據(jù)

進(jìn)

行

比

較

基

因

組

學(xué)

研

究十●流感嗜血桿菌的基因大小平均900bp,尿殖道支

原體的基因?yàn)?040bp,他們基因大小差不多·流感嗜血桿菌中平均1024bp有一個(gè)基因，尿殖

道支原體平均1

235

bp有一個(gè)基因?！そY(jié)論：

基因尺度減小并不引起基因密度的增加

和基因本身尺寸的減小。二者的差別在于基因數(shù)量上，流感嗜血

桿菌基因有1743個(gè)ORF,而尿殖道支原體只有

個(gè)ORF十比較基因組有助于解決進(jìn)化距離問題十激火譬測

序

技

術(shù)

與比

較

基

因

組

學(xué)閻永偉十比較基因組學(xué)是在基因組圖譜和測序的基礎(chǔ)上，利用某個(gè)基因組研究獲得的信息推測其他原核生

物、真核生物類群中的基因數(shù)目、位置、功能、表達(dá)機(jī)制和物種進(jìn)化的學(xué)科。該學(xué)科的發(fā)展及所取得的成果與序列的積累相同步，尤其是人類全基因組序列的分析與比較使

比較基因組學(xué)成為整個(gè)生物學(xué)領(lǐng)域最新、最重要、進(jìn)展最快和影響最大的學(xué)科之一。H1.

已完成的測序比較基因組學(xué)從一開始就是人類基因組計(jì)劃的

一

部

分。人類基因組計(jì)劃的原始計(jì)劃是測定人類和一部分模式生物(如細(xì)菌，酵母，果蠅，秀麗隱桿

線蟲，小鼠等)

的全基因組序列。十2010年全部完成Lander

al.2005

;Waterston

al.

2002;Gibbset

al.

2004;Adams

al.2000

;Blattner

al.

1997Goffeau

al.1996Dehal

al.2002,Small

al.2007;Stain

al.2003,Stein

al.

1998

。HomoPanMusRattussapienstroglodytesmusculusnorvegicusDrosophilamelanogasterEscherichiacoliSaccharomycescerevisiaeCaenorhabditiselegansCiona

intestinalisHGP

完成

以后

：Gallus

gallusBos

taurusCanis

familiarisApismelliferaAnthocidaris

crassispinaMacaca

mulattaBlattner

al.2004

,Elsik

al.2009,Lindblad-Tohetal.2005,Lindblad-Toh

al.2006,Sodergren

al.2006Gibbs

al.

2007蜜蜂紫海丹恒河猴十雞

牛

狗InEntrez

Genome,1000

completeProkaryoticGenomes

are

available!Archaea91

pclah

mid

somessosmroEukaryota1335

chromosomes7

lasor

aidnsellesp7Eukaryota2483BacteriaWiroids41Viroids41Total

records(12518)Total

species

(6621)統(tǒng)

測

計(jì)

序完成情況Viruses3703chromosomesViruses2423Plasmids40plasmidsPlasmids

39Bacteria25462135Archaea15331022.測

序

技

術(shù)

概

述絕大多數(shù)生物的遺傳物質(zhì)為DNA,然而遺傳信息卻僅僅由四種堿基——A,T,C,G

排列組合而成。自從DNA的雙螺旋結(jié)構(gòu)被發(fā)現(xiàn)以后，能夠知道DNA分子上四種堿基的順序就成為了一個(gè)新的熱點(diǎn)。于是，繼蛋白質(zhì)和RNA測序之后，又出現(xiàn)了DNA

測

序

。十自1977年出現(xiàn)DNA測序技術(shù)至今，第

一

代

測

序

技

術(shù)第

二

代

測

序

技

術(shù)第

三

代

測

序

技

術(shù)十(1)測序技術(shù)的出現(xiàn)及第一代測序技術(shù)1)測序技術(shù)的出現(xiàn)1975年，

Sanger

和Coulson

發(fā)明了“加減法”測定DNA序列；

1977年，又引入ddNTP,發(fā)明了雙脫氧終止法；1977,Maxam

和Gilbert發(fā)明了化學(xué)降解法測定DNA序列。十DNA題合牌4Klenaw)dNTP1

物—CH?O

t(A..G.T-)H

ddNTP一CH?O

R&(A.C.G.T.)H

HddNTPFig1.

雙脫氧終止法測序①T

T②ACG

TCGAT

ACG

TAA

A之

應(yīng)

應(yīng)ACGT

Add.AddA

1dd

AddATPddCTP

ddGTP

ddTTP己ddATP

ddCP

ddGTp

ddT

TP模極DNA標(biāo)

記

引物十ToTTeoTTtoaTDNAH〇2)第

一

代

測

序

技

術(shù)傳統(tǒng)的化學(xué)降解法、雙脫氧鏈終止法以及在它們的基礎(chǔ)上發(fā)展來的各種DNA測序技術(shù)統(tǒng)稱為第一

代DNA測序技術(shù)。第一代測序技術(shù)在分子生物學(xué)研究中發(fā)揮過重要的作用，如人類基因組計(jì)劃主要基于第一代DNA

測序技術(shù)

。十目前基于熒光標(biāo)記和Sanger

的雙脫氧鏈終止法原理的熒光自動(dòng)測序儀(如ABI

3730XL)仍被

廣泛地應(yīng)用。雜交測序技術(shù)也是第一代測序技術(shù)，但是并非基于以上兩種原理。速度快，但是誤差大。十Fig.2ABI

3730XL十(2)第二代測序技術(shù)后基因組時(shí)代亦即功能基因組時(shí)代的測序技術(shù)，顯著特征

是

高

通

量、

低成

本

。主要包括羅氏454公司的GS

FLX測序平臺、Illumina

公司的Solexa

Genome

Analyzer測序平臺和ABI公司的SOLiD測序平臺。十Fig.3Roche454GSFLX

平

臺十m;cnd

PRm=FAB+PCR

Reagents

*Emulsion

olBreakmicrocextorsate

DMA

sontainng

adsGensrate"waterin-oil'*mulsionmiero

e3ctorsPertermemuision

PCRCapture

beadswthinmiao-L**40NAbead

into

PeermerPie**a

dapterEadaptarAnneal

ssDA

Captuetemplate

EeadsL*Bd

fntyme*XXreadorsHprldormif

BSSDNA

LDray又又isol889AFig.4

lluminaSolexa

平

臺十Extend

first

base.read,and

deblock中

ve↓<

Generate

base

calsandaboextend

stpeat

steptoRFragmentDNARepair

ends◎

Solect

ligated

DNAAddA

overhangO

Ligate

adapters3

SEQUENCING1-3days

single-read

run30minutes

hands-on

time8

(

amplernu96eltoerflowanes,uPlG

Attach

DNA

flow

celllGPorform

bridge

amplifcationGenerate

clustars

LIBRARY

PREPARATION6houms3

hours

hands-on

time2

CLUSTERGENERATION

hours30minutes

hands-on

timeCD—+3-7days

Paired-end

run4Annealprimersequencing↓△十,→Fig.5

ABISOLiD

平臺十Raad

Position0123S6T910111212151617e192021222242526272829381

Unnereal

sog

primer

(n)3er2Univogal

*9primor

in-1

TrrnTmrT)Univorsal

seq

pnmar

(n-2)

3errret4Unversal

seq

prmar(n-3)3

mmmsUnwersal3seq

prmer

ln-4)rrrrm3-

#e:s

C--=Primr35Adap'ar3”,Baad

—5.aIndfcareaponitionaofintenogatknLigatkonCreie?寫3,Baad-—5SaquengeTamydyteSanueneeSequencelenplteSecueneeCHeavage-*mGT5

和的

中

的

的第2E06…101056……83Tonplite

Sequanca-

3'-C-AH0-0-GT山忙SaquanoePrinwerAdageerAdapter貌

猶noPPnmerBead分-FEm-333測

序

技

術(shù)454SolexaSOLiD上

市

時(shí)

間200520072007價(jià)

格

(

萬

美

元2

年

)504.559單次反應(yīng)數(shù)據(jù)量(G)0.42050讀

長

(

)40050×250優(yōu)

勢長

讀

長低

測

序

成

本

，

高

性

價(jià)比高

通

量

，

高

準(zhǔn)確度參考

文

獻(xiàn)

：DNA測序技術(shù)的發(fā)展歷史與最新進(jìn)展，解增言等

； DNA測序技術(shù)發(fā)展及其展

望

，孫

海

汐

等

。表

三種第二代測序技術(shù)對比(3

)

第

三

代

測

序

技

術(shù)以

單

分

子

測

序

為

特點(diǎn)

；如：

BioScienceCorporation的HeliScopeSingleMolecular

Sequencer;

Pacific

Biosciences的SingleMoleculeRealTime(SMRT)DNAsequencingtechnology(正在研制);Oxford

Nanopore

Technologies

Ltd的納米孔單分子測序技術(shù)。中科院北京基因組研究所，2013年，第一

臺國產(chǎn)樣機(jī)十3.

測

序

技

術(shù)

與

比

較

基

因

組

學(xué)4.

DNA測序已經(jīng)成為分子生物學(xué)研究中一

種基本的研究手段與工具，對于這種手段的需要也

已經(jīng)極大地促進(jìn)了DNA測序技術(shù)的進(jìn)步與發(fā)展。5.

在此基礎(chǔ)上，將會有更多的生物的全基因組序列被測定，那么針對任何一種生物的比較基

因組學(xué)研究將會變得更加簡單。十沒

大

譬基因組序列分析的計(jì)算方法1.

引

言2.

點(diǎn)

陣

圖3.兩

序

列

比

對4.多序

列

比

對5.數(shù)據(jù)庫搜索朱

琳十人類基因組計(jì)劃(

HGP)遺傳圖、物理圖、序列圖和轉(zhuǎn)錄圖區(qū)分兩個(gè)概念：同源性---------共同的祖先相似性---------定量特征高度相似很可能是同源序列；相似性很低的序列也可能具

有同源序列引言十ACTGTTAGAOCOTQ⊙⊙T⊙⊙⊙TQ⊙○A⊙G⊙C⊙點(diǎn)陣圖A

G面臨的問題：進(jìn)化的過程中同源序列可經(jīng)過多次的插

入或缺失，導(dǎo)致它們長度不同，這就給比對

帶來了麻煩。要解決的問題：最優(yōu)比對算法-----尋找最佳的缺失方式使比對序列的相似度達(dá)到整體最大兩

序

列

比

對十Needleman-wunsch全

局

比

對

算

法首先構(gòu)建具有m行n列的矩陣M,

根據(jù)殘基配對的函數(shù)，給每個(gè)矩陣單元格賦值，將矩陣初始化。再進(jìn)行變換操作，

規(guī)則是將某單元格右下方路徑中的最大值疊加到該單元格即M(I,j)=M(I,j)+max[M(i+1,j+1);M(i+1,j+2,...,jmax)-gappenalty;M(i+2,.,imaxj+1)-gap

penalty]使用最簡單的打分系統(tǒng)進(jìn)行比對，殘基相同時(shí)分值是1,

不同時(shí)分值為0,空位罰分。此外還有Smith-waterman

算法十基因組比對只能對序列密切相關(guān)或非常相似的基因

組比對，序列太長，既有的算法無能為力方法：suffix

tree

數(shù)據(jù)結(jié)構(gòu)軟件MUMer

能找出兩個(gè)基因組的DNA序列

上最大且唯一的匹配區(qū)域，然后除去序列中用Smith-waterman

最佳局部比對算法對大量插

入序列、重復(fù)序列、短變異區(qū)域進(jìn)行局部鑒定時(shí)插入的空位，完成這兩個(gè)基因組序列的比對。十三條或多條序列的同時(shí)比對是序列的分析中最常用的技術(shù)之一。通過一系列同源序列的全局比對來實(shí)現(xiàn)的遞進(jìn)法：

基本思想是同源序列與系統(tǒng)發(fā)育相關(guān)。具體步驟：1、比對所有可能的序列對。2、用相鄰連接法使用兩兩比對的相似度分值構(gòu)建(tree)。

3、

這種樹用于指導(dǎo)遞進(jìn)的多序列比對。多序列比對十DGenomeAnalysesGBGenomeinfomation

brakerGIB-VGB

far

WrusesGTPSRearnotaticn

bacterial

genomes

using

nen

oammonprotocolGTOPGenometopratein

structure

and

functimDNextGererationSequenceAnalysisDDBJ

ReadAnnotation

PipelineHish-trro.ehputdataaralysisafnexteeneraticnseq.ence

eta

(Login

requirsd)getentryData

retrieual

aocess

numbers,etc.ARSAAll-TourdRetrievalofSequence

and

AmotatinIXSearchRetrieval

unified

taocromg

datataseBLASTHomologySearchDDBJVectorScreeningSystem】PhylogereticsClustalWMultple

alenment

and

Tree-making數(shù)據(jù)庫搜索Ddtabases

ToolsENAHomBEMEL-Bank

HomeAoasSDocumentalion1NewsSubmissiorPublicalionsn

PeoplemContactEMBL

FetchFechanEMBL

recond

byidGo三大核酸數(shù)據(jù)庫：GenBank、

EMBL、

DDBJResourcesNCB

HomeA

Resources(A-Z)Chemicals8

BipassasData&SotwseDNA8RNADomains&StucuresGenes8

Eypression

Geneics

&MedaneGenomes8WapsHomologrLteraturePrateinsSequenceAnalysisTavnampTrairing&TutoriasAccessionDNf

FroteinAllDesIaxonomrSiteSearchAccessionnumbersGo@oveJ

unFrotOrceOovoOrre

FNent

>>mseFTP/WebAF]

Repart/Statistics

Cantact

)

naneseSequenceRDATAEEioSysterDaiGenBankThethe

the

adThecatInfuenzaPresetputEB|>EMThe

EEuno;

sequsequThe

the

TepordailyUefAputThe

Eby旦8NCBINaiorslCemterfarBiotedhnolbgy

htormaticnen

Rest

Cheus.DDBJDNA

Data

Bank

JapanALDatanasesNCB

ResoucsHOMESubmissicnHowtollseEntarTaxtHereHwToHOME>Search

and

AralysisBLBSearch/Analysis思能

SDatabaseSearchSearh

Daiatast數(shù)據(jù)庫搜索使用的最廣泛的算法：FASTA算法和BLAST算法。FASTA算法運(yùn)用一種包括四個(gè)連續(xù)階段的

啟發(fā)式方法來檢測被查序列與一組序列是相

似性

。BLAST

算法采用非?？斓乃惴▉聿檎覕?shù)據(jù)

庫中與預(yù)查詢序列最相似是序列?；舅枷?/p>

是：兩個(gè)同源序列即使有很大的差異，也有

可能共有高分值的相似片段，這使我們可以理解可靠的區(qū)分相關(guān)和非相關(guān)的序列。十蛋白質(zhì)序列分析對新蛋白質(zhì)序列進(jìn)行分析的第一步是用BLAST進(jìn)行數(shù)

據(jù)庫搜索?！袢绻忻黠@相似性可以推測其序列的功能●如果沒有，可用模式識別方法根據(jù)特定的結(jié)構(gòu)域或蛋白

質(zhì)家族的特征進(jìn)行搜索。-----模式數(shù)據(jù)庫已經(jīng)成為識別新序列的特

定功能活性的重要工具。

InterPro數(shù)據(jù)庫是最重要的蛋白

質(zhì)模式數(shù)據(jù)庫之一。十此外還有·蛋白質(zhì)信號肽的識別及亞細(xì)胞定位的預(yù)測

·預(yù)測卷曲螺旋和螺旋-轉(zhuǎn)角-螺旋結(jié)構(gòu)·蛋白質(zhì)折疊的識別與分類等十沒火譬種內(nèi)比較基因組學(xué)

模式生物姜南十·種內(nèi)基因組的比較·同種群體內(nèi)基因組存在大量的變異和多態(tài)性，正是這種基

因組序列的差異構(gòu)成了不同個(gè)體與群體對疾病的易感性和

對藥物與環(huán)境因子不同反應(yīng)的遺傳學(xué)基礎(chǔ)。十·

我總結(jié)了：·凡是能夠用來研究同一種群內(nèi)兩個(gè)個(gè)體基因組的不同的分

子手段都屬于種內(nèi)比較基因組學(xué)的范疇?！ぶ髁鞣椒ㄊ欠肿訕?biāo)記技術(shù)：RAPD,RFLP,AFLP

,基因芯片。。。·

回顧分子標(biāo)記十水

產(chǎn)

界

舉

例·李太武老師等用20

條隨機(jī)引物對皺紋盤鮑、雜色鮑進(jìn)行

RAPD分析，結(jié)果均能產(chǎn)生清晰可重復(fù)擴(kuò)增產(chǎn)物，計(jì)算出各

群體擴(kuò)增位點(diǎn)的多態(tài)性比例分別為43.66%和53.05%,

群

體平均遺傳雜合度分別為0.1557

和0.1686,

群體間的遺傳

距離0.2898,

表明皺紋盤鮑與雜色鮑的親緣關(guān)系較遠(yuǎn)。十模

式

生

物·基因進(jìn)化上的保守往性和遺傳密碼的通用性，從某一生物

得到的有關(guān)基因性質(zhì)或功能方面的信息往往也適用于其他

生

物。·個(gè)體小，易操作，易培養(yǎng)，繁殖快?！げ《荆竽c桿菌，酵母，線蟲，果蠅，斑馬魚，小鼠，擬

南芥十

沒火譬種間比較基因組學(xué)研究馬壽光黃繼十通過對不同親緣關(guān)系物種的基因組序列進(jìn)行

比較，

能夠鑒定出編碼序列、非編碼調(diào)控序列

及給定物種獨(dú)有的序列。而基因組范圍之內(nèi)的

序列比對，可以了解不同物種在核苷酸組成、

同線性關(guān)系和基因順序方面的異同，進(jìn)而得到

基因分析預(yù)測與定位、生物系統(tǒng)發(fā)生進(jìn)化關(guān)系

等

方

面的

信

息

。十·1

全

基因組的比較研究·

2系統(tǒng)

發(fā)

生的

進(jìn)

化

關(guān)系

分

析十·比較基因組學(xué)的基礎(chǔ)是相關(guān)生物基因組的

相似性。兩種具有較近共同祖先的生物，它們之間具有種屬差別的基因組是由祖先

基因組進(jìn)化而來，兩種生物在進(jìn)化的階段

上越接近，它們的基因組相關(guān)性就越高。如果生物之間存在很近的親緣關(guān)系，那么它們的基因組就會表現(xiàn)出同線性(synteny),

即基因序列的部分或全部保守。1.全基因組的比較研究十·

Synteny可以

這

樣

假

設(shè)

，

人

與

小鼠

或

其

它

哺

乳

動(dòng)

物有一個(gè)共同的祖先，在漫長的進(jìn)化中，

染色體發(fā)生斷裂，重排，加上基因內(nèi)部的

變

化，

成

為

各

種

不

同

的

物

種

。

但

是

未

發(fā)生斷

裂

重

排的

完

整

片

段內(nèi)

部的

基因

組

織和連鎖順序在不同的物種中保持不變，這就是synteny,是

基因組比較作圖

的

基

礎(chǔ)

所

在

。十·在各種不同的物種中，絕大多數(shù)的核心生物功能是

由相當(dāng)數(shù)量的orthologous蛋白承擔(dān)，所謂or-thologous蛋白就是一些在不同物種中有共同祖先

的蛋白質(zhì)。在不同的物種中這些蛋白的數(shù)量十分

相似，它們主要是在生物體中執(zhí)行中介代謝，DNA,RNA

代謝，蛋白折疊，trafficking,和降解的

功能。在較為復(fù)雜的生物中，隨著功能不斷地復(fù)雜，

就會出現(xiàn)許多蛋白以執(zhí)行其復(fù)雜的功能，而維持最

基本生命活動(dòng)的蛋白是保守的。兩種物和中蛋自

總數(shù)上的差別是由承擔(dān)各自特有任務(wù)的蛋白數(shù)目的不同而造成的。十·

可以

利

用

模

基因

組

之間

編

碼

順

序

上

和

結(jié)

構(gòu)

上的同源性，通過已知基因組的作圖信息

定位另外基因組中的基因，從而揭示基因

潛在的功能、

闡明物種進(jìn)化關(guān)系及基因組

的內(nèi)在結(jié)構(gòu)。十·人類與多個(gè)靈長類動(dòng)物的比較基因組學(xué)研

究，在闡明靈長類特異基因調(diào)節(jié)元件和劃

分多基因的外顯子方面顯示出了很大的優(yōu)

勢

?！ち帜究膳c擬南芥(已經(jīng)獲得了全基因組序

列，

一些基因的功能已被注釋)和毛果楊

等功能基因組研究較深入的物種進(jìn)行比較

基因組學(xué)研究，這將為林木上相關(guān)基因功

能的研究提供便利。十·生物最本質(zhì)的特征是進(jìn)化，

比較基因組學(xué)同樣以進(jìn)化理論作為理論基石，

同時(shí)其研究結(jié)果又前所未有地豐富和發(fā)展了進(jìn)化理論

?！ぎ?dāng)在兩種以上的基因組間進(jìn)行序列比較時(shí)，

實(shí)質(zhì)上就得到了序列在系統(tǒng)發(fā)生樹中的進(jìn)化關(guān)系?；蚪M信息的增多使得在基因組

水平上研究分子進(jìn)化、基因功能成為可能。2.

系統(tǒng)發(fā)

生

的進(jìn)

化

關(guān)

系

分

析十·通過對多種生物基因組數(shù)據(jù)及其垂直進(jìn)化、

水平演化過程進(jìn)行研究，就可以對與生命

至關(guān)重要的基因的結(jié)構(gòu)及其調(diào)控作用有所

了解。但由于生物基因組中約有1.5%~

14.5%

的基因與“橫向遷移現(xiàn)象”有關(guān)，

即基因可以在同時(shí)存在的種群間遷移，這

樣就會導(dǎo)致與進(jìn)化無關(guān)的序列差異。十·

橫向遷移現(xiàn)象·對人類基因組的分析發(fā)現(xiàn)，有幾十個(gè)人的

基因只

與

細(xì)

菌

基因

相

似，

而

在

果

蠅、

線蟲

中都不存在。如果以人的這些基因序列來

研究進(jìn)化將會得到荒謬的結(jié)論。所以在當(dāng)

前的分子進(jìn)化研究中必須選擇垂直進(jìn)化的

分子作為樣本。并且在系統(tǒng)發(fā)生分析中需

要建立較完整的生物進(jìn)化模型，以避免基

因轉(zhuǎn)移和欠缺合適的多物種共有保守序列

的

影響

。十·

曲線的GC

輪廓圖方法·基因組序列變換為等價(jià)的三維空間曲線——Z

曲

線，經(jīng)過適當(dāng)?shù)耐队昂妥鶚?biāo)旋轉(zhuǎn)后得到Z’曲

線，后者又稱為累積GC

輪

廓

圖(

CumulativeGCprofile)

。定

義：在基因組某一堿基處的G+C含量正比于Z’曲線在該點(diǎn)切線的斜率。而在某一窗

口中的平均G+C含量則正比于此量在該窗口內(nèi)的

定積分

?！τ谌我唤o定的DNA

序列，有唯一的一條Z

曲線

與之對應(yīng)；反之，給定一條Z

曲線，它所代表的

DNA

序列可以唯一地導(dǎo)出。因此，

Z曲線攜帶了

DNA

序列的全部息。對兩個(gè)基因組或染色體序列

的比較，可以通過對它們所對應(yīng)的Z曲線的比較

來進(jìn)行?！ぴ谘芯课锓N間的進(jìn)化關(guān)系時(shí)，傳統(tǒng)的分子進(jìn)化研究方法一

般選取一個(gè)大分子(如16SRNA)

的序列為標(biāo)準(zhǔn)，研究其在各個(gè)物種同源序列之間的差異，并以此構(gòu)建進(jìn)化樹。但

是

一個(gè)物種的基因組編碼了成千上萬個(gè)序列，以其

中一個(gè)序

列的差異來代表整個(gè)生物體的差異是不全面的。因此，從

全基因組的水平來研究生物的進(jìn)化應(yīng)該更為合理。利

用

較基因組學(xué)的方法在基因組水平上構(gòu)建的進(jìn)化樹將會更加合理的闡述物種之間的進(jìn)化關(guān)系。十·物種序列的優(yōu)化選擇：當(dāng)在比較

40～80

進(jìn)化距離的DNA

序列時(shí)，其編碼序列與一

些

重

要

的

非

編

碼

序

列

將

是

保守

的，如人與鼠。然而至今在這一進(jìn)化距離內(nèi)保守的非編碼序

列中只有少數(shù)被鑒定為有特征性的功能元件，其它的僅被認(rèn)

為是臨近或

200

附近基因的轉(zhuǎn)錄調(diào)控元件。在進(jìn)化距離

較遠(yuǎn)(

450

My)

的序列比較時(shí)，將主要揭示保守的編碼序刻

主要是因?yàn)榈鞍踪|(zhì)要維持其功能，因此對替換更為嚴(yán)謹(jǐn)保需進(jìn)化的稍慢一點(diǎn)。所以在建立多序列比較時(shí)加入一支稍遠(yuǎn)的物種序列(

450

)將提高保守序列的鑒別能力。比較分析較近的物種序列如：人與himpanzees或與其它的類人

猿可以用來鑒定在近期進(jìn)化史上發(fā)生的基因改變和重組等。

因此在建立多序列的比較分析中加入一支近距離的物種序

列不僅有助于編碼和非編碼的功能序列的譚制，也能揭示那

些相關(guān)物種特征的基因組信息、十·在進(jìn)行

DNA

序列比較而鑒定保守序列時(shí)，有兩種比較分析手段：局部比對和整體比對。局部比對是對序列亞區(qū)分析獲得最高一致性的計(jì)算方法，其基本原理是在兩序列排隊(duì)時(shí)采用不同的比對方法，排除了從頭到尾的單一匹配方式。例如當(dāng)兩長序列進(jìn)行匹配時(shí)，可能內(nèi)含的同源基因亞區(qū)的排列順序或基因的走向不同，因此對這種比對采用多種方式進(jìn)行搜索分析的結(jié)果將比較準(zhǔn)確，常用的分析工具是PipMarker服務(wù)器。整體比對是尋找所要比較的整個(gè)基因序列上的最大的同源性分值，它適用于高度分化但組織結(jié)構(gòu)同源的序列比對，整體比對適用于基因序列整體上同源性較高的比較分析，如保守片斷(

conserved

segments)的比對，可以使用

VISTA

進(jìn)行分析。十Smith-Waterman算法時(shí)間復(fù)雜度O(n2);·Sij

=maxof(xi,yj)左到右)

上到下)·本例中：gap:d=12

,線性罰分模型。十例

Smith-Waterman

算

法進(jìn)行雙序列局部

比對·

兩

條

序

列

如

下

：工

SCHG

ES工C

K□目標(biāo)：使用局部優(yōu)化算法尋找比對的結(jié)果十例

:Smith-Waterman

算

法進(jìn)行雙

序

列

局

部比對·兩條序列如下：工

工C

K□目標(biāo)：使用局部優(yōu)化算法尋找比對的結(jié)果十Smith-Waterman算法Gap

CHGap0

0000G

Smith-Waterman算法；S

Dij

max

oiL0C

0十GapLDSCHGap00000GOE0S0L0C00Smith-Waterman算法GapLDSCHGap0O0G0E0SOL0C00Smith-Waterman算法GapLDSCHGap0000OOGO00000E00200OSO02○OOL04O50C0010920O008Smith-Waterman算法GapLDSCHGap00O0O0GO00000E00200SO06OLO4O50C0O12K0O0O8

局部比對結(jié)果：

工

工C

K局就代化比對。十二·

中性突變與隨機(jī)漂移學(xué)說的核心就是認(rèn)為大部分對生物種群的遺傳結(jié)

構(gòu)與進(jìn)化有貢獻(xiàn)的分子突變在自然選擇的意義上都是中性或近中性的，

因而自然選擇對這些突變并不起到篩選的作用。中性突變產(chǎn)生后是通

過一代一代的隨機(jī)漂移，或者被固定在種群中并占有一定的比例，或者消失。

生物種群內(nèi)的遺傳多樣性，如蛋白質(zhì)(酶)以及DNA的多態(tài)

性，都是通過這類中性或近中性突變的隨機(jī)漂移而產(chǎn)生的。中性理論并不是說所有突變都是中性的，實(shí)際上，相當(dāng)大的一部分突變是有害

的，這一部分突變具體有多少與有關(guān)分子本身可容許的變化程度有關(guān)。

有害的突變產(chǎn)生后，會影響攜帶這些突變的蛋白質(zhì)以及基因的正常功能，影響生物的生存與繁殖，因此很快就會被淘汰掉，從而在進(jìn)化上是沒有意義的。另一方面，對生物有利的所謂正突變其實(shí)是很少的，從而對種群的遺傳結(jié)構(gòu)也沒有什么貢獻(xiàn)，不能說明分子進(jìn)化中的多態(tài)

性現(xiàn)象。

自然選擇只對那些對種群的遺傳結(jié)構(gòu)并不重要的有變和

正突變起作用，卻不能決定對種群的遺傳結(jié)構(gòu)起重要作用的中性或近

中性突變的命運(yùn)，中性或近中性突變的命運(yùn)是面隨機(jī)因素決定的。因此，又可以把中性理論看作是一種“幸運(yùn)者生存”的學(xué)說。1

3從模式生物基因組研究中得出一些規(guī)律·

3.1模式生物基因組一般都比較小，但是編碼基因的比例較高，重復(fù)順序和非編碼順序較少，是一些“壓縮”的基因組·

3.2模式生物基因組的G+C%比較高同時(shí)

CpG

島的比例也比較高。Fugurubripes的G+C

%時(shí)44·2%(這是脊椎動(dòng)物種最高的),而人類則是

40·3%。這可能是因?yàn)榈偷壬镏芯幋a順序的比例比較高，另一個(gè)原因

與模式生物的密碼子第三位的堿基選擇有關(guān)?！?/p>

3.3模式生物的基因組中，內(nèi)含子和外顯子的結(jié)構(gòu)組織比較保立勇切應(yīng)

點(diǎn)在多種生

中

一致。這是Fugu

rubripes和現(xiàn)有的哺乳動(dòng)物的基因組

順序比較的結(jié)果·

3.4在幾種模式生物都發(fā)現(xiàn)了重復(fù)(duplication)。

同時(shí)存在兩份或兩份以上的順序一致或十分相似的編碼蛋白的DNA

順序，稱為冗余。理解

重復(fù)的真正本質(zhì)是闡明基因組中基因生物功能和物種進(jìn)化的前提。·

3.5生物體的復(fù)雜性一般表現(xiàn)在“生物學(xué)”的復(fù)雜性，與基因組的

值

大小及基因數(shù)量未必一定呈線性關(guān)系。十·首先比較基因組學(xué)建立的基礎(chǔ)是功能元件由于選擇的作用

其進(jìn)化的速率稍慢一點(diǎn)，這有背于中性理論；其次在序列的

比較中對保守區(qū)域的thresholds(length

and

percentidentity)的選擇還沒有一套有效的方法，往往兩個(gè)物種不

同區(qū)域的thresholds

各異十比較基肉組學(xué)的應(yīng)用揭

示

非

編

碼

功

能

序

列發(fā)

現(xiàn)

新

基

因發(fā)現(xiàn)功能性SNP闡述物種間的進(jìn)化史闡

明

人

類

疾

病

過

程

的

分

子

機(jī)

制李春麗十古細(xì)菌---產(chǎn)甲烷球菌●

與原核生物共同之處：1染色體組織與結(jié)構(gòu)：環(huán)狀基因組、基因的操縱子結(jié)構(gòu)等

2能量產(chǎn)生和固氮基因與細(xì)菌基因有很高的同源3與細(xì)胞分裂有關(guān)的蛋白質(zhì)、20多個(gè)編碼無機(jī)離子運(yùn)輸?shù)?/p>

白的ORF與細(xì)菌基因同源4調(diào)控模式類似于原核生物●

與真核生物共同之處：1

細(xì)胞遺傳信息傳遞，尤其是轉(zhuǎn)錄和翻譯系統(tǒng)

2分泌系統(tǒng)●說明該細(xì)菌與真核生物親緣關(guān)系較近。比較基因組學(xué)與進(jìn)化十·

比較基因組學(xué)提供的結(jié)果表明，在進(jìn)化系統(tǒng)樹上，

古細(xì)菌與真核生物親緣關(guān)系比原核生物更近?！?/p>

自養(yǎng)生物的三個(gè)分支，細(xì)菌、古細(xì)菌和真核

生物中，細(xì)菌的分化發(fā)生較早。比

較

基

因

組

學(xué)

與

進(jìn)

化十比

較

基

因

組

學(xué)

的

具

體

應(yīng)

用

方

法

和

策略·序列的比對分析·

確定基因組序列的進(jìn)化關(guān)系·基

因

共

線

性synteny:·染色體片段的分析·物種序列的優(yōu)化選擇·

對DNA

序列的信息注釋◎

比較基因組學(xué)研究舉例·

原核模式生物比較基因組學(xué)·

釀酒酵母基因組·

人類基因組十@

模

式

生

物

比

較

基

因

組

研

究

特

點(diǎn)●1模式生物基因組一般都比較小，但編碼基因的

比例較高，重復(fù)序列和非編碼序列較少，是

“壓

縮”的基因組。●2模式生物基因組中G+C%

含量高，同時(shí)CpG

島

的比例也比較高?！?/p>

3一些模式生物，特別在人的基因組中發(fā)現(xiàn)了重

復(fù)

?！?各種不同的物種中，大多數(shù)重要生物學(xué)功能是

由相當(dāng)數(shù)量的同源序列基因蛋白承擔(dān)。●

5同線(syn

teny)連鎖的同源基因在不同物種基因

組中有相同連鎖關(guān)系。十@模

式

生

物

基

因

組

的

研

究●尿殖道支原體是已知最小的基因組0.58Mb

,由此可能確

定能自我復(fù)制的細(xì)胞必需的一套最少的核心基因?！?/p>

流感嗜血桿菌的基因組為1.83Mb流感嗜血桿菌基因大小平均900

bp,

人人文庫> 全部分類> 辦公材料 > 演講稿件

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

比較基因組學(xué)原理及應(yīng)用

文檔簡介

溫馨提示

最新文檔

評論

比較基因組學(xué)原理及應(yīng)用

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔