




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
沒火譬比
較
基
因
組
學(xué)
原
理
及
應(yīng)
用成員:韓柳閻
永
偉黃繼
馬壽光
朱琳
姜
南李春麗十
宰波火譬比較基因組學(xué)相
關(guān)
概
念韓柳十基因組(genome)泛指一個(gè)有生命體、病毒或細(xì)胞器的全部
遺傳物質(zhì);在真核生物,基因組是指一套染色
體
(
單
倍
體
)
DNA?;蚪M學(xué)(genomics)就是發(fā)展和應(yīng)用DNA
制圖、測序新技術(shù)以
及計(jì)算機(jī)程序,分析生命體(包括人類)全部基
因組結(jié)構(gòu)及功能。基
因
組
學(xué)
概
念
及
范
疇十亞
領(lǐng)
域內(nèi)
容結(jié)構(gòu)基因組學(xué)整個(gè)基因組的遺傳制圖、物理制圖及DNA測序。功能基因組學(xué)認(rèn)識、分析整個(gè)基因組所包含的基因、非基因序列及其功能。比較基因組學(xué)比較不同物種的整個(gè)基因組,增強(qiáng)對各個(gè)基因組功能及發(fā)育相關(guān)性的認(rèn)識?;蚪M學(xué)概念十
比
較
基因組學(xué)
概
念·
定義:
比較基因組學(xué)(Comparative
Genomics)是
基于基因
組圖
譜
和
測
序
基
礎(chǔ)上,
對已知的
基因
和
基因組結(jié)
構(gòu)
進(jìn)
行比較,
來了
解
基因的功能、表達(dá)
機(jī)
理
和
物
種
進(jìn)
化的
學(xué)
科
。·
研究內(nèi)容:
種間的比較基因組學(xué)和種內(nèi)的比較
基
因組學(xué)十全長cDNA預(yù)測序15%,工作草圖90%,全長100%第22號染色體
第21號染色體ESTs微星遺傳圖物理圖轉(zhuǎn)錄圖序列圖遺傳圖物理圖轉(zhuǎn)錄圖序列圖全長cDNA預(yù)測序SNPs細(xì)菌基因組H.m線蟲果蠅擬南芥小
鼠
人類其它基因組39個(gè)物種大腸桿菌釀酒酵母微星SNPsESTs1、
通
過比較
確
知
其
功能的
。2、
在數(shù)據(jù)庫中有相匹配的蛋白,但不知道其
功能
。3、在現(xiàn)有的數(shù)據(jù)庫中找不到任何相匹配的蛋
白質(zhì)序列的新基因。十2、BLAST3、CLUSTAL基
因
組
分
類
:工
具
:概念1、FASTAW物種完成年份總長度/Mp已完成總長的百分?jǐn)?shù)/%占常染色質(zhì)百分?jǐn)?shù)/Mb基因數(shù)/Mb酵母19961293100483線蟲19989699100197果蠅20001166497117擬南芥200011592100221人類第21染色體200034751007人類第22染色體199934709716人類全基因組(Public
Sequence)20012693849012人類全基因組(Celera
Sequence)200126548399-9315基本完成DNA序列分析的真核生物基因組比較V28
V29-1O
10
20(B)
酵母GLKI
SRO9
HiS4FUSIO
IO20(C)玉米O
1O
20(D)
大
腸
桿
菌thrB
IS186
ISlthrA
thrC
dnaKO
10
20KEY外
顯子
假基因TRY430AGPI
C3.0Adhl-F30CarB30重
復(fù)序
列部分真核、原核生物基因組成成份分析(A)
人類50
kb50
kb50
kb50
kb40404040BUD3TRY5fixATy2·例子:·尿殖道支原體帶有已知最小的基因組,可依此確定能自我復(fù)制的細(xì)胞必需的一套最少的
核
心
基因
。·流感嗜血桿菌的基因組為1.83MB,尿殖道支
原體的基因組只有0.58Mb,
二者相差3倍多
,
那么,基因組是大小影響了基因的數(shù)目還
是
基因的
尺
度
?通
過
基
因
組
數(shù)
據(jù)
進(jìn)
行
比
較
基
因
組
學(xué)
研
究十●流感嗜血桿菌的基因大小平均900bp,尿殖道支
原體的基因?yàn)?040bp,他們基因大小差不多·流感嗜血桿菌中平均1024bp有一個(gè)基因,尿殖
道支原體平均1
235
bp有一個(gè)基因?!そY(jié)論:
基因尺度減小并不引起基因密度的增加
和基因本身尺寸的減小。二者的差別在于基因數(shù)量上,流感嗜血
桿菌基因有1743個(gè)ORF,而尿殖道支原體只有
4
7
0
個(gè)ORF十比較基因組有助于解決進(jìn)化距離問題十激火譬測
序
技
術(shù)
與比
較
基
因
組
學(xué)閻永偉十比較基因組學(xué)是在基因組圖譜和測序的基礎(chǔ)上,利用某個(gè)基因組研究獲得的信息推測其他原核生
物、真核生物類群中的基因數(shù)目、位置、功能、表達(dá)機(jī)制和物種進(jìn)化的學(xué)科。該學(xué)科的發(fā)展及所取得的成果與序列的積累相同步,尤其是人類全基因組序列的分析與比較使
比較基因組學(xué)成為整個(gè)生物學(xué)領(lǐng)域最新、最重要、進(jìn)展最快和影響最大的學(xué)科之一。H1.
已完成的測序比較基因組學(xué)從一開始就是人類基因組計(jì)劃的
一
部
分。人類基因組計(jì)劃的原始計(jì)劃是測定人類和一部分模式生物(如細(xì)菌,酵母,果蠅,秀麗隱桿
線蟲,小鼠等)
的全基因組序列。十2010年全部完成Lander
et
al.2005
;Waterston
et
al.
2002;Gibbset
al.
2004;Adams
et
al.2000
;Blattner
et
al.
1997Goffeau
et
al.1996Dehal
et
al.2002,Small
et
al.2007;Stain
et
al.2003,Stein
et
al.
1998
。HomoPanMusRattussapienstroglodytesmusculusnorvegicusDrosophilamelanogasterEscherichiacoliSaccharomycescerevisiaeCaenorhabditiselegansCiona
intestinalisHGP
完成
以后
:Gallus
gallusBos
taurusCanis
familiarisApismelliferaAnthocidaris
crassispinaMacaca
mulattaBlattner
et
al.2004
,Elsik
et
al.2009,Lindblad-Tohetal.2005,Lindblad-Toh
et
al.2006,Sodergren
et
al.2006Gibbs
et
al.
2007蜜蜂紫海丹恒河猴十雞
牛
狗InEntrez
Genome,1000
completeProkaryoticGenomes
are
available!Archaea91
3
pclah
mid
somessosmroEukaryota1335
chromosomes7
lasor
aidnsellesp7Eukaryota2483BacteriaWiroids41Viroids41Total
records(12518)Total
species
(6621)統(tǒng)
測
計(jì)
序完成情況Viruses3703chromosomesViruses2423Plasmids40plasmidsPlasmids
39Bacteria25462135Archaea15331022.測
序
技
術(shù)
概
述絕大多數(shù)生物的遺傳物質(zhì)為DNA,然而遺傳信息卻僅僅由四種堿基——A,T,C,G
排列組合而成。自從DNA的雙螺旋結(jié)構(gòu)被發(fā)現(xiàn)以后,能夠知道DNA分子上四種堿基的順序就成為了一個(gè)新的熱點(diǎn)。于是,繼蛋白質(zhì)和RNA測序之后,又出現(xiàn)了DNA
測
序
。十自1977年出現(xiàn)DNA測序技術(shù)至今,第
一
代
測
序
技
術(shù)第
二
代
測
序
技
術(shù)第
三
代
測
序
技
術(shù)十(1)測序技術(shù)的出現(xiàn)及第一代測序技術(shù)1)測序技術(shù)的出現(xiàn)1975年,
Sanger
和Coulson
發(fā)明了“加減法”測定DNA序列;
1977年,又引入ddNTP,發(fā)明了雙脫氧終止法;1977,Maxam
和Gilbert發(fā)明了化學(xué)降解法測定DNA序列。十DNA題合牌4Klenaw)dNTP1
物—CH?O
t(A..G.T-)H
H
ddNTP一CH?O
R&(A.C.G.T.)H
HddNTPFig1.
雙脫氧終止法測序①T
T②ACG
T
A
A
A
TCGAT
ACG
TAA
G
A之
應(yīng)
應(yīng)ACGT
A
A
T
C
aA
C
A
dd
Add.AddA
1dd
AddATPddCTP
ddGTP
ddTTP己ddATP
ddCP
ddGTp
ddT
TP模極DNA標(biāo)
記
引物十ToTTeoTTtoaTDNAH〇2)第
一
代
測
序
技
術(shù)傳統(tǒng)的化學(xué)降解法、雙脫氧鏈終止法以及在它們的基礎(chǔ)上發(fā)展來的各種DNA測序技術(shù)統(tǒng)稱為第一
代DNA測序技術(shù)。第一代測序技術(shù)在分子生物學(xué)研究中發(fā)揮過重要的作用,如人類基因組計(jì)劃主要基于第一代DNA
測序技術(shù)
。十目前基于熒光標(biāo)記和Sanger
的雙脫氧鏈終止法原理的熒光自動(dòng)測序儀(如ABI
3730XL)仍被
廣泛地應(yīng)用。雜交測序技術(shù)也是第一代測序技術(shù),但是并非基于以上兩種原理。速度快,但是誤差大。十Fig.2ABI
3730XL十(2)第二代測序技術(shù)后基因組時(shí)代亦即功能基因組時(shí)代的測序技術(shù),顯著特征
是
高
通
量、
低成
本
。主要包括羅氏454公司的GS
FLX測序平臺、Illumina
公司的Solexa
Genome
Analyzer測序平臺和ABI公司的SOLiD測序平臺。十Fig.3Roche454GSFLX
平
臺十m;cnd
PRm=FAB+PCR
Reagents
*Emulsion
olBreakmicrocextorsate
DMA
sontainng
be
adsGensrate"waterin-oil'*mulsionmiero
e3ctorsPertermemuision
PCRCapture
beadswthinmiao-L**40NAbead
into
PeermerPie**a
dapterEadaptarAnneal
ssDA
Captuetemplate
te
EeadsL*Bd
fntyme*XXreadorsHprldormif
BSSDNA
LDray又又isol889AFig.4
lluminaSolexa
平
臺十Extend
first
base.read,and
deblock中
e
r
ve↓<
Generate
base
calsandaboextend
stpeat
steptoRFragmentDNARepair
ends◎
Solect
ligated
DNAAddA
overhangO
Ligate
adapters3
SEQUENCING1-3days
single-read
run30minutes
hands-on
time8
po
(
n
amplernu96eltoerflowanes,uPlG
Attach
DNA
to
flow
celllGPorform
bridge
amplifcationGenerate
clustars
LIBRARY
PREPARATION6houms3
hours
hands-on
time2
CLUSTERGENERATION
4
hours30minutes
hands-on
timeCD—+3-7days
Paired-end
run4Annealprimersequencing↓△十,→Fig.5
ABISOLiD
平臺十Raad
Position0123S6T910111212151617e192021222242526272829381
Unnereal
sog
primer
(n)3er2Univogal
*9primor
in-1
TrrnTmrT)Univorsal
seq
pnmar
(n-2)
3errret4Unversal
seq
prmar(n-3)3
mmmsUnwersal3seq
prmer
ln-4)rrrrm3-
#e:s
C--=Primr35Adap'ar3”,Baad
—5.aIndfcareaponitionaofintenogatknLigatkonCreie?寫3,Baad-—5SaquengeTamydyteSanueneeSequencelenplteSecueneeCHeavage-*mGT5
和的
中
的
的第2E06…101056……83Tonplite
Sequanca-
3'-C-AH0-0-GT山忙SaquanoePrinwerAdageerAdapter貌
猶noPPnmerBead分-FEm-333測
序
技
術(shù)454SolexaSOLiD上
市
時(shí)
間200520072007價(jià)
格
(
萬
美
元2
0
0
7
年
)504.559單次反應(yīng)數(shù)據(jù)量(G)0.42050讀
長
(
b
p
)40050×250優(yōu)
勢長
讀
長低
測
序
成
本
,
高
性
價(jià)比高
通
量
,
高
準(zhǔn)確度參考
文
獻(xiàn)
:DNA測序技術(shù)的發(fā)展歷史與最新進(jìn)展,解增言等
; DNA測序技術(shù)發(fā)展及其展
望
,孫
海
汐
等
。表
1
三種第二代測序技術(shù)對比(3
)
第
三
代
測
序
技
術(shù)以
單
分
子
測
序
為
特點(diǎn)
;如:
BioScienceCorporation的HeliScopeSingleMolecular
Sequencer;
Pacific
Biosciences的SingleMoleculeRealTime(SMRT)DNAsequencingtechnology(正在研制);Oxford
Nanopore
Technologies
Ltd的納米孔單分子測序技術(shù)。中科院北京基因組研究所,2013年,第一
臺國產(chǎn)樣機(jī)十3.
測
序
技
術(shù)
與
比
較
基
因
組
學(xué)4.
DNA測序已經(jīng)成為分子生物學(xué)研究中一
種基本的研究手段與工具,對于這種手段的需要也
已經(jīng)極大地促進(jìn)了DNA測序技術(shù)的進(jìn)步與發(fā)展。5.
在此基礎(chǔ)上,將會有更多的生物的全基因組序列被測定,那么針對任何一種生物的比較基
因組學(xué)研究將會變得更加簡單。十沒
大
譬基因組序列分析的計(jì)算方法1.
引
言2.
點(diǎn)
陣
圖3.兩
序
列
比
對4.多序
列
比
對5.數(shù)據(jù)庫搜索朱
琳十人類基因組計(jì)劃(
HGP)遺傳圖、物理圖、序列圖和轉(zhuǎn)錄圖區(qū)分兩個(gè)概念:同源性---------共同的祖先相似性---------定量特征高度相似很可能是同源序列;相似性很低的序列也可能具
有同源序列引言十ACTGTTAGAOCOTQ⊙⊙T⊙⊙⊙TQ⊙○A⊙G⊙C⊙點(diǎn)陣圖A
C
T
G
T
T
A
GI
l
HA
C
T
-
T
T
A
G面臨的問題:進(jìn)化的過程中同源序列可經(jīng)過多次的插
入或缺失,導(dǎo)致它們長度不同,這就給比對
帶來了麻煩。要解決的問題:最優(yōu)比對算法-----尋找最佳的缺失方式使比對序列的相似度達(dá)到整體最大兩
序
列
比
對十Needleman-wunsch全
局
比
對
算
法首先構(gòu)建具有m行n列的矩陣M,
根據(jù)殘基配對的函數(shù),給每個(gè)矩陣單元格賦值,將矩陣初始化。再進(jìn)行變換操作,
規(guī)則是將某單元格右下方路徑中的最大值疊加到該單元格即M(I,j)=M(I,j)+max[M(i+1,j+1);M(i+1,j+2,...,jmax)-gappenalty;M(i+2,.,imaxj+1)-gap
penalty]使用最簡單的打分系統(tǒng)進(jìn)行比對,殘基相同時(shí)分值是1,
不同時(shí)分值為0,空位罰分。此外還有Smith-waterman
算法十基因組比對只能對序列密切相關(guān)或非常相似的基因
組比對,序列太長,既有的算法無能為力方法:suffix
tree
數(shù)據(jù)結(jié)構(gòu)軟件MUMer
能找出兩個(gè)基因組的DNA序列
上最大且唯一的匹配區(qū)域,然后除去序列中用Smith-waterman
最佳局部比對算法對大量插
入序列、重復(fù)序列、短變異區(qū)域進(jìn)行局部鑒定時(shí)插入的空位,完成這兩個(gè)基因組序列的比對。十三條或多條序列的同時(shí)比對是序列的分析中最常用的技術(shù)之一。通過一系列同源序列的全局比對來實(shí)現(xiàn)的遞進(jìn)法:
基本思想是同源序列與系統(tǒng)發(fā)育相關(guān)。具體步驟:1、比對所有可能的序列對。2、用相鄰連接法使用兩兩比對的相似度分值構(gòu)建(tree)。
3、
這種樹用于指導(dǎo)遞進(jìn)的多序列比對。多序列比對十DGenomeAnalysesGBGenomeinfomation
brakerGIB-VGB
far
WrusesGTPSRearnotaticn
pf
bacterial
genomes
using
a
nen
oammonprotocolGTOPGenometopratein
structure
and
functimDNextGererationSequenceAnalysisDDBJ
ReadAnnotation
PipelineHish-trro.ehputdataaralysisafnexteeneraticnseq.ence
eta
(Login
D
is
requirsd)getentryData
retrieual
by
aocess
on
numbers,etc.ARSAAll-TourdRetrievalofSequence
and
AmotatinIXSearchRetrieval
of
unified
taocromg
datataseBLASTHomologySearchDDBJVectorScreeningSystem】PhylogereticsClustalWMultple
alenment
and
Tree-making數(shù)據(jù)庫搜索Ddtabases
ToolsENAHomBEMEL-Bank
HomeAoasSDocumentalion1NewsSubmissiorPublicalionsn
PeoplemContactEMBL
FetchFechanEMBL
recond
byidGo三大核酸數(shù)據(jù)庫:GenBank、
EMBL、
DDBJResourcesNCB
HomeA
Resources(A-Z)Chemicals8
BipassasData&SotwseDNA8RNADomains&StucuresGenes8
Eypression
Geneics
&MedaneGenomes8WapsHomologrLteraturePrateinsSequenceAnalysisTavnampTrairing&TutoriasAccessionDNf
FroteinAllDesIaxonomrSiteSearchAccessionnumbersGo@oveJ
unFrotOrceOovoOrre
FNent
>>mseFTP/WebAF]
Repart/Statistics
Cantact
Le
)
naneseSequenceRDATAEEioSysterDaiGenBankThethe
the
adThecatInfuenzaPresetputEB|>EMThe
EEuno;
sequsequThe
t
the
D
TepordailyUefAputThe
Eby旦8NCBINaiorslCemterfarBiotedhnolbgy
htormaticnen
Rest
Q
Cheus.DDBJDNA
Data
Bank
ef
JapanALDatanasesNCB
ResoucsHOMESubmissicnHowtollseEntarTaxtHereHwToHOME>Search
and
AralysisBLBSearch/Analysis思能
SDatabaseSearchSearh
Al
Daiatast數(shù)據(jù)庫搜索使用的最廣泛的算法:FASTA算法和BLAST算法。FASTA算法運(yùn)用一種包括四個(gè)連續(xù)階段的
啟發(fā)式方法來檢測被查序列與一組序列是相
似性
。BLAST
算法采用非??斓乃惴▉聿檎覕?shù)據(jù)
庫中與預(yù)查詢序列最相似是序列?;舅枷?/p>
是:兩個(gè)同源序列即使有很大的差異,也有
可能共有高分值的相似片段,這使我們可以理解可靠的區(qū)分相關(guān)和非相關(guān)的序列。十蛋白質(zhì)序列分析對新蛋白質(zhì)序列進(jìn)行分析的第一步是用BLAST進(jìn)行數(shù)
據(jù)庫搜索?!袢绻忻黠@相似性可以推測其序列的功能●如果沒有,可用模式識別方法根據(jù)特定的結(jié)構(gòu)域或蛋白
質(zhì)家族的特征進(jìn)行搜索。-----模式數(shù)據(jù)庫已經(jīng)成為識別新序列的特
定功能活性的重要工具。
InterPro數(shù)據(jù)庫是最重要的蛋白
質(zhì)模式數(shù)據(jù)庫之一。十此外還有·蛋白質(zhì)信號肽的識別及亞細(xì)胞定位的預(yù)測
·預(yù)測卷曲螺旋和螺旋-轉(zhuǎn)角-螺旋結(jié)構(gòu)·蛋白質(zhì)折疊的識別與分類等十沒火譬種內(nèi)比較基因組學(xué)
模式生物姜南十·種內(nèi)基因組的比較·同種群體內(nèi)基因組存在大量的變異和多態(tài)性,正是這種基
因組序列的差異構(gòu)成了不同個(gè)體與群體對疾病的易感性和
對藥物與環(huán)境因子不同反應(yīng)的遺傳學(xué)基礎(chǔ)。十·
我總結(jié)了:·凡是能夠用來研究同一種群內(nèi)兩個(gè)個(gè)體基因組的不同的分
子手段都屬于種內(nèi)比較基因組學(xué)的范疇?!ぶ髁鞣椒ㄊ欠肿訕?biāo)記技術(shù):RAPD,RFLP,AFLP
,基因芯片。。。·
回顧分子標(biāo)記十水
產(chǎn)
界
舉
例·李太武老師等用20
條隨機(jī)引物對皺紋盤鮑、雜色鮑進(jìn)行
RAPD分析,結(jié)果均能產(chǎn)生清晰可重復(fù)擴(kuò)增產(chǎn)物,計(jì)算出各
群體擴(kuò)增位點(diǎn)的多態(tài)性比例分別為43.66%和53.05%,
群
體平均遺傳雜合度分別為0.1557
和0.1686,
群體間的遺傳
距離0.2898,
表明皺紋盤鮑與雜色鮑的親緣關(guān)系較遠(yuǎn)。十模
式
生
物·基因進(jìn)化上的保守往性和遺傳密碼的通用性,從某一生物
得到的有關(guān)基因性質(zhì)或功能方面的信息往往也適用于其他
生
物。·個(gè)體小,易操作,易培養(yǎng),繁殖快?!げ《荆竽c桿菌,酵母,線蟲,果蠅,斑馬魚,小鼠,擬
南芥十
沒火譬種間比較基因組學(xué)研究馬壽光黃繼十通過對不同親緣關(guān)系物種的基因組序列進(jìn)行
比較,
能夠鑒定出編碼序列、非編碼調(diào)控序列
及給定物種獨(dú)有的序列。而基因組范圍之內(nèi)的
序列比對,可以了解不同物種在核苷酸組成、
同線性關(guān)系和基因順序方面的異同,進(jìn)而得到
基因分析預(yù)測與定位、生物系統(tǒng)發(fā)生進(jìn)化關(guān)系
等
方
面的
信
息
。十·1
全
基因組的比較研究·
2系統(tǒng)
發(fā)
生的
進(jìn)
化
關(guān)系
分
析十·比較基因組學(xué)的基礎(chǔ)是相關(guān)生物基因組的
相似性。兩種具有較近共同祖先的生物,它們之間具有種屬差別的基因組是由祖先
基因組進(jìn)化而來,兩種生物在進(jìn)化的階段
上越接近,它們的基因組相關(guān)性就越高。如果生物之間存在很近的親緣關(guān)系,那么它們的基因組就會表現(xiàn)出同線性(synteny),
即基因序列的部分或全部保守。1.全基因組的比較研究十·
Synteny可以
這
樣
假
設(shè)
,
人
與
小鼠
或
其
它
哺
乳
動(dòng)
物有一個(gè)共同的祖先,在漫長的進(jìn)化中,
染色體發(fā)生斷裂,重排,加上基因內(nèi)部的
變
化,
成
為
各
種
不
同
的
物
種
。
但
是
未
發(fā)生斷
裂
重
排的
完
整
片
段內(nèi)
部的
基因
組
織和連鎖順序在不同的物種中保持不變,這就是synteny,是
基因組比較作圖
的
基
礎(chǔ)
所
在
。十·在各種不同的物種中,絕大多數(shù)的核心生物功能是
由相當(dāng)數(shù)量的orthologous蛋白承擔(dān),所謂or-thologous蛋白就是一些在不同物種中有共同祖先
的蛋白質(zhì)。在不同的物種中這些蛋白的數(shù)量十分
相似,它們主要是在生物體中執(zhí)行中介代謝,DNA,RNA
代謝,蛋白折疊,trafficking,和降解的
功能。在較為復(fù)雜的生物中,隨著功能不斷地復(fù)雜,
就會出現(xiàn)許多蛋白以執(zhí)行其復(fù)雜的功能,而維持最
基本生命活動(dòng)的蛋白是保守的。兩種物和中蛋自
總數(shù)上的差別是由承擔(dān)各自特有任務(wù)的蛋白數(shù)目的不同而造成的。十·
可以
利
用
模
基因
組
之間
編
碼
順
序
上
和
結(jié)
構(gòu)
上的同源性,通過已知基因組的作圖信息
定位另外基因組中的基因,從而揭示基因
潛在的功能、
闡明物種進(jìn)化關(guān)系及基因組
的內(nèi)在結(jié)構(gòu)。十·人類與多個(gè)靈長類動(dòng)物的比較基因組學(xué)研
究,在闡明靈長類特異基因調(diào)節(jié)元件和劃
分多基因的外顯子方面顯示出了很大的優(yōu)
勢
?!ち帜究膳c擬南芥(已經(jīng)獲得了全基因組序
列,
一些基因的功能已被注釋)和毛果楊
等功能基因組研究較深入的物種進(jìn)行比較
基因組學(xué)研究,這將為林木上相關(guān)基因功
能的研究提供便利。十·生物最本質(zhì)的特征是進(jìn)化,
比較基因組學(xué)同樣以進(jìn)化理論作為理論基石,
同時(shí)其研究結(jié)果又前所未有地豐富和發(fā)展了進(jìn)化理論
?!ぎ?dāng)在兩種以上的基因組間進(jìn)行序列比較時(shí),
實(shí)質(zhì)上就得到了序列在系統(tǒng)發(fā)生樹中的進(jìn)化關(guān)系?;蚪M信息的增多使得在基因組
水平上研究分子進(jìn)化、基因功能成為可能。2.
系統(tǒng)發(fā)
生
的進(jìn)
化
關(guān)
系
分
析十·通過對多種生物基因組數(shù)據(jù)及其垂直進(jìn)化、
水平演化過程進(jìn)行研究,就可以對與生命
至關(guān)重要的基因的結(jié)構(gòu)及其調(diào)控作用有所
了解。但由于生物基因組中約有1.5%~
14.5%
的基因與“橫向遷移現(xiàn)象”有關(guān),
即基因可以在同時(shí)存在的種群間遷移,這
樣就會導(dǎo)致與進(jìn)化無關(guān)的序列差異。十·
橫向遷移現(xiàn)象·對人類基因組的分析發(fā)現(xiàn),有幾十個(gè)人的
基因只
與
細(xì)
菌
基因
相
似,
而
在
果
蠅、
線蟲
中都不存在。如果以人的這些基因序列來
研究進(jìn)化將會得到荒謬的結(jié)論。所以在當(dāng)
前的分子進(jìn)化研究中必須選擇垂直進(jìn)化的
分子作為樣本。并且在系統(tǒng)發(fā)生分析中需
要建立較完整的生物進(jìn)化模型,以避免基
因轉(zhuǎn)移和欠缺合適的多物種共有保守序列
的
影響
。十·
Z
曲線的GC
輪廓圖方法·基因組序列變換為等價(jià)的三維空間曲線——Z
曲
線,經(jīng)過適當(dāng)?shù)耐队昂妥鶚?biāo)旋轉(zhuǎn)后得到Z’曲
線,后者又稱為累積GC
輪
廓
圖(
CumulativeGCprofile)
。定
義:在基因組某一堿基處的G+C含量正比于Z’曲線在該點(diǎn)切線的斜率。而在某一窗
口中的平均G+C含量則正比于此量在該窗口內(nèi)的
定積分
?!τ谌我唤o定的DNA
序列,有唯一的一條Z
曲線
與之對應(yīng);反之,給定一條Z
曲線,它所代表的
DNA
序列可以唯一地導(dǎo)出。因此,
Z曲線攜帶了
DNA
序列的全部息。對兩個(gè)基因組或染色體序列
的比較,可以通過對它們所對應(yīng)的Z曲線的比較
來進(jìn)行?!ぴ谘芯课锓N間的進(jìn)化關(guān)系時(shí),傳統(tǒng)的分子進(jìn)化研究方法一
般選取一個(gè)大分子(如16SRNA)
的序列為標(biāo)準(zhǔn),研究其在各個(gè)物種同源序列之間的差異,并以此構(gòu)建進(jìn)化樹。但
是
一個(gè)物種的基因組編碼了成千上萬個(gè)序列,以其
中一個(gè)序
列的差異來代表整個(gè)生物體的差異是不全面的。因此,從
全基因組的水平來研究生物的進(jìn)化應(yīng)該更為合理。利
用
較基因組學(xué)的方法在基因組水平上構(gòu)建的進(jìn)化樹將會更加合理的闡述物種之間的進(jìn)化關(guān)系。十·物種序列的優(yōu)化選擇:當(dāng)在比較
40~80
My
進(jìn)化距離的DNA
序列時(shí),其編碼序列與一
些
重
要
的
非
編
碼
序
列
將
是
保守
的,如人與鼠。然而至今在這一進(jìn)化距離內(nèi)保守的非編碼序
列中只有少數(shù)被鑒定為有特征性的功能元件,其它的僅被認(rèn)
為是臨近或
200
kb
附近基因的轉(zhuǎn)錄調(diào)控元件。在進(jìn)化距離
較遠(yuǎn)(
450
My)
的序列比較時(shí),將主要揭示保守的編碼序刻
主要是因?yàn)榈鞍踪|(zhì)要維持其功能,因此對替換更為嚴(yán)謹(jǐn)保需進(jìn)化的稍慢一點(diǎn)。所以在建立多序列比較時(shí)加入一支稍遠(yuǎn)的物種序列(
450
My
)將提高保守序列的鑒別能力。比較分析較近的物種序列如:人與himpanzees或與其它的類人
猿可以用來鑒定在近期進(jìn)化史上發(fā)生的基因改變和重組等。
因此在建立多序列的比較分析中加入一支近距離的物種序
列不僅有助于編碼和非編碼的功能序列的譚制,也能揭示那
些相關(guān)物種特征的基因組信息、十·在進(jìn)行
DNA
序列比較而鑒定保守序列時(shí),有兩種比較分析手段:局部比對和整體比對。局部比對是對序列亞區(qū)分析獲得最高一致性的計(jì)算方法,其基本原理是在兩序列排隊(duì)時(shí)采用不同的比對方法,排除了從頭到尾的單一匹配方式。例如當(dāng)兩長序列進(jìn)行匹配時(shí),可能內(nèi)含的同源基因亞區(qū)的排列順序或基因的走向不同,因此對這種比對采用多種方式進(jìn)行搜索分析的結(jié)果將比較準(zhǔn)確,常用的分析工具是PipMarker服務(wù)器。整體比對是尋找所要比較的整個(gè)基因序列上的最大的同源性分值,它適用于高度分化但組織結(jié)構(gòu)同源的序列比對,整體比對適用于基因序列整體上同源性較高的比較分析,如保守片斷(
conserved
segments)的比對,可以使用
VISTA
進(jìn)行分析。十Smith-Waterman算法時(shí)間復(fù)雜度O(n2);·Sij
=maxof(xi,yj)左到右)
上到下)·本例中:gap:d=12
,線性罰分模型。十例
5:
Smith-Waterman
算
法進(jìn)行雙序列局部
比對·
兩
條
序
列
如
下
:工
D
SCHG
ES工C
K□目標(biāo):使用局部優(yōu)化算法尋找比對的結(jié)果十例
5
:Smith-Waterman
算
法進(jìn)行雙
序
列
局
部比對·兩條序列如下:工
D
S
C
HG
E
S
工C
K□目標(biāo):使用局部優(yōu)化算法尋找比對的結(jié)果十Smith-Waterman算法Gap
L
D
S
CHGap0
0000G
0E
0
Smith-Waterman算法;S
0
Dij
=
max
oiL0C
0K
0十GapLDSCHGap00000GOE0S0L0C00Smith-Waterman算法GapLDSCHGap0O0G0E0SOL0C00Smith-Waterman算法GapLDSCHGap0000OOGO00000E00200OSO02○OOL04O50C0010920O008Smith-Waterman算法GapLDSCHGap00O0O0GO00000E00200SO06OLO4O50C0O12K0O0O8
局部比對結(jié)果:
工
D
S
C
H
G
ES
工C
K局就代化比對。十二·
中性突變與隨機(jī)漂移學(xué)說的核心就是認(rèn)為大部分對生物種群的遺傳結(jié)
構(gòu)與進(jìn)化有貢獻(xiàn)的分子突變在自然選擇的意義上都是中性或近中性的,
因而自然選擇對這些突變并不起到篩選的作用。中性突變產(chǎn)生后是通
過一代一代的隨機(jī)漂移,或者被固定在種群中并占有一定的比例,或者消失。
生物種群內(nèi)的遺傳多樣性,如蛋白質(zhì)(酶)以及DNA的多態(tài)
性,都是通過這類中性或近中性突變的隨機(jī)漂移而產(chǎn)生的。中性理論并不是說所有突變都是中性的,實(shí)際上,相當(dāng)大的一部分突變是有害
的,這一部分突變具體有多少與有關(guān)分子本身可容許的變化程度有關(guān)。
有害的突變產(chǎn)生后,會影響攜帶這些突變的蛋白質(zhì)以及基因的正常功能,影響生物的生存與繁殖,因此很快就會被淘汰掉,從而在進(jìn)化上是沒有意義的。另一方面,對生物有利的所謂正突變其實(shí)是很少的,從而對種群的遺傳結(jié)構(gòu)也沒有什么貢獻(xiàn),不能說明分子進(jìn)化中的多態(tài)
性現(xiàn)象。
自然選擇只對那些對種群的遺傳結(jié)構(gòu)并不重要的有變和
正突變起作用,卻不能決定對種群的遺傳結(jié)構(gòu)起重要作用的中性或近
中性突變的命運(yùn),中性或近中性突變的命運(yùn)是面隨機(jī)因素決定的。因此,又可以把中性理論看作是一種“幸運(yùn)者生存”的學(xué)說。1
·
3從模式生物基因組研究中得出一些規(guī)律·
3.1模式生物基因組一般都比較小,但是編碼基因的比例較高,重復(fù)順序和非編碼順序較少,是一些“壓縮”的基因組·
3.2模式生物基因組的G+C%比較高同時(shí)
CpG
島的比例也比較高。Fugurubripes的G+C
%時(shí)44·2%(這是脊椎動(dòng)物種最高的),而人類則是
40·3%。這可能是因?yàn)榈偷壬镏芯幋a順序的比例比較高,另一個(gè)原因
與模式生物的密碼子第三位的堿基選擇有關(guān)?!?/p>
3.3模式生物的基因組中,內(nèi)含子和外顯子的結(jié)構(gòu)組織比較保立勇切應(yīng)
點(diǎn)在多種生
中
一致。這是Fugu
rubripes和現(xiàn)有的哺乳動(dòng)物的基因組
順序比較的結(jié)果·
3.4在幾種模式生物都發(fā)現(xiàn)了重復(fù)(duplication)。
同時(shí)存在兩份或兩份以上的順序一致或十分相似的編碼蛋白的DNA
順序,稱為冗余。理解
重復(fù)的真正本質(zhì)是闡明基因組中基因生物功能和物種進(jìn)化的前提。·
3.5生物體的復(fù)雜性一般表現(xiàn)在“生物學(xué)”的復(fù)雜性,與基因組的
C
值
大小及基因數(shù)量未必一定呈線性關(guān)系。十·首先比較基因組學(xué)建立的基礎(chǔ)是功能元件由于選擇的作用
其進(jìn)化的速率稍慢一點(diǎn),這有背于中性理論;其次在序列的
比較中對保守區(qū)域的thresholds(length
and
percentidentity)的選擇還沒有一套有效的方法,往往兩個(gè)物種不
同區(qū)域的thresholds
各異十比較基肉組學(xué)的應(yīng)用揭
示
非
編
碼
功
能
序
列發(fā)
現(xiàn)
新
基
因發(fā)現(xiàn)功能性SNP闡述物種間的進(jìn)化史闡
明
人
類
疾
病
過
程
的
分
子
機(jī)
制李春麗十古細(xì)菌---產(chǎn)甲烷球菌●
與原核生物共同之處:1染色體組織與結(jié)構(gòu):環(huán)狀基因組、基因的操縱子結(jié)構(gòu)等
2能量產(chǎn)生和固氮基因與細(xì)菌基因有很高的同源3與細(xì)胞分裂有關(guān)的蛋白質(zhì)、20多個(gè)編碼無機(jī)離子運(yùn)輸?shù)?/p>
白的ORF與細(xì)菌基因同源4調(diào)控模式類似于原核生物●
與真核生物共同之處:1
細(xì)胞遺傳信息傳遞,尤其是轉(zhuǎn)錄和翻譯系統(tǒng)
2分泌系統(tǒng)●說明該細(xì)菌與真核生物親緣關(guān)系較近。比較基因組學(xué)與進(jìn)化十·
比較基因組學(xué)提供的結(jié)果表明,在進(jìn)化系統(tǒng)樹上,
古細(xì)菌與真核生物親緣關(guān)系比原核生物更近?!?/p>
自養(yǎng)生物的三個(gè)分支,細(xì)菌、古細(xì)菌和真核
生物中,細(xì)菌的分化發(fā)生較早。比
較
基
因
組
學(xué)
與
進(jìn)
化十比
較
基
因
組
學(xué)
的
具
體
應(yīng)
用
方
法
和
策略·序列的比對分析·
確定基因組序列的進(jìn)化關(guān)系·基
因
共
線
性synteny:·染色體片段的分析·物種序列的優(yōu)化選擇·
對DNA
序列的信息注釋◎
比較基因組學(xué)研究舉例·
原核模式生物比較基因組學(xué)·
釀酒酵母基因組·
人類基因組十@
模
式
生
物
比
較
基
因
組
研
究
特
點(diǎn)●1模式生物基因組一般都比較小,但編碼基因的
比例較高,重復(fù)序列和非編碼序列較少,是
“壓
縮”的基因組。●2模式生物基因組中G+C%
含量高,同時(shí)CpG
島
的比例也比較高?!?/p>
3一些模式生物,特別在人的基因組中發(fā)現(xiàn)了重
復(fù)
?!?各種不同的物種中,大多數(shù)重要生物學(xué)功能是
由相當(dāng)數(shù)量的同源序列基因蛋白承擔(dān)。●
5同線(syn
teny)連鎖的同源基因在不同物種基因
組中有相同連鎖關(guān)系。十@模
式
生
物
基
因
組
的
研
究●尿殖道支原體是已知最小的基因組0.58Mb
,由此可能確
定能自我復(fù)制的細(xì)胞必需的一套最少的核心基因?!?/p>
流感嗜血桿菌的基因組為1.83Mb流感嗜血桿菌基因大小平均900
bp,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)運(yùn)營效率與策略研究
- 三農(nóng)村危房改造工作指南
- 綜合農(nóng)業(yè)可研報(bào)告
- 三農(nóng)產(chǎn)品品牌打造作業(yè)指導(dǎo)書
- 軟件行業(yè)項(xiàng)目可行性分析報(bào)告
- 裝配式建筑設(shè)計(jì)規(guī)范
- 農(nóng)業(yè)產(chǎn)業(yè)鏈延伸發(fā)展策略手冊
- 光伏發(fā)電太陽能工程
- 環(huán)保產(chǎn)業(yè)園區(qū)可行性研究報(bào)告
- 項(xiàng)目籌備及執(zhí)行計(jì)劃書
- 塑膠模具進(jìn)度表
- ISO∕IEC 42001-2023《信息技術(shù)-人工智能-管理體系》之17:“8 運(yùn)行”解讀和應(yīng)用指導(dǎo)材料(雷澤佳編制-2024A0)
- 智能化倉儲冷庫項(xiàng)目可行性研究報(bào)告
- 缺血性視神經(jīng)病變課件
- 第二課 讓美德照亮幸福人生(課時(shí)3)(課件)-【中職專用】中職思想政治《職業(yè)道德與法治》高效課堂課件+教案(高教版2023·基礎(chǔ)模塊)
- 《工程建設(shè)標(biāo)準(zhǔn)強(qiáng)制性條文電力工程部分2023年版》
- 《混凝土板樁支護(hù)技術(shù)規(guī)程》
- 2024年重慶市公安局輔警招聘筆試參考題庫附帶答案詳解
- 2024低溫液化氣體氣瓶充裝站安全技術(shù)條件
- 人教版六年級數(shù)學(xué)下冊全冊課時(shí)練分層作業(yè)
- 2021年10月自考00150金融理論與實(shí)務(wù)試題及答案含解析
評論
0/150
提交評論