Gene7-02從基因到基因組_第1頁
Gene7-02從基因到基因組_第2頁
Gene7-02從基因到基因組_第3頁
Gene7-02從基因到基因組_第4頁
Gene7-02從基因到基因組_第5頁
已閱讀5頁,還剩136頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Lecture2FromGenestoGenomes(7)Interruptedgenes(8)Introduction引言RestrictionendonucleasesareakeytoolinmappingDNA通過限制性內切作圖Howvariableareindividualgenomes?分子標記,分子標記作圖與應用(?)InterruptedGeneExonsequencesareconservedbutintronsvary

Genescanbeisolatedbytheconservationofexons

因在尺寸大小上分布廣泛53斷裂基因是如何發(fā)展進化的?58本講主要內容Introduction1993NobelRichardJ.RobertsandPhillipA.SharpGenomic2.2

RestrictionendonucleasesareakeytoolinmappingDNA

Wecanthinkaboutmappinggenesandgenomesatseverallevelsofresolution:

Geneticmap

Acytogenetic

Agenetic(orlinkage)mapidentifiesthedistancebetweenmutationsintermsofrecombinationfrequencies.

AlinkagemapcanalsobeconstructedbymeasuringrecombinationbetweensitesingenomicDNA.

Physicmap

ArestrictionmapisconstructedbycleavingDNAintofragmentswithrestrictionenzymesandmeasuringthedistancesbetweenthesitesofcleavage.

Transceiptionmap

TheultimatemapistodeterminethesequenceoftheDNA.Fromthesequence,wecanidentifygenesandthedistancesbetweenthem.A

restrictionmaprepresentsalinearsequenceofthesitesatwhichparticularrestrictionenzymesfindtheirtargets.Distancealongsuchmapsismeasureddirectlyinbasepairs(abbreviatedbp)forshortdistances;longerdistancesaregiveninkb,correspondingtokilobase(103)pairsinDNAortokilobasesinRNA.Atthelevelofthechromosome,amapisdescribedinmegabasepairs(1Mb=106bp).我們現(xiàn)在可以制作一個完整的5000bp區(qū)域圖譜。前面那長張圖顯示了特異的限制性酶切DNA的位置,這些切點的距離由堿基對進行測量。這樣DNA被分割成一系列由限制性酶決定的確定長度的區(qū)域,這些長度區(qū)域由限制酶切割。2.2RestrictionendonucleasesareakeytoolinmappingDNA

32.

Restrictionmapping5000bp長的DNA分子由兩個限制性酶A和B切成片段,而后DNA進行電泳。每一條片段的大小由已知大小的片段的位置來決定,如中部所示。酶A將DNA切成4段(長為2100,1400,1000,500pb),酶B切為3段(長為2500,1300,1200bp)。那么是否能根據(jù)這些數(shù)據(jù)制作一個圖譜,來顯示DNA分子的特定的斷裂點呢?雙單酶切做physicalmap真正構建限制性圖譜時需要許多酶,所以解決由各種各樣酶產(chǎn)生的十分復雜的覆蓋片段是十分必要的。許多更進一步的技術就用來構建圖譜。另一種方法是用部分(酶切)消化,通過在一些條件下,一種酶并不確認每一種DNA分子的目標切點而是不能在目標切點上進行切除。這種條件可以設置,這樣這種酶有一個特殊的可能性,例如,只切它所識位點的50%。單酶切也可實現(xiàn)作圖單酶切也可實現(xiàn)作圖應用單酶切不完全消化技術,酶A可能產(chǎn)生3500,3100,1400bp等的分裂片段,通過比較完全消化的部分產(chǎn)品,1000-2100bp片段可被認作3100bp部分片段的鄰近成分。同樣,2100,1400bp片段可被置于3500bp部分片段作為鄰近成分。這樣該技術允許單切酶切點按序排列。如果一種酶的兩個些切點離得非常近(比如,小于50bp),則所產(chǎn)生的非常小的片段就在瓊脂糖凝膠上丟失。當然,當其它片段的分子量相加時,這種情況會導致脫節(jié)。這個問題可以通過應用其他一些限制性酶來構建圖譜而被克服掉,所以用不同酶產(chǎn)生的片段中有總夠的覆蓋來保證所有的DNA都被包含進來。另一有用技術是末端標記,而DNA分子的末端用放射性P元素進行標記(一定的酶可將P單元特定地加到5`或3`端)。這允許了包含末端的片段由于放射標記而被識別。這樣在片段A準備中,A-1000,A-500將迅速置于圖譜兩端,片段B-1200,B-1300將被認為是末端片段。通過用末端標記技術比較部分酶切消化,一系列的由一種酶所確定的切點可以直接相對末端而在圖上做出來,圖2.4顯示了僅由它們放射性的標記末端而識別出的片段,那些分子內的切點被忽略掉,然后而一系列片段確定了距標記末端的每一個切點。如果圖6.4的左端5000bp片段被做上標記,酶A的部分斷裂將立即確定出距末段的1000,3100,4500bp切點。Figure2.4Whenrestrictionfragmentsareidentifiedbytheirpossessionofalabeledend,eachfragmentdirectlyshowsthedistanceofacuttingsitefromtheend.Successivefragmentsincreaseinlengthbythedistancebetweenadjacentrestrictionsites.2.2RestrictionendonucleasesareakeytoolinmappingDNA

1000,3100,4500bpDNA結構在不同種類的生物體內存在著相當大的差異隨著對基因及基因組認識的不斷深入,發(fā)現(xiàn)同種的不同個體之間,盡管其蛋白質產(chǎn)物的結構和功能完全相同或僅有微小差異,但在DNA水平卻存在著差異或明顯差異,尤其在不編碼蛋白質的區(qū)域以及沒有重要調節(jié)功能的區(qū)域表現(xiàn)更為突出。DNA順序上的大多數(shù)突變是中性突變,即不影響生物體的表型,因而過去長期對這些突變不太重視,也無法用傳統(tǒng)的遺傳學方法來研究。2.3Howvariableareindividualgenomes?個體基因組如何變化?(thoughHPG)Forexample,youandme與酶切有關(小基因組)分子操作技術的不斷發(fā)展,從DNA水平上直接分析生物體的突變成為可能。假如DNA順序中的某個堿基發(fā)生了突變,尤其是在某種限制性內切酶的位點(突變或缺失)。這樣,利用該限制性內切酶消化此DNA時,便會產(chǎn)生與正常不同的限制性片段。這樣,在同種生物的不同個體中會出現(xiàn)不同長度的限制性片段類型,即限制性片段多態(tài)性(RFLP)。其他的顯示DNA差異(多態(tài)性的)?分子標記構建高分別率遺傳圖譜(80年代,Botsein提出DNA限制性片段長度多態(tài)性(RFLP)可以作為遺傳標記,從此開創(chuàng)了直接應用DNA多態(tài)的新階段.90年代,DNA多聚酶鏈式反應(PCR)的發(fā)展,使直接擴增DNA的多態(tài)性成為可能,并在此基礎上產(chǎn)生了許多種新型分子標記,諸如擴增片段多態(tài)性(ALFR)、串聯(lián)重復序列(VNTR),RAPD是較為突出的一種.SNP單鏈構型多態(tài)性(PCR-SSCP)、序列特異擴增區(qū)域(SCAR).限制性片段長度多態(tài)性限制性片段長度多態(tài)性的分類RFLP分為兩類型:一類是由于限制性內切酶位點上發(fā)生了單個堿基突變而使這一限制性位點發(fā)生丟失或獲得而產(chǎn)生的多態(tài)性,故稱之為點多態(tài)性(pointpolymorphism

)。這類多態(tài)性實際上是雙態(tài)的,即有(+

)或無(-

)。另一類是由于DNA分子內部發(fā)生較大的順序變化所致。這一類多態(tài)性又可以分成兩類:第一類是由于DNA順序上發(fā)生突變如缺失、重復、插入所致。反映的是在RLFP多態(tài)

第二類是所謂“高變區(qū)”。高變區(qū)(highlyvariableregion),是由多個串聯(lián)重復順序組成的,不同的個體高變區(qū)內所串聯(lián)重復的拷貝數(shù)相差懸殊,因而高變區(qū)的長度變化很大,從而使高變區(qū)兩側限制性內切酶識別位點的固定位置隨高變區(qū)的大小而發(fā)生相對位移。所以這一類型的RFLP是由于高變區(qū)內串聯(lián)重復順序的拷貝數(shù)不同所產(chǎn)生的,其突出特征是限制性內切酶識別位點本身的堿基沒有發(fā)生改變,改變的只是它在基因組中的相對位置。即可反映在RLFP上,也可PCR擴增高變區(qū)DNA與DNA指紋人的衛(wèi)星DNA或稱隨體DNA是由一些短的DNA片段(10bp左右)多次重復所構成的。重復片段的組成和拷貝數(shù)在不同的個體及基因組的不同位置上不一樣。DNA指紋的圖譜取決于所用探針的核心序列(即重復序列中的重復單位)。目前所用的探針有兩種,即探針33.5。其核心序列為

AGAGGTGGGCAGGTGG,

33.6,即AGGGCTGGAGG。這就是說這兩種序列在人體基因組中不同的位置上分別重復不同的次數(shù),而在不同個體的基因組中,對應位置上這兩種核心序列的重復次數(shù)也不相同。這樣用這兩種探針之一與合適的酶切割的人體基因組DNA片段雜交,在不同的個體將得到不同的DNA指紋,而且探針33.5的DNA指紋圖也不相同。DNA指紋具有細胞穩(wěn)定性和種系穩(wěn)定性,是按孟德爾規(guī)律遺傳的,而且雜合性高。對于由點突變引起的RFLP,就某一個多態(tài)性切點來說只有兩種多態(tài)性,即切點有(+)或切點無(-)。而對由于高變區(qū)重復片段長度不同所引起的RFLP來說,在基因組上某一個位置核心序列的重復次數(shù)在不同的個體不一樣,比如在個體A為10個拷貝,個體B為15個拷貝,而個體C又可能為18個拷貝等等。因此,在不同個體同一個相應位置上核心序列的重復次數(shù)就是多態(tài)的,而不是雙態(tài)的。即使在基因組上的某一個位置處核心序列的次數(shù)一樣,從而被酶切出的長度相同,但在基因組的其他位置上該核心序列重復次數(shù)又可能不同。由于DNA指紋是按孟德爾規(guī)律遺傳的,子代的DNA指紋圖可以追溯到其父母DNA指紋圖上,而在不是其父母的DNA指紋圖上則很難找到與其一樣的小隨體DNA片段。在父親的5條可分辨的小隨體DNA片段中,有4條處于雜合狀態(tài),即這4條DNA片段有不同的個體長度。因此,因高變區(qū)核心序列重復次數(shù)不同引起的RLFP才是真正的多態(tài)性。在不同個體,這種RLFP即DNA指紋可以說不存在相同的。即使使用一種探針產(chǎn)生的DNA指紋圖無法鑒定這兩個個體,如再用另一種探針便有可能將這兩個個體區(qū)分開。DNA指紋技術已被應用于親子鑒定和法醫(yī)學上對罪犯的確認等領域。Haplotype(單元型,單倍型一條染色體或DNA分子的基因型)

istheparticularcombinationofallelesinadefinedregionofsomechromosome,ineffectthegenotypeinminiature.OriginallyusedtodescribedcombinationsofMHCalleles,itnowmaybeusedtodescribeparticularcombinationsofRFLPs.

豐富的多態(tài)性(或高頻率)意味著每個個體有獨特的限制性位點。在特殊區(qū)域發(fā)現(xiàn)的位點組合稱為單體型(Haplotype)。單體型概念最初用于描述主要組織兼容性座位(編碼在免疫系統(tǒng)中很重要的蛋白質區(qū)域,見第24章)的遺傳組成?,F(xiàn)在延伸到描述基因組限定區(qū)域的等位基因或限制性位點(或者任何其他遺傳標記)的特殊組合。

(個體某些位點或基因的組成)

2.3Howvariableareindividualgenomes?個體基因組如何變化?SNP

(singlenucleotidepolymorphism)isanysiteatwhichasinglenucleotidehaschangedwhentwo(haploid)genomesarecompared.SNPsandHaplotypesASingleNucleotidePolymorphism(SNP),pronouncedsnip,is

asingleDNAbasevariationobservedinthehumanpopulation.AhaplotypestandsforasetoflinkedSNPsonthesamechromosome.SNP1SNP2SNP3-ACTTAGCTC--AATTTGCTC--ACTTTGCTT--ACTTTGCTC-Haplotype2Haplotype3CACATCCTTHaplotype1SNP1SNP2SNP3Haplotype4CTCSNP,RLFP,VTRP實際上,在DNA順序中,存在著大量的單個堿基的替換,但用通常所用的技術只能檢測出影響到限制性內切酶識別位點上的突變。不同的多態(tài)性切點在一特定人群中出現(xiàn)(+)的頻率不一樣。一段DNA,切點A=0.6(即60%的人含有該切點,而另外40%的人在同一位點處不含該切點);切點B=0.4。隨機:A、B同時存在(++)0.6×0.4=0.24,即24%的人同時含有A、B兩個切點。非隨機相關的,那么同時存在的可能性將和預期的頻率相差較大。這種相關的非隨機性稱為:連鎖不平衡。n,2n組合,每種組合稱為一種單元型,每種單元型隨機相關的預期出現(xiàn)頻率為各個位點頻率乘積。但是,實踐證明多態(tài)性切點之間并非隨機相關。例如,在β珠蛋白基因簇內多態(tài)性切點2到9共8個,理論應有28=256種組合,即256種單體型。但實際上有3種單體型在希臘、意大利和亞洲印度人βA染色體(攜帶正常β-珠蛋白基因的染色體)中就有94%,而有些理論上的組合在實際上卻是不存在的。在理論上,單體型(從切點2到9)的頻率為0.46×0.48×0.7×0.27×0.83×0.52×0.37×0.32=0.0021,而實際上該單體型的頻率為0.64,兩者相差甚大。這說明各個多態(tài)性切點之間是非隨機相關的(連鎖不平衡)。Mappinghumangenesbylinkageanalyisis Physicaldist. Geneticdist.Chromosome1: 283Mb 270cM(0.95cM/Mb)qarmofchromosome21: 30Mb 62cM(2.1cM/Mb)Humangenome 3200Mb

3615cM(1.13cM/Mb)Femalegenome 4460cMMalegenome

2590cMLinkageequilibriumanddisequilibriumDA=Da=f(D)*f(A)or(a)dA=da=f(d)*f(A)or(a)DA=\=Da=\=f(D)*f(A)or(a)dA=\=da=f(d)*f(A)or(a)-Ratioformgeneticdistancetobasepairsrangefrom0.01cM/Mbto60cM/MbLinkageequilibriumanddisequilibrium90%ofallSNPsaresharedamongdisparatepopulationsAfricanpopulationshavesmallersblocks(average7.3kb)comparedwith16.3kbinEuropeanswhereastheChineseandJapaneseblockshaveanaveragesizeof13.2kb.

Whatdoyouusewiththesemarkers?CandidategeneanalysisBasedonpriorlocalizationinformationfromaffectedfamiliesGenome-widescan定位克隆輔助選擇疾病診斷。。。。。分子標記的重要作用:·為發(fā)現(xiàn)疾病提供了診斷過程。有些遺傳描述詳細但是分子機制描述困難的人類疾病很難診斷,如果一個限制性片段與表型可靠地相關,那么它的存在可用來診斷該種疾病,無論是在出生以前還是出生后?!榉蛛x基因提供依據(jù)。如果兩個位點很少或者從不重組,在遺傳圖譜中限制性片段應該距離基因相對很近。盡管遺傳中“相對很近”用DNA堿基對表示可能是有一定距離,但它提供了一個使我們沿著DNA找到基因的起點。RELPs在人類基因組內發(fā)生頻繁,對遺傳作圖是很有用。但HapMapCatalogofcommonhumangeneticvariationacrossthegenome“Common”wastakentomeanthatthemorerareallelewasinatleast5%ofthepopulation1MillionSNPsweregenotypedin269samplescomprising4populationsAssociationsbetweenSNPshavebeenidentifiedandcataloguedMarkerSelectionforWholeGenomeStudiesUsinginformationfromtheHapMap,itispossibletoselectasetof~300,000-600,000SNPsthatwillrepresentallvariationinthegenomeUsingarraytechnologies,itispossibletogenotypethismanySNPsatoncebasedonCommonDisease-CommonVariantHypothesisMultiplePopulationsTheDNAsamplesfortheHapMaphavecomefromatotalof270people.TheYorubapeopleofIbadan,Nigeria,provided30setsofsamplesfromtwoparentsandanadultchild(eachsuchsetiscalledatrio).InJapan,45unrelatedindividualsfromtheTokyoareaprovidedsamples.InChina,45unrelatedindividualsfromBeijingprovidedsamples.ThirtyU.S.triosprovidedsamples,whichwerecollectedin1980fromU.S.residentswithnorthernandwesternEuropeanancestrybytheCentred'EtudeduPolymorphismeHumain(CEPH).大量的SNP連鎖不平衡構成了豐富多態(tài)性ThehapMap(haplotypemapPost-genome確定限制性圖譜的突變點更困難一些。偶然它們將改變限制性酶的目標切點,但它們就保持不可探測性,因為限制性片段的在野生型和突變型保持著同樣大小。有時,探測通過它們對單鏈DNA較短的片段的移動的影響是可以探測其順序變化的,在一項叫作單鏈構型多態(tài)性(SSCP)的技術即可達到此項目的。但是在DNA更大區(qū)域內尋找堿基替代物時,決定核苷酸DNA的順序將非常必要了。聚合酶鏈反應-單鏈構象多態(tài)性分析(SingleStrandConformationPolymorphismAnalysisofPolymeraseChainReactionProducts,PCR-SSCP)是近年來發(fā)展起來的一種基因分析方法。

PCR-SSCP分析的基本程序為:首先PCR擴增特定靶序列,然后將擴增產(chǎn)物變性為單鏈,進行非變性聚丙烯酰胺凝膠電泳。相同長度的DNA單鏈其序列不同,甚至單個堿基不同,所形成的構象不同,電泳遷移率也不同。PCR產(chǎn)物變性后,單鏈產(chǎn)物經(jīng)中性聚丙烯酰胺凝膠電泳,靶DNA中含單堿基置換,或數(shù)個堿基插入或缺失等改變時,因遷移率變化會出現(xiàn)泳動變位,從而可將變異DNA與正常DNA區(qū)分開。PCR-SSCP分析技術是一種DNA單鏈凝膠電泳技術,該技術已被廣泛用于癌基因和抗癌基因變異的檢測、高分別率的分子標記遺傳圖譜Usingmicrosatelliterepeatsasmolecularmarkersformapping.Ahybridizationpatternisshownforafamilywithsixchildren,andthispatternisinterpretedatthetopoftheillustrationwiththeuseoffourdifferent-sizedmicrosatellite“alleles,”M′throughM′′′′,oneofwhich(M′′)isprobablylinkedincisconfigurationtothediseaseallele

P.

Fourallelesforarestrictionmarkerarefoundinallpossiblepairwisecombinations,andsegregateindependentlyateachgeneration.PhotographkindlyprovidedbyRayWhite.圖2.7限制片段長度多態(tài)性(RFLP)可以按孟德爾方式遺傳,四種等位基因在每代中獨立地分離,但圖中經(jīng)限制消化后所有Figure2.7RestrictionsitepolymorphismsareinheritedaccordingtoMendelianrules.Figure2.8

Arestrictionpolymorphismcanbeusedasageneticmarkertomeasurerecombinationdistancefromaphenotypicmarker(suchaseyecolor).ThefiguresimplifiesthesituationbyshowingonlytheDNAbandscorrespondingtothealleleoftheothergenomeinadiploid.

圖2.8可用限制酶多態(tài)性作為遺傳標記,測量兩個重組子表型(如眼睛的顏色)所對應的遺傳學距離。圖2.8中做了簡化,僅將有關的等位基因列出。Figure2.9

Ifarestrictionmarkerisassociatedwithaphenotypiccharacteristic,therestrictionsitemustbelocatednearthegeneresponsibleforthephenotype.

圖2.9如果某限制性標記與一個表型相關,則該限制酶位點必定位于決定此表型的基因附近。圖中,突變將正常人普遍存在的帶轉換成病人中普遍存在的帶。Themutationchangingthebandthatiscommoninnormalpeopleintothebandthatiscommoninpatientsisverycloselylinkedtothediseasegene.Figure2.13Allfunctionalglobingeneshaveaninterruptedstructurewiththreeexons..2.4Organizationofinterruptedgenesmaybeconservedinterruptionsoccurathomologouspositionsinallknownactiveglobingenes:mammals,birds,andfrogs.Thefirstshort,andthesecondlonger,buttheactuallengthscanvary.Mostofvariationfromthesecondintron.Inthemouse,thesecondintronintheα-globingeneisonly150bplong,tatol850bp,comparedwiththemajorβ-globingenewheretheintronlengthof585bpgivesthegeneatotallengthof1382bp.ThevariationinlengthofthegenesismuchgreaterthantherangeoflengthsofthemRNAs(α-globinmRNA=585bases,β-globinmRNA=620bases).

Introntypes,universalandconservationAllclassesofgenesmaybeinterrupted:nucleargenescodingforproteins,nucleolargenescodingforrRNA,andgenescodingfortRNA.Interruptionsalsoarefoundinmitochondrialgenesinlowereukaryotes,andinchloroplastgenes.Interruptedgenesdonotappeartobeexcludedfromanyclassofeukaryotes,andhavebeenfoundinbacteriaandbacteriophages,althoughtheyareextremelyrareinprokaryoticgenomes.2.4Organizationofinterruptedgenesmaybeconserved高等真核生物多數(shù)基因都有內含子,沒有內含于的僅占極少數(shù)。裂殖酵母較多釀酒酵母只有少數(shù)基因有內含子,大腸桿菌T4噬菌體、枯草桿菌spo1噬菌體和藍細菌少數(shù)基因有內含子。線粒體、葉綠體基因也有內含子。不但編碼蛋白質的基因有,編碼tRNA的基因也有內含子。不同生物的同一基因,內含子長度盡管變化很大,但數(shù)目、位置往往相同。一般,一內含子序列不會見之于另一內合子,而外顯子則往往和蛋白質的功能性結構域相對應。因此曾設想內含子對于外顯子重新組合以促進基因大步伐進化起著重要作用。由于內含子中信息量小,在此處改組(shuffling),不會危及外顯子的功能結構域。此看法是認為一切生物原來都有內含子,以后不斷進化,原核生物由于基因組小、復制快,內含子成為快速復制的包袱,因此逐漸失去。不同生物同一基因的內含子數(shù)目、位置一致,是其旁證。與此相反的一種看法認為生物本來沒有內含子,內含子是由于外顯子改組位置不準確而來的。所以原核生物內含子極少,低等真核生物少,高等真核生物多.酵母細胞色素c基因無內含子,而人、鼠有之。內含子回歸與傳染這又是個雞生蛋、蛋生雞的問題。因此,自然而然地出現(xiàn)了中問路線。孰是孰非,一時難于作出正確判斷。內含子按其連接位點的結構和剪接方式來分,可以分為三類,即I類、II類和一般核Pre-mRNA類。I類:4個保守序列2個不大保守序列E-E’P(AUGGUGG-AAA),排列:Q(AAUCAGCAGG),5’-E-P-Q-R-E’-S-3’R(UCAGAGACUACA),真菌線粒體/葉綠體/四膜蟲rRNAS(AAGAUAUAGUCC)/T偶數(shù)噬菌體II類:少數(shù)真菌線粒體/大多數(shù)葉綠體/植物線粒體70個II類內含子分析:6個區(qū)IABC(C1/C2)D(D1/D2)IIIII……..VIII類內含子按其大小和結構來說,又可分為普通的II類、III類和孿生內含子(twintron)三類。II類內含子比較大,可達600核苷酸以上,有6個結構域。III類內含子可以看作是II類的缺失突變體,除II類的結構域VI保持完整外,結構域I、Il、III、IV、V可以缺失,因此比II類內含子小很多,一般不超過150個核苷酸。孿生內含子是在III類內含子(稱為外內合子,)結構域VI的上游,插入了另一個甚至幾個II類(也有I類)內含子(稱為內內含子)。其實由兩個I類內含子組成的孿生內含子也是有的。原生動物有I類內含子。最近報道小球藻的病毒編碼蛋白質(和TFIIS同源)的基因和14.2kDa可讀框有I類內含子。各類內含子剪接的共同點是二步轉酯鍵反應;不同點是I類、Il類都是自我剪接,一般核pre-mRNA類則得有剪接體參加;Il類和核pre—mRNA的剪接都有套索中間體。以前以為只有線粒體和葉綠體才有II類內含子。后來按II類內含子中員為保守的序列合成引物,用聚合酶鏈式反應從葉綠體的祖先藍細菌和線粒體的祖先紫細菌都擴增、克隆到了II類內含子.因此,認為現(xiàn)代核基因內含子可能來源于II類內含子。從剪接反應的立體化學來看,Pre—mRNA的剪接和II類內含子的剪接相似。但三類內含子剪接是否有進化上的聯(lián)系,迄今還沒有明確的答案。有些pre-tRNA也有內含子。由于pre-tRNA的結構相對恒定,內含子位置一定,剪接的信息不在內含子而在外顯子,剪接由酶進行,與上面三類內含子剪接的關系很小。

GT-AG

有些基因的外顯子不但被內含子隔開,而且彼此相距甚遠。例如,地錢的葉綠體核糖體蛋白s12基因由3個外顯子組成;3‘端的兩個外顯子由一股DNA編碼,5’端的外顯子由另一股DNA編碼;兩者相距30kb,萊茵衣藻MA基因的三個外顯子分別相距50、90kb;這類pre—mRNA要經(jīng)過反式剪接,才能成為成熟的mRNA。錐蟲只有反式剪接,線蟲有10一15%的Pre—mRNA是反式剪接;甚至同一基因、既可順式、又可反式剪接,得到不同的mRNA。內含子由此一基因轉移到另一基因,稱為轉座。用PCR法證明酵母線粒體II類內含子al1轉座到cox1。Podosporaanserina線粒體cox1基因的II類內含子a轉座到tRNAIle基因和tRNASer基因之間。Figure2.14MammaliangenesforDHFR(dihydrofolatereductase)

.geneisorganizedinto6exonsthatcorrespondtothe2000basemRNA.ButtheyextendoveramuchgreaterlengthofDNAbecausetheintronsareverylong.Inthreemammalstheexonsremainessentiallythesame,andtherelativepositionsoftheintronsareunaltered,butthelengthsofindividualintronsvaryextensively,resultinginavariationinthelengthofthegenefrom25-31kb.2.5Exonsequencesareconservedbutintronsvary外顯子序列保守,內含子序列多變比較大的基因DHFR球蛋白和DHFR基因說明了一個普遍現(xiàn)象:那些在進化過程中相關的基因有著相類似的結構,至少包括了一些內含子位置的保守性,基因長度的變化主要取決于內含子長度的變化。結構基因在其基因組中是獨特的嗎?答案可能是模棱兩可的。既是又不是整個基因的長度是獨特的,但其外顯子通常與其它基因外顯子相關。一般而言,當兩個基因是相關的,它們外顯子的關系比內含子的關系更緊密。在特殊情況下,兩個基因的外顯子可能編碼同一個蛋白質,但其內含子可能不同。說明這兩個基因可能起源于一個共同的祖先基因,拷貝間內含子差異積累,但因編碼蛋白質功能的需要,其外顯子區(qū)域是保守。外顯子可能是基因進化的基礎,它們可以通過不同的方式進行組合。一個基因可能含有幾個與其他基因相關的外顯子,但也存在一些并不相關的外顯子。一般而言,此時其內含子也不相關。這些基因可能是由同一些外顯子經(jīng)復制和轉移產(chǎn)生的。兩個基因的相似性可用點陣作圖進行比較(圖2.15)。一個點表明該位置上基因的序列相同。如果兩個序列完全相同,則點組成一條45度的直線。若存在不相似區(qū),則直線會被打斷,并且另一個相關序列的缺失或插入會使其平行或垂直地被替換。Figure2.15Thesequencesofthemouse

majand

minglobingenesarecloselyrelatedincodingregions,butdifferintheflankingregionsandlargeintron.

Thelinepetersoutintheflankingregionsandinthelargeintron

Thisisatypicalpattern,inwhichcodingsequencesarewellrelated,therelationshipcanextendbeyondtheboundariesoftheexons,butitislostinlongerintronsandtheregionsoneithersideofthegene.內含子趨異的模式也包括大小的變化(由插入和缺失產(chǎn)生)以及堿基組成。內含子比外顯子進化快。當不同種間的基因進行比較,有時其外顯子同源,而內含子間變化巨大,甚至不存在任何相關序列。外顯子和內含子中突變率是相同的,但在外顯子中經(jīng)過選擇使突變被更有效地剔除。如此相反,內含子不受編碼功能的限制,其自由積累點突變和其他變異更快。這暗示內含子沒有序列特意性功能,其存在對基因是否是必要的目前尚無定論。GenescanbeisolatedbytheconservationofexonsSupposeweknowbygeneticdatathataparticulargenetictraitislocatedinagivenchromosomalregion.Ifwelackknowledgeaboutthenatureofthegeneproduct,howarewetoidentifythegeneinaregionthatmaybe(forexample)>1Mb?Zooblot

describestheuseofSouthernblottingtotesttheabilityofaDNAprobefromonespeciestohybridizewiththeDNAfromthegenomesofavarietyofotherspecies.2.6Genescanbeisolatedbytheconservationofexons可利用保守的外顯子分離基因Figure2.17AzooblotwithaprobefromthehumanYchromosomalgenezfyidentifiescross-hybridizingfragmentsonthesexchromosomesofothermammalsandbirds.ThereisonereactingfragmentontheYchromosomeandanotherontheXchromosome.DatakindlyprovidedbyDabidPage.2.6Genescanbeisolatedbytheconservationofexons鑒定基因的主要方法大都以外顯子的保守性和內含子的多變性比較為基礎。一個功能在不同種內是保守的基因,其代表的蛋白質序列應該有兩個性質:具有一個開放讀框,并與其他種屬有相關的序列。這些特點可以用來分離基因。圍饒的一個克隆開始,沿著染色體這個區(qū)域步移(ChromosomeWalking),從文庫中鑒定重復基因(如圖2.16)。Westartwithaclonethatliesinthegeneralvicinityofthisregionandthenwe"walk"throughtheregionbyidentifyingoverlappingclonesfromalibrary.AsshowninFigure2.16,asubfragmentfromoneendofthefirstcloneisusedtoisolateclonesthatextendfartheralongthechromosome.Theseclonesinturnareusedtoisolatethenextset.Ineachcycle,anewcloneisselectedbecauseitsrestrictionmapcoincidesatoneendwiththeendofthepreviousclone,butattheotherendhasnewmaterial.Itispossibletowalkforhundredsofkb,typicallyatarateof>100kbpermonth.Chromosomewalkingallowslargecontiguousregionsofthechromosometoberepresentedinalibraryofclones.Figure2.16Chromosomewalkingisaccomplishedbysuccessivehybridizationsbetweenoverlappinggenomicclones.2.6Genescanbeisolatedbytheconservationofexons當然,如果染色體的全部序列被確定,鑒定一個獨特的基因就更加容易??蓮娜旧w步行中獲得的連續(xù)系列克隆進行測序,或者通過其他方式(比如直接比較序列)使克隆相聯(lián)系。若序列已知,基因可以通過比較其RNA或蛋白質產(chǎn)物來確定,或者通過序列中的一個突變進性鑒定。第一條可以用動物印跡法(zooblot)來證明,首先我們從上述區(qū)域克隆出一小段序列作為探針(放射性標記的)。利用Southernblotting的方法和別的物種的相關DNA雜交,這個探針常是人的DNA,若發(fā)現(xiàn)在許多物種中都存在與之雜交的片段,我們可以認為它是基因的外顯子。這類確定的外顯子經(jīng)測序后,若證明它們含可譯框,就可被用來分離這個區(qū)域周圍的基因。若這些都顯示出是外顯子的一部分,則可以繼續(xù)鑒定整個基因,然后分離相應的cDNA或mRNA,最后鑒定蛋白。上述方法對鑒定那些遺傳上暗示存在但其實質未知的基因來說是寶貴的。一個例子是利用位于人Y染色體上的zfy基因作探針,與其它動物的性染色體雜交的結果(圖2.17),該探針能與哺乳動物和其他種類的性染色體特異性雜交,含有開放讀框,用于鑒定一個保守基因。當目標基因含有很多大的外顯子且很長時,Zooblot方法特別有用。Duchenne肌肉營養(yǎng)不良(DMD,一種肌肉退化失調癥)基因鑒定,就是其中一例(圖2.18)DMD基因與X染色體連鎖,并影響1/3500男子出生。連鎖分析表明DMD位點位于X染色體Xp21條帶上?;糄MD疾病的病人通常在該條帶上產(chǎn)生DNA重排(Rearrangement)。通過比較X-連鎖DNA探針與患者DNA和正常人的雜交能力,可以獲得重排或患者體內相關的克隆片段。染色體步移用來建立探針兩端的限制性圖譜,范圍可超過100kb的區(qū)域。通過對一系列患者中獲得的DNA分析,確定該區(qū)域有一很大缺失,并在兩個方向上延伸。最值得一提的是,缺失切除了一個對基因功能很重要的片段,并且該基因或至少基因的一部分包含在這個區(qū)域內

Figure2.18ThegeneinvolvedinDuchennemusculardystrophyhasbeentrackeddownbychromosomemappingandwalkingtoaregioninwhichdeletionscanbeidentifiedwiththeoccurrenceofthedisease.2.6GenescanbeisolatedbytheconservationofexonsThisapproachisespeciallyimportantwhenthetargetgeneisspreadoutbecauseithasmanylargeintrons.ThisprovedtobethecasewithDuchennemusculardystrophy(DMD),adegenerativedisorderofmuscle,whichisX-linkedandaffects1in3500ofhumanmalebirths.ThestepsinidentifyingthegenearesummarizedinFigure2.10.基因在染色體上的大致區(qū)域確定后,我們需要鑒定它的內含子和外顯子。采用zooblot方法確定了與小鼠X染色體和其他哺乳動物DNA雜交的片段(圖2.19),詳細檢查片段內是否存在開放讀框和典型的內含子-外顯子邊界序列。將符合這些標準的片段作為探針,進一步在肌肉mRNA構建的cDNA文庫中檢測同源序列。Figure2.19

TheDuchenemusculardystrophygenehasbeencharacterizedbyzooblotting,cDNAhybridization,genomichybridization,andidentificationoftheprotein.

2.6Genescanbeisolatedbytheconservationofexons雜交篩選鑒定了一個與基因cDNA相關、非同尋常的大mRNA,約14kb。與基因組雜交表明,這個mRNA含60個以上得外顯子,2000kb的DNA,是目前已知DNA中鑒定為最長的基因,其長度是其他已知基因的10倍。這個基因編碼一個大約500kD的蛋白質,稱為營養(yǎng)不良蛋白質(Dystrophin),是肌肉的成分之一,但其含量甚微。所有DMD患者在這個位點上都有缺失或無效,并且影響營養(yǎng)不良蛋白質功能。另一種在遺傳片段上迅速找到外顯子的方法是外顯子捕獲(Exontrapping)技術(圖2.20)。該技術從一個攜帶強啟動子,在兩個外顯子間僅有一個內含子的載體開始。用這種載體轉染細胞時,其轉錄產(chǎn)生大量含有兩個外顯子序列的RNA。內含子上有一個限制性克隆位點,用來插入一段感興趣區(qū)域的片段。如果這個片段不包括外顯子,那么剪接模式不會改變,并且RNA僅包含親本載體一樣的序列。當插入片段具有由兩部分內含子包圍的外顯子時,其兩端的剪接點就會被識別,將外顯子序列插入到載體外顯子之間的RNA中。所獲得的RNA可通過逆轉錄成cDNA,使用PCR擴增載體兩個外顯子之間的序列進行檢測。因此若能擴增出來自目標片段的序列,則表明外顯子被捕獲。由于動物細胞中內含子通常很大而外顯子很小,基因組DNA可能含有這種所需要的結構,即一個外顯子兩端被部分內含子包圍是有可能的。Chambon等分析比較了大量結構基因的內含子切割位點,發(fā)現(xiàn)有2個特點:①內含子的兩個末端并不存在同源或互補序列。在剪切的初始階段,可能直接連接;②連接點具有很短的保守序列(圖13-20)也稱為邊界順序。100種內含子的5′端都是GT;3′端都是AG,因此稱為GT-AG法則(GT-AGrule),又稱為Chambon法則。這兩個位點序列是不同的,左邊的剪接位點稱供體(donor)位點,右邊的剪接位點稱受體(acceptor)位點。這兩個位點對于剪接是十分重要的,一旦發(fā)生突變無論在體內還是在體外,會抑制剪接。此法則幾乎適合于所有真核生物的核基因,這意味著它們切除內含子的機制是相同的,但不適用于Ⅰ類內含子。

Figure2.20

Aspecialsplicingvectorisusedforexontrapping.Ifanexonispresentinthegenomicfragment,itssequencewillberecoveredinthecytoplasmicRNA,butifthegenomicfragmentconsistssolelyofanintron,

2.6Genescanbeisolatedbytheconservationofexons外顯子捕獲P39(Exontrapping)2.8SomeDNAsequencescodeformorethanoneprotein有些DNA序列編碼多種蛋白質Figure2.25

Twoproteinscanbegeneratedfromasinglegenebystarting(orterminating)expressionatdifferentpoints.

2.8SomeDNAsequencescodeformorethanoneprotein有些DNA序列編碼多種蛋白質Figure2.26TwogenesmaysharethesamesequencebyreadingtheDNAindifferentframes.2.8SomeDNAsequencescodeformorethanoneproteinFigure2.27Alternativesplicingusesthesamepre-mRNAtogeneratemRNAsthathavedifferentcombin-ationsofexons.2.8SomeDNAsequencescodeformorethanoneproteinFigure2.28Alternativesplicinggeneratestheaandbvariantsoftroponin

Example:大鼠肌鈣蛋白(Troponin)T基因的3’端包括5個外顯子,但只有四個用于mRNA的構建。雖然三個外顯子——WXZ表達模式一致,但上邊模式中α外顯子被剪接到XZ之間,而下邊模式中β外顯子被剪接到XZ之間。因此α型和β型肌鈣蛋白T在序列WZ之間的氨基酸序列不同,取決于α和β外顯子的替換模式。兩者中的任何一個都可以形成獨立的mRNA,但是二者不能同時用于一個mRNA中。Studiesonexpressedsequencesandproteincontentinhumancellssuggestedthatthereshouldbebetween100.000and150.000protein-codinggenes.However,resultsfromsequencingexperimentsshowedthatthehumangenomeonlycontainsaround30,000genesAlternativesplicing(交替\選擇\可變AS)Theremustbeawaytoregulateanddiversifythefunctionofgenesofdifferentiallyspecialisedcelltypes.Evolution’ssolutionforthegivenproblemisalternativesplicing(AS),whichisthemostimportantposttranscriptionalregulatorymechanismthatcausesproteomediversityandfunctionalcomplexity.AlternativesplicingmeansthatduringRNAsplicingdifferentcombinationsofexonsarejoinedtocreateadiversearrayofmRNAsfromasinglepre-mRNA.ResultingmaturemRNAsareeithernon-functionalormightgiverisetoproteinswithdifferentactivitiesandfunctions.Morethan70%-95%ofthehumanprotein-codinggenesarealternativelyspliced.Thisexplainsthefactthattherelativelysmallnumberof~30,000genescanleadtoaproteome(thetotalofallproteinsinacellororganism)ofseveralhundredthousandsofproteins.Anotherexampleisthefruitfly’s(Drosophilamelanogaster)genome(14,000genes)containingabout5,000geneslessthantheoneofasimpleprimalnematode(19,000genes).AnoutstandingexampleofanalternativelysplicedgeneisthesocalledDscamgeneofthefruitfly.Thisonegenecanbeprocessedintoabout38,000(38016)splicedvariants

2XofthetotalgenesinwholegenomeThestructureoftheDscamgeneinsixDrosophilaspp.ThematuremRNAofeachgenecontains22exons,fourofwhich(exon4,exon6,exon9andexon17,showningreen,blue,yellowandred,respectively)arechosenfromaclusterofalternativeexons.Theremaining18exons,showninmetallicgray,arealwaysselected.Intronsarenotshown.Redlinesindicateanexamplechoiceofexons.Useofalternativepromoters,poly-Asitesandterminalintronssplicing-processedontheir5’-and3’-ends(5’cappingand3’polyadenylation).ThesemodificationsarenecessaryfortheprotectionofmRNAsandalsoforregulationoftranslation.AlternativesplicingcausinganalterationatanyofthetwoRNAendscanthusleadtochangesinproteinproduction.Ontheotherhandchangesinthe5’regionofthenewtranscriptinfluencesIntronretentionThisiswhenanintronisnotremovedfromthemRNA.Thiscanleadtotheincorporationofaproteinsequenceorachangeinthereadingframe.cassettealternativeexonsThemostcommontypeofalternativesplicingevents(aroundonethird)involvescassettetypealternativeexons.InthiscaseanexoniseitherincludedorexcludedfromthemRNA.Splicingofacassetteexoncanresultinthecompleteinclusionorlossofaspecificfunctionalproteindomain.alternativesplicesites

Inthiscasealternative5’-or3’-splicesitesinexonorintronssequencesarechosenleadingtotheinclusionorexclusionofapartofanexonorintron.TheuseofanalternativesplicesitecanleadtosubtlechangesintheproteinactivityandthereforetoafinetuningoftheproteinfunctionMutualexclusionofexonsInthissplicingevent,eitheroneorotheroftwoexonsisincludedinthefinalmRNA–bothmutuallyexclusiveexonsarenotfoundtogetherinthemRNA.(e)alternativesplicesites(f)MutualexclusionofexonsGU-AG第一種類型為:盒式剪接。即發(fā)生可變剪接的時候會跳躍這個外顯子。如圖1.1第二種類型為:可變3’端剪接。即按照GU-AG規(guī)則,內含子在發(fā)生切割的時候可以在下一個外顯子的上選擇不同的AG端:圖1.2第三種類型為:可變5’端剪接。即按照GT-AG規(guī)則,內含子在發(fā)生切割的時候可以在上一個外顯子的上選擇不同的GT端:圖1.3第四種類型為:內含子保留式剪接。即在發(fā)生連續(xù)的兩個外顯子拼接的時候中間的內含子不被切除卻被保留下來。圖1.4第五種類型為:互斥性剪接。即圖中的綠色外顯子和紅色外顯子存在一種“有你沒有的關系,在任何情況下只能存在一個外顯子。圖1.5第六種類型為:可變5’末端。即這個基因的開始末端是可變的。圖1.6第七種類型為:可變的polyA末端剪接。即可以選擇不同的polyA末端作為這一轉錄本的結束。圖1.72.9Howdidinterruptedgenesevolve?現(xiàn)在割裂基因的原始形式是怎樣的呢?目前有兩種模型,“內含子占先(Intronsearly)”模型支持內含子總是基因的整體部分。認為基因起始于割裂的結構,沒有內含子的基因是進化過程中丟失的。“內含子滯后(Intronslate)”模型認為原始蛋白質編碼單位由非割裂的DNA序列組成,內含子是隨后插入進去的。這些模型的檢驗,明確真核和原核基因的區(qū)別,是否等同于真核基因中內含子的獲得或者原核基因中內含子的丟失。內含子占先的結構表明,基因的鑲嵌結構是基因重組從而產(chǎn)生新蛋白質的一種原始方法。試想,早期細胞有許多不同的蛋白質編碼區(qū)域,其進化的一個方面很可能是不同多肽鏈單位重新組合,拼接,從而產(chǎn)生新的蛋白質。如果蛋白質編碼單位必須是連續(xù)的密碼子序列,重新創(chuàng)造這種序列將需要精確的DNA重組,從而使兩個蛋白質編碼單位并列,以同樣的讀碼框頭尾相接。并且,如果這種重組沒有成功,卻失去了原始的蛋白質編碼單位,細胞必然受到破壞。但是如果DNA重組能將兩個蛋白質編碼單元置于一個轉錄單位中,剪接模式將在RNA水平上獲得突破,從而將兩種蛋白質放在一條多肽鏈中。而且如果重組并不成功,原始的蛋白質編碼單位仍能被應用。這種方法必然使細胞嘗試限制RNA刪除,而不至于在此過程中引起DNA穩(wěn)定性破壞。

exontrapping

illustratestheoutcomewhenarandomsequencethatincludesanexonist

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論