版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、Lecture 2From Genes to Genomes(7)Interrupted genes(8)Introduction引言Restriction endonucleases are a key tool in mapping DNA 通過限制性內(nèi)切作圖 How variable are individual genomes? 分子標(biāo)記,分子標(biāo)記作圖與應(yīng)用(?)Interrupted Gene Exon sequences are conserved but introns vary Genes can be isolated by the conservation of exons
2、 基因在尺寸大小上分布廣泛53斷裂基因是如何發(fā)展進化的?58本講主要內(nèi)容Introduction 1993 Nobel Richard J. Roberts and Phillip A. Sharp Genomic2.2Restriction endonucleases are a key tool in mapping DNA We can think about mapping genes and genomes at several levels of resolution:Genetic mapA cytogeneticA genetic (or linkage) map identi
3、fies the distance between mutations in terms of recombination frequencies. A linkage map can also be constructed by measuring recombination between sites in genomic DNA. Physic mapA restriction map is constructed by cleaving DNA into fragments with restriction enzymes and measuring the distances bet
4、ween the sites of cleavage.Transceiption mapThe ultimate map is to determine the sequence of the DNA. From the sequence, we can identify genes and the distances between them. 5000bp長的DNA分子由兩個限制性酶A和B切成片段,而后DNA進行電泳。每一條片段的大小由已知大小的片段的位置來決定,如中部所示。酶A將DNA切成4段(長為2100, 1400, 1000, 500pb), 酶B切為3段(長為2500, 1300
5、, 1200bp)。那么是否能根據(jù)這些數(shù)據(jù)制作一個圖譜,來顯示DNA分子的特定的斷裂點呢?雙單酶切做physical map真正構(gòu)建限制性圖譜時需要許多酶,所以解決由各種各樣酶產(chǎn)生的十分復(fù)雜的覆蓋片段是十分必要的。許多更進一步的技術(shù)就用來構(gòu)建圖譜。 另一種方法是用部分(酶切)消化,通過在一些條件下,一種酶并不確認(rèn)每一種DNA分子的目標(biāo)切點而是不能在目標(biāo)切點上進行切除。這種條件可以設(shè)置,這樣這種酶有一個特殊的可能性,例如,只切它所識位點的50。單酶切也可實現(xiàn)作圖應(yīng)用單酶切不完全消化技術(shù),酶A可能產(chǎn)生3500, 3100, 1400bp等的分裂片段,通過比較完全消化的部分產(chǎn)品, 1000-2100
6、bp片段可被認(rèn)作3100bp部分片段的鄰近成分。同樣,2100, 1400bp片段可被置于3500bp部分片段作為鄰近成分。這樣該技術(shù)允許單切酶切點按序排列。如果一種酶的兩個些切點離得非常近(比如,小于50bp),則所產(chǎn)生的非常小的片段就在瓊脂糖凝膠上丟失。當(dāng)然,當(dāng)其它片段的分子量相加時,這種情況會導(dǎo)致脫節(jié)。這個問題可以通過應(yīng)用其他一些限制性酶來構(gòu)建圖譜而被克服掉,所以用不同酶產(chǎn)生的片段中有總夠的覆蓋來保證所有的DNA都被包含進來。 通過用末端標(biāo)記技術(shù)比較部分酶切消化,一系列的由一種酶所確定的切點可以直接相對末端而在圖上做出來,圖2.4顯示了僅由它們放射性的標(biāo)記末端而識別出的片段,那些分子內(nèi)的
7、切點被忽略掉,然后而一系列片段確定了距標(biāo)記末端的每一個切點。如果圖6.4的左端5000bp片段被做上標(biāo)記,酶A的部分?jǐn)嗔褜⒘⒓创_定出距末段的1000, 3100, 4500bp切點。Figure 2.4 When restriction fragments are identified by their possession of a labeled end, each fragment directly shows the distance of a cutting site from the end. Successive fragments increase in length by t
8、he distance between adjacent restriction sites. 2.2 Restriction endonucleases are a key tool in mapping DNA 1000, 3100, 4500bpDNA 結(jié)構(gòu)在不同種類的生物體內(nèi)存在著相當(dāng)大的差異隨著對基因及基因組認(rèn)識的不斷深入,發(fā)現(xiàn)同種的不同個體之間,盡管其蛋白質(zhì)產(chǎn)物的結(jié)構(gòu)和功能完全相同或僅有微小差異,但在DNA 水平卻存在著差異或明顯差異,尤其在不編碼蛋白質(zhì)的區(qū)域以及沒有重要調(diào)節(jié)功能的區(qū)域表現(xiàn)更為突出。DNA 順序上的大多數(shù)突變是中性突變,即不影響生物體的表型,因而過去長期對這些突變不
9、太重視,也無法用傳統(tǒng)的遺傳學(xué)方法來研究。2.3 How variable are individual genomes? 個體基因組如何變化? (though HPG)For example , you and me 與 酶切有關(guān)(小基因組)分子操作技術(shù)的不斷發(fā)展,從DNA 水平上直接分析生物體的突變成為可能。假如DNA 順序中的某個堿基發(fā)生了突變,尤其是在某種限制性內(nèi)切酶的位點(突變或缺失)。這樣,利用該限制性內(nèi)切酶消化此DNA 時,便會產(chǎn)生與正常不同的限制性片段。這樣,在同種生物的不同個體中會出現(xiàn)不同長度的限制性片段類型,即限制性片段多態(tài)性(RFLP )。其他的顯示DNA差異(多態(tài)性的)?
10、分子標(biāo)記 構(gòu)建高分別率遺傳圖譜( 80年代,Botsein提出DNA限制性片段長度多態(tài)性(RFLP)可以作為遺傳標(biāo)記,從此開創(chuàng)了直接應(yīng)用DNA多態(tài)的新階段.90年代,DNA多聚酶鏈?zhǔn)椒磻?yīng)(PCR)的發(fā)展,使直接擴增DNA的多態(tài)性成為可能,并在此基礎(chǔ)上產(chǎn)生了許多種新型分子標(biāo)記,諸如擴增片段多態(tài)性(ALFR)、串聯(lián)重復(fù)序列(VNTR), RAPD是較為突出的一種. SNP 單鏈構(gòu)型多態(tài)性(PCR-SSCP)、序列特異擴增區(qū)域(SCAR).另一類是由于DNA 分子內(nèi)部發(fā)生較大的順序變化所致。這一類多態(tài)性又可以分成兩類: 第一類是由于DNA 順序上發(fā)生突變?nèi)缛笔?、重?fù)、插入所致。反映的是在RLFP多態(tài)
11、 第二類是所謂“高變區(qū)”。高變區(qū)(highly variable region ),是由多個串聯(lián)重復(fù)順序組成的,不同的個體高變區(qū)內(nèi)所串聯(lián)重復(fù)的拷貝數(shù)相差懸殊,因而高變區(qū)的長度變化很大,從而使高變區(qū)兩側(cè)限制性內(nèi)切酶識別位點的固定位置隨高變區(qū)的大小而發(fā)生相對位移。所以這一類型的RFLP 是由于高變區(qū)內(nèi)串聯(lián)重復(fù)順序的拷貝數(shù)不同所產(chǎn)生的,其突出特征是限制性內(nèi)切酶識別位點本身的堿基沒有發(fā)生改變,改變的只是它在基因組中的相對位置。即可反映在RLFP上,也可PCR擴增 這就是說這兩種序列在人體基因組中不同的位置上分別重復(fù)不同的次數(shù),而在不同個體的基因組中,對應(yīng)位置上這兩種核心序列的重復(fù)次數(shù)也不相同。這樣用這
12、兩種探針之一與合適的酶切割的人體基因組DNA 片段雜交,在不同的個體將得到不同的DNA 指紋,而且探針33.5 的DNA 指紋圖也不相同。DNA 指紋具有細(xì)胞穩(wěn)定性和種系穩(wěn)定性,是按孟德爾規(guī)律遺傳的,而且雜合性高。對于由點突變引起的RFLP ,就某一個多態(tài)性切點來說只有兩種多態(tài)性,即切點有(+ )或切點無(- )。而對由于高變區(qū)重復(fù)片段長度不同所引起的RFLP 來說,在基因組上某一個位置核心序列的重復(fù)次數(shù)在不同的個體不一樣,比如在個體為10 個拷貝,個體為15 個拷貝,而個體又可能為18 個拷貝等等。因此,在不同個體同一個相應(yīng)位置上核心序列的重復(fù)次數(shù)就是多態(tài)的,而不是雙態(tài)的。即使在基因組上的某
13、一個位置處核心序列的次數(shù)一樣,從而被酶切出的長度相同,但在基因組的其他位置上該核心序列重復(fù)次數(shù)又可能不同。由于DNA 指紋是按孟德爾規(guī)律遺傳的,子代的DNA 指紋圖可以追溯到其父母DNA 指紋圖上,而在不是其父母的DNA 指紋圖上則很難找到與其一樣的小隨體DNA 片段。在父親的5 條可分辨的小隨體DNA 片段中,有4 條處于雜合狀態(tài),即這4 條DNA 片段有不同的個體長度。因此,因高變區(qū)核心序列重復(fù)次數(shù)不同引起的RLFP 才是真正的多態(tài)性。在不同個體,這種RLFP 即DNA 指紋可以說不存在相同的。即使使用一種探針產(chǎn)生的DNA 指紋圖無法鑒定這兩個個體,如再用另一種探針便有可能將這兩個個體區(qū)分
14、開。DNA 指紋技術(shù)已被應(yīng)用于親子鑒定和法醫(yī)學(xué)上對罪犯的確認(rèn)等領(lǐng)域。Haplotype(單元型,單倍型 一條染色體或DNA分子的基因型) is the particular combination of alleles in a defined region of some chromosome, in effect the genotype in miniature. Originally used to described combinations of MHC alleles, it now may be used to describe particular combinations
15、of RFLPs.豐富的多態(tài)性(或高頻率)意味著每個個體有獨特的限制性位點。在特殊區(qū)域發(fā)現(xiàn)的位點組合稱為單體型(Haplotype)。單體型概念最初用于描述主要組織兼容性座位(編碼在免疫系統(tǒng)中很重要的蛋白質(zhì)區(qū)域,見第24 章)的遺傳組成?,F(xiàn)在延伸到描述基因組限定區(qū)域的等位基因或限制性位點(或者任何其他遺傳標(biāo)記)的特殊組合。(個體某些位點或基因的組成)2.3 How variable are individual genomes?個體基因組如何變化?SNP (single nucleotide polymorphism) is any site at which a single nucleot
16、ide has changed when two (haploid) genomes are compared.SNPs and HaplotypesA Single Nucleotide Polymorphism (SNP), pronounced snip, is a single DNA base variation observed in the human population.A haplotype stands for a set of linked SNPs on the same chromosome.SNP1SNP2SNP3-A C T T A G C T C-A A T
17、T T G C T C-A C T T T G C T T-A C T T T G C T C-Haplotype2Haplotype3C A CA T CC T THaplotype1SNP1SNP2SNP3Haplotype4C T C SNP,RLFP, VTRP實際上,在DNA 順序中,存在著大量的單個堿基的替換,但用通常所用的技術(shù)只能檢測出影響到限制性內(nèi)切酶識別位點上的突變。不同的多態(tài)性切點在一特定人群中出現(xiàn)(+ )的頻率不一樣。一段DNA,切點=0.6 (即60 的人含有該切點,而另外40 的人在同一位點處不含該切點); 切點=0.4 。 隨機 :、同時存在(+ )0.6 0.4=
18、0.24, 即24 的人同時含有、兩個切點。 非隨機相關(guān)的,那么同時存在的可能性將和預(yù)期的頻率相差較大。這種相關(guān)的非隨機性稱為: 連鎖不平衡。n ,2n 組合,每種組合稱為一種單元型,每種單元型隨機相關(guān)的預(yù)期出現(xiàn)頻率為各個位點頻率乘積。但是,實踐證明多態(tài)性切點之間并非隨機相關(guān)。例如,在珠蛋白基因簇內(nèi)多態(tài)性切點2 到9 共8 個,理論應(yīng)有28=256 種組合,即256 種單體型。但實際上有3 種單體型在希臘、意大利和亞洲印度人A 染色體(攜帶正常珠蛋白基因的染色體)中就有94 ,而有些理論上的組合在實際上卻是不存在的。在理論上,單體型(從切點2 到9 )的頻率為 0.46 0.48 0.7 0.
19、27 0.83 0.52 0.37 0.32=0.0021, 而實際上該單體型的頻率為0.64 ,兩者相差甚大。這說明各個多態(tài)性切點之間是非隨機相關(guān)的(連鎖不平衡)。Mapping human genes by linkage analyisisPhysical dist.Genetic dist.Chromosome 1 : 283 Mb 270 cM (0.95 cM/Mb)q arm of chromosome 21: 30 Mb62 cM (2.1 cM/Mb)Human genome3200 Mb 3615 cM (1.13 cM/Mb)Female genome4460 cMMal
20、e genome 2590 cM Linkage equilibrium and disequilibriumDA=Da=f(D)*f(A)or(a)dA=da=f(d)*f(A)or(a)DA=Da=f(D)*f(A)or(a)dA=da=f(d)*f(A)or(a)- Ratio form genetic distance to basepairs range from 0.01cM/Mb to 60 cM/Mb Linkage equilibrium and disequilibrium 90% of all SNPs are shared among disparate populat
21、ions African populations have smallers blocks (average 7.3kb) comparedwith 16.3kb in Europeans whereas the Chinese and Japanese blocks have an average size of 13.2kb. What do you use with these markers?Candidate gene analysis Based on prior localization information from affected familiesGenome-wide
22、scan定位克隆輔助選擇疾病診斷。分子標(biāo)記的重要作用:為發(fā)現(xiàn)疾病提供了診斷過程。有些遺傳描述詳細(xì)但是分子機制描述困難的人類疾病很難診斷,如果一個限制性片段與表型可靠地相關(guān),那么它的存在可用來診斷該種疾病,無論是在出生以前還是出生后。為分離基因提供依據(jù)。如果兩個位點很少或者從不重組,在遺傳圖譜中限制性片段應(yīng)該距離基因相對很近。盡管遺傳中“相對很近”用DNA 堿基對表示可能是有一定距離,但它提供了一個使我們沿著DNA 找到基因的起點。RELPs在人類基因組內(nèi)發(fā)生頻繁,對遺傳作圖是很有用。但HapMapCatalog of common human genetic variation across
23、the genome“Common” was taken to mean that the more rare allele was in at least 5% of the population1 Million SNPs were genotyped in 269 samples comprising 4 populationsAssociations between SNPs have been identified and cataloguedMarker Selection for Whole Genome StudiesUsing information from the Hap
24、Map, it is possible to select a set of 300,000-600,000 SNPs that will represent all variation in the genomeUsing array technologies, it is possible to genotype this many SNPs at once based on Common Disease-Common Variant HypothesisMultiple PopulationsThe DNA samples for the HapMap have come from a
25、total of 270 people. The Yoruba people of Ibadan, Nigeria, provided 30 sets of samples from two parents and an adult child (each such set is called a trio). In Japan, 45 unrelated individuals from the Tokyo area provided samples. In China, 45 unrelated individuals from Beijing provided samples. Thir
26、ty U.S. trios provided samples, which were collected in 1980 from U.S. residents with northern and western European ancestry by the Centre dEtude du Polymorphisme Humain (CEPH). 大量的SNP 連鎖不平衡 構(gòu)成了 豐富多態(tài)性The hapMap(haplotype map Post-genome確定限制性圖譜的突變點更困難一些。偶然它們將改變限制性酶的目標(biāo)切點,但它們就保持不可探測性,因為限制性片段的在野生型和突變型保持
27、著同樣大小。有時,探測通過它們對單鏈DNA較短的片段的移動的影響是可以探測其順序變化的,在一項叫作單鏈構(gòu)型多態(tài)性(SSCP)的技術(shù)即可達到此項目的。但是在DNA更大區(qū)域內(nèi)尋找堿基替代物時,決定核苷酸DNA的順序?qū)⒎浅1匾?。聚合酶鏈反?yīng)-單鏈構(gòu)象多態(tài)性分析(Single Strand Conformation Polymorphism Analysis of Polymerase Chain Reaction Products, PCR-SSCP)是近年來發(fā)展起來的一種基因分析方法。 PCR-SSCP分析的基本程序為:首先PCR擴增特定靶序列,然后將擴增產(chǎn)物變性為單鏈,進行非變性聚丙烯酰胺凝膠
28、電泳。相同長度的DNA單鏈其序列不同,甚至單個堿基不同,所形成的構(gòu)象不同,電泳遷移率也不同。PCR產(chǎn)物變性后,單鏈產(chǎn)物經(jīng)中性聚丙烯酰胺凝膠電泳,靶DNA中含單堿基置換,或數(shù)個堿基插入或缺失等改變時,因遷移率變化會出現(xiàn)泳動變位,從而可將變異DNA與正常DNA區(qū)分開。PCR-SSCP分析技術(shù)是一種DNA單鏈凝膠電泳技術(shù),該技術(shù)已被廣泛用于癌基因和抗癌基因變異的檢測、高分別率的分子標(biāo)記遺傳圖譜Using microsatellite repeats as molecular markers for mapping. A hybridization pattern is shown for a fam
29、ily with six children, and this pattern is interpreted at the top of the illustration with the use of four different-sized microsatellite “alleles,” M through M, one of which (M) is probably linked in cis configuration to the disease allele P.Four alleles for a restriction marker are found in all po
30、ssible pairwise combinations, and segregate independently at each generation. Photograph kindly provided by Ray White.圖2.7 限制片段長度多態(tài)性(RFLP)可以按孟德爾方式遺傳,四種等位基因在每代中獨立地分離,但圖中經(jīng)限制消化后所有Figure 2.7 Restriction site polymorphisms are inherited according to Mendelian rules.Figure 2.8 A restriction polymorphism c
31、an be used as a genetic marker to measure recombination distance from a phenotypic marker (such as eye color). The figure simplifies the situation by showing only the DNA bands corresponding to the allele of the other genome in a diploid. 圖2.8 可用限制酶多態(tài)性作為遺傳標(biāo)記,測量兩個重組子表型(如眼睛的顏色)所對應(yīng)的遺傳學(xué)距離。圖2.8 中做了簡化,僅將有
32、關(guān)的等位基因列出。Figure 2.9 If a restriction marker is associated with a phenotypic characteristic, the restriction site must be located near the gene responsible for the phenotype. 圖2.9 如果某限制性標(biāo)記與一個表型相關(guān),則該限制酶位點必定位于決定此表型的基因附近。圖中,突變將正常人普遍存在的帶轉(zhuǎn)換成病人中普遍存在的帶。The mutation changing the band that is common in normal
33、 people into the band that is common in patients is very closely linked to the disease gene.Figure 2.13 All functional globin genes have an interrupted structure with three exons. . 2.4 Organization of interrupted genes may be conservedinterruptions occur at homologous positions in all known active
34、globin genes:mammals, birds, and frogs. The first short, and the second longer, but the actual lengths can vary. Most of variation from the second intron. In the mouse, the second intron in the -globin gene is only 150 bp long, tatol 850 bp, compared with the major -globin gene where the intron leng
35、th of 585 bp gives the gene a total length of 1382 bp. The variation in length of the genes is much greater than the range of lengths of the mRNAs (-globin mRNA = 585 bases, -globin mRNA = 620 bases). Intron types, universal and conservationAll classes of genes may be interrupted: nuclear genes codi
36、ng for proteins, nucleolar genes coding for rRNA, and genes coding for tRNA. Interruptions also are found in mitochondrial genes in lower eukaryotes, and in chloroplast genes. Interrupted genes do not appear to be excluded from any class of eukaryotes, and have been found in bacteria and bacteriopha
37、ges, although they are extremely rare in prokaryotic genomes.2.4 Organization of interrupted genes may be conserved高等 真核生物多數(shù)基因都有內(nèi)含子,沒有內(nèi)含于的僅占極少數(shù)。裂殖酵母較多釀酒酵母只有少數(shù)基因有內(nèi)含子,大腸桿菌T4噬菌體、枯草桿菌spo1噬菌體和藍細(xì)菌少數(shù)基因有內(nèi)含子。線粒體、葉綠體基因也有內(nèi)含子。不但編碼蛋白質(zhì)的基因有,編碼 tRNA的基因也有內(nèi)含子。不同生物的同一基因,內(nèi)含子長度盡管 變化很大,但數(shù)目、位置往往相同。一般, 一內(nèi)含子序列不會見之于另一內(nèi)合子,而外顯
38、子則往往和蛋白 質(zhì)的功能性結(jié)構(gòu)域相對應(yīng)。因此曾設(shè)想內(nèi)含子對于外顯子重新組合以促進基因大步伐進化起著重要作用。由于內(nèi)含子中信息 量小,在此處改組(shuffling),不會危及外顯子的功能結(jié)構(gòu)域。此看法是認(rèn)為一切生物原來都有內(nèi)含子,以后不斷進化,原 核生物由于基因組小、復(fù)制快,內(nèi)含子成為快速復(fù)制的包袱,因 此逐漸失去。不同生物同一基因的內(nèi)含子數(shù)目、位置一致,是 其旁證。與此相反的一種看法認(rèn)為生物本來沒有內(nèi)含子,內(nèi)含子 是由于外顯子改組位置不準(zhǔn)確而來的。所以原核生物內(nèi)含子極少, 低等真核生物少,高等真核生物多. 酵母細(xì)胞色素c基因無內(nèi)含子,而人、鼠有之。內(nèi)含子回歸與傳染這又是個雞生蛋、蛋生雞的問題
39、。因此,自然而然地出現(xiàn)了 中問路線。孰是孰非,一時難于作出正確判斷。內(nèi)含子按其連接位點的結(jié)構(gòu)和剪接方式來分,可以分為三類, 即I類、II類和一般核Pre-mRNA類。I類: 4個保守序列 2個不大保守序列 E-EP(AUGGUGG-AAA), 排列:Q(AAUCAGCAGG), 5-E-P-Q-R-E-S-3R(UCAGAGACUACA), 真菌線粒體/葉綠體/四膜蟲rRNAS(AAGAUAUAGUCC) /T偶數(shù)噬菌體II類: 少數(shù)真菌線粒體/大多數(shù)葉綠體/植物線粒體70個II類內(nèi)含子分析:6個區(qū)I A B C (C1/C2) D (D1/D2) II III .VIII類內(nèi)含子 按其大 小
40、和結(jié)構(gòu)來說,又可分為普通的II類、III類和孿生內(nèi)含子 (twintron)三類。II類內(nèi)含子比較大,可達600核苷酸以上,有6個結(jié)構(gòu)域。III類內(nèi)含子可以看作是II類的缺失突變體,除II類的 結(jié)構(gòu)域VI保持完整外,結(jié)構(gòu)域I、Il、III、IV、V可以缺失,因 此比II類內(nèi)含子小很多,一般不超過150個核苷酸。孿生內(nèi)含子 是在III類內(nèi)含子(稱為外內(nèi)合子,)結(jié)構(gòu)域VI的上 游,插入了另一個甚至幾個II類(也有I類)內(nèi)含子(稱為內(nèi)內(nèi) 含子)。其實由兩個I類內(nèi)含子組成的孿生內(nèi)含子 也是有的。原生動物有I類內(nèi)含子。最近報 道小球藻的病毒編碼蛋白質(zhì)(和TFIIS同源)的基因和14. 2kDa 可讀框有
41、I類內(nèi)含子。各類內(nèi)含子剪接的共同點是二步轉(zhuǎn)酯鍵 反應(yīng);不同點是I類、Il類都是自我剪接,一般核pre-mRNA類 則得有剪接體參加;Il類和核premRNA的剪接都有套索中間體。以前以為只有線粒體和葉綠體才有II類內(nèi)含子。后來按II類 內(nèi)含子中員為保守的序列合成引物,用聚合酶鏈?zhǔn)椒磻?yīng)從葉綠體的祖先藍細(xì)菌和線粒體的祖先紫細(xì)菌都擴增、克隆到了II類內(nèi)含子. 因此,認(rèn)為現(xiàn)代核基因內(nèi)含子可能來源于II類內(nèi)含子。 從 剪接反應(yīng)的立體化學(xué)來看,PremRNA的剪接和II類內(nèi)含子的剪 接相似。但三類內(nèi)含子剪接是否有進化上的聯(lián)系,迄今還沒有 明確的答案。有些pre-tRNA也有內(nèi)含子。由于pre-tRNA的結(jié)
42、構(gòu) 相對恒定,內(nèi)含子位置一定,剪接的信息不在內(nèi)含子而在外顯子, 剪接由酶進行,與上面三類內(nèi)含子剪接的關(guān)系很小。 GT-AG 有些基因的外顯子不但被內(nèi)含子隔開,而且彼此相距甚遠(yuǎn)。例如,地錢的葉綠體核糖體蛋白s12基因由3個外顯子組成;3端的兩個外顯子由一股DNA編碼,5端的外顯子由另一股DNA編碼;兩者相距30 kb,萊茵衣藻MA基因的三個外顯子分別相距50、90kb;這類premRNA要經(jīng)過反式剪接,才能成為成熟的mRNA。錐蟲只有反式剪接,線蟲有10一15的PremRNA是反式剪接;甚至同一基因、既可順式、又可反式剪接,得到不同的mRNA。內(nèi)含子由此一基因轉(zhuǎn)移到另一基因,稱為轉(zhuǎn)座。用PCR法
43、證明酵母線粒體II類內(nèi)含子al1轉(zhuǎn)座到cox1。Podospora anserina線粒體cox1基因的II類內(nèi)含子a轉(zhuǎn)座到tRNAIle基因和tRNASer基因之間。Figure 2.14 Mammalian genes for DHFR(dihydrofolate reductase) . gene is organized into 6 exons that correspond to the 2000 base mRNA. But they extend over a much greater length of DNA because the introns are very lon
44、g. In three mammals the exons remain essentially the same, and the relative positions of the introns are unaltered, but the lengths of individual introns vary extensively, resulting in a variation in the length of the gene from 25-31 kb. 2.5 Exon sequences are conserved but introns vary外顯子序列保守,內(nèi)含子序列
45、多變比較大的基因DHFR球蛋白和DHFR基因說明了一個普遍現(xiàn)象:那些在進化過程中相關(guān)的基因有著相類似的結(jié)構(gòu),至少包括了一些內(nèi)含子位置的保守性,基因長度的變化主要取決于內(nèi)含子長度的變化。 結(jié)構(gòu)基因在其基因組中是獨特的嗎?答案可能是模棱兩可的。既是又不是整個基因的長度是獨特的,但其外顯子通常與其它基因外顯子相關(guān)。一般而言,當(dāng)兩個基因是相關(guān)的,它們外顯子的關(guān)系比內(nèi)含子的關(guān)系更緊密。在特殊情況下,兩個基因的外顯子可能編碼同一個蛋白質(zhì),但其內(nèi)含子可能不同。說明這兩個基因可能起源于一個共同的祖先基因,拷貝間內(nèi)含子差異積累,但因編碼蛋白質(zhì)功能的需要,其外顯子區(qū)域是保守。外顯子可能是基因進化的基礎(chǔ),它們可以通
46、過不同的方式進行組合。一個基因可能含有幾個與其他基因相關(guān)的外顯子,但也存在一些并不相關(guān)的外顯子。一般而言,此時其內(nèi)含子也不相關(guān)。這些基因可能是由同一些外顯子經(jīng)復(fù)制和轉(zhuǎn)移產(chǎn)生的。兩個基因的相似性可用點陣作圖進行比較(圖2.15)。一個點表明該位置上基因的序列相同。如果兩個序列完全相同,則點組成一條45 度的直線。若存在不相似區(qū),則直線會被打斷,并且另一個相關(guān)序列的缺失或插入會使其平行或垂直地被替換。Figure 2.15 The sequences of the mouse maj and min globin genes are closely related in coding region
47、s, but differ in the flanking regions and large intron. The line peters out in the flanking regions and in the large intron This is a typical pattern, in which coding sequences are well related, the relationship can extend beyond the boundaries of the exons, but it is lost in longer introns and the
48、regions on either side of the gene. 內(nèi)含子趨異的模式也包括大小的變化(由插入和缺失產(chǎn)生)以及堿基組成。內(nèi)含子比外顯子進化快。當(dāng)不同種間的基因進行比較,有時其外顯子同源,而內(nèi)含子間變化巨大,甚至不存在任何相關(guān)序列。外顯子和內(nèi)含子中突變率是相同的,但在外顯子中經(jīng)過選擇使突變被更有效地剔除。如此相反,內(nèi)含子不受編碼功能的限制,其自由積累點突變和其他變異更快。這暗示內(nèi)含子沒有序列特意性功能,其存在對基因是否是必要的目前尚無定論。Genes can be isolated by the conservation of exonsSuppose we know by g
49、enetic data that a particular genetic trait is located in a given chromosomal region. If we lack knowledge about the nature of the gene product, how are we to identify the gene in a region that may be (for example) 1 Mb?Zoo blot describes the use of Southern blotting to test the ability of a DNA pro
50、be from one species to hybridize with the DNA from the genomes of a variety of other species.2.6 Genes can be isolated by the conservation of exons可利用保守的外顯子分離基因Figure 2.17 A zoo blot with a probe from the human Y chromosomal gene zfy identifies cross-hybridizing fragments on the sex chromosomes of o
51、ther mammals and birds. There is one reacting fragment on the Y chromosome and another on the X chromosome. Data kindly provided by Dabid Page. 2.6 Genes can be isolated by the conservation of exons鑒定基因的主要方法大都以外顯子的保守性和內(nèi)含子的多變性比較為基礎(chǔ)。一個功能在不同種內(nèi)是保守的基因,其代表的蛋白質(zhì)序列應(yīng)該有兩個性質(zhì):具有一個開放讀框,并與其他種屬有相關(guān)的序列。這些特點可以用來分離基因。圍
52、饒的一個克隆開始,沿著染色體這個區(qū)域步移(Chromosome Walking),從文庫中鑒定重復(fù)基因(如圖2.16)。We start with a clone that lies in the general vicinity of this region and then we walk through the region by identifying overlapping clones from a library. As shown in Figure 2.16, a sub fragment from one end of the first clone is used to
53、isolate clones that extend farther along the chromosome. These clones in turn are used to isolate the next set. In each cycle, a new clone is selected because its restriction map coincides at one end with the end of the previous clone, but at the other end has new material. It is possible to walk fo
54、r hundreds of kb, typically at a rate of 100 kb per month. Chromosome walking allows large contiguous regions of the chromosome to be represented in a library of clones.Figure 2.16 Chromosome walking is accomplished by successive hybridizations between overlapping genomic clones. 2.6Genes can be iso
55、lated by the conservation of exons當(dāng)然,如果染色體的全部序列被確定,鑒定一個獨特的基因就更加容易??蓮娜旧w步行中獲得的連續(xù)系列克隆進行測序,或者通過其他方式(比如直接比較序列)使克隆相聯(lián)系。若序列已知,基因可以通過比較其RNA 或蛋白質(zhì)產(chǎn)物來確定,或者通過序列中的一個突變進性鑒定。第一條可以用動物印跡法(zoo blot)來證明,首先我們從上述區(qū)域克隆出一小段序列作為探針(放射性標(biāo)記的)。利用Southern blotting的方法和別的物種的相關(guān)DNA雜交,這個探針常是人的DNA,若發(fā)現(xiàn)在許多物種中都存在與之雜交的片段,我們可以認(rèn)為它是基因的外顯子。這類確
56、定的外顯子經(jīng)測序后,若證明它們含可譯框,就可被用來分離這個區(qū)域周圍的基因。若這些都顯示出是外顯子的一部分,則可以繼續(xù)鑒定整個基因,然后分離相應(yīng)的cDNA或mRNA,最后鑒定蛋白。上述方法對鑒定那些遺傳上暗示存在但其實質(zhì)未知的基因來說是寶貴的。一個例子是利用位于人Y 染色體上的zfy基因作探針,與其它動物的性染色體雜交的結(jié)果(圖2.17),該探針能與哺乳動物和其他種類的性染色體特異性雜交,含有開放讀框,用于鑒定一個保守基因。當(dāng)目標(biāo)基因含有很多大的外顯子且很長時,Zoo blot 方法特別有用。Duchenne肌肉營養(yǎng)不良(DMD,一種肌肉退化失調(diào)癥)基因鑒定,就是其中一例(圖2.18)DMD 基
57、因與X 染色體連鎖,并影響1/3500男子出生。連鎖分析表明DMD 位點位于X 染色體Xp21 條帶上。患DMD 疾病的病人通常在該條帶上產(chǎn)生DNA重排(Rearrangement)。通過比較X-連鎖DNA探針與患者DNA和正常人的雜交能力,可以獲得重排或患者體內(nèi)相關(guān)的克隆片段。染色體步移用來建立探針兩端的限制性圖譜,范圍可超過100kb 的區(qū)域。通過對一系列患者中獲得的DNA 分析,確定該區(qū)域有一很大缺失,并在兩個方向上延伸。最值得一提的是,缺失切除了一個對基因功能很重要的片段,并且該基因或至少基因的一部分包含在這個區(qū)域內(nèi)Figure 2.18 The gene involved in Du
58、chenne muscular dystrophy has been tracked down by chromosome mapping and walking to a region in which deletions can be identified with the occurrence of the disease.2.6 Genes can be isolated by the conservation of exonsThis approach is especially important when the target gene is spread out because
59、 it has many large introns. This proved to be the case with Duchenne muscular dystrophy (DMD), a degenerative disorder of muscle, which is X-linked and affects 1 in 3500 of human male births. The steps in identifying the gene are summarized in Figure 2.10.基因在染色體上的大致區(qū)域確定后,我們需要鑒定它的內(nèi)含子和外顯子。采用zoo blot方法
60、確定了與小鼠X 染色體和其他哺乳動物DNA 雜交的片段(圖2.19),詳細(xì)檢查片段內(nèi)是否存在開放讀框和典型的內(nèi)含子-外顯子邊界序列。將符合這些標(biāo)準(zhǔn)的片段作為探針,進一步在肌肉mRNA 構(gòu)建的 cDNA 文庫中檢測同源序列。Figure 2.19 The Duchene muscular dystrophy gene has been characterized by zoo blotting, cDNA hybridization, genomic hybridization, and identification of the protein. 2.6 Genes can be isolat
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 西安市2025年度租賃汽車限行區(qū)域合同3篇
- 2024年09月河南2024中原銀行三門峽分行秋季校園招考筆試歷年參考題庫附帶答案詳解
- 2025版智能汽車零部件供應(yīng)合同范本3篇
- 2025年度高速公路交通安全設(shè)施安裝勞務(wù)分包合同3篇
- 二零二五版國際貿(mào)易合同模板:FOB價格條款的合規(guī)與執(zhí)行3篇
- 2024年08月中國光大銀行杭州分行交易銀行單證業(yè)務(wù)崗招聘筆試歷年參考題庫附帶答案詳解
- 2024年08月上海浦東發(fā)展銀行北京分行社會招考筆試歷年參考題庫附帶答案詳解
- 2025年度移動通信基站租賃及維護合同3篇
- 2024年05月浙江浙江民泰商業(yè)銀行職能類社會招考(520)筆試歷年參考題庫附帶答案詳解
- 2024年03月廣東2024年深圳福田銀座村鎮(zhèn)銀行春季校園招考筆試歷年參考題庫附帶答案詳解
- 2024年??谑羞x調(diào)生考試(行政職業(yè)能力測驗)綜合能力測試題及答案1套
- 六年級數(shù)學(xué)質(zhì)量分析及改進措施
- 一年級下冊數(shù)學(xué)口算題卡打印
- 2024年中科院心理咨詢師新教材各單元考試題庫大全-下(多選題部分)
- 真人cs基于信號發(fā)射的激光武器設(shè)計
- 【閱讀提升】部編版語文五年級下冊第三單元閱讀要素解析 類文閱讀課外閱讀過關(guān)(含答案)
- 四年級上冊遞等式計算練習(xí)200題及答案
- 法院后勤部門述職報告
- 2024年國信證券招聘筆試參考題庫附帶答案詳解
- 道醫(yī)館可行性報告
- 視網(wǎng)膜中央靜脈阻塞護理查房課件
評論
0/150
提交評論