3-基因、基因組和基因組學(xué)_第1頁
3-基因、基因組和基因組學(xué)_第2頁
3-基因、基因組和基因組學(xué)_第3頁
3-基因、基因組和基因組學(xué)_第4頁
3-基因、基因組和基因組學(xué)_第5頁
已閱讀5頁,還剩141頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、2021-12-201第三章第三章 基因、基因組和基因組學(xué)基因、基因組和基因組學(xué) 基因基因的化學(xué)本質(zhì)是DNA,它是遺傳信息的物質(zhì)載體,傳遞著支配生命活動的指令,是構(gòu)建生物體藍(lán)圖中的一頁,也是可以人工操作用于改造生命屬性的元件。2021-12-202 基因組基因組是指生物體的細(xì)胞中一套完整的遺傳信息,包括所有的基因和基因間包括所有的基因和基因間區(qū)域區(qū)域。 專門研究基因組結(jié)構(gòu)和功能的學(xué)科,稱為基因組學(xué)基因組學(xué),它主要通過基因組作圖、基因測序和基因定位等方法來研究基因組結(jié)構(gòu)和變異。 2021-12-203第一節(jié) 基因的概念 一、對基因的認(rèn)識 對基因的認(rèn)識和研究大體上可以分為三個階段: 1)在20世紀(jì)

2、50年代以前,主要從細(xì)胞的染色體水平上進(jìn)行研究,屬于基因的染色體遺傳學(xué)階段; 2)50年代以后,主要從DNA大分子水平上進(jìn)行研究,屬于基因的分子生物學(xué)階段;2021-12-204 3)最近20多年來,由于重組DNA技術(shù)的完善和應(yīng)用,人們改變了從表型到基因的傳統(tǒng)研究途徑,而能夠直接從克隆目的基因出發(fā),研究基因的功能及其與表型的關(guān)系,使基因的研究進(jìn)入了反向生物學(xué)階段。 反向生物學(xué)反向生物學(xué)是指利用重組DNA技術(shù)和離體定向誘變的方法研究結(jié)構(gòu)已知基因的相應(yīng)功能,在體外使基因突變,再導(dǎo)入體內(nèi),檢測突變的遺傳效應(yīng),即以表型以表型來探索基因的結(jié)構(gòu)和功能來探索基因的結(jié)構(gòu)和功能。2021-12-205 二、基因

3、概念的擴(kuò)展 分子生物學(xué)和分子遺傳學(xué)的不斷發(fā)展,特別是DNA分子克隆技術(shù)、DNA序列的快速測定,以及核酸分子雜交技術(shù)等現(xiàn)代實驗手段的不斷涌現(xiàn),為進(jìn)一步深入研究基因結(jié)構(gòu)和功能提供了條件,“移動基因”、“斷裂基因”、“假基因”、“重疊基因”等有關(guān)基因的新概念,豐富了對基因本質(zhì)的認(rèn)識。2021-12-206 1、移動基因 移動基因(movable genes)又稱轉(zhuǎn)位因子(transposable elements)。由于它可以從染色體基因組上的一個位置轉(zhuǎn)移到另一個位置,甚至在不同染色體之間躍遷,因此也稱跳躍基因(jumping genes)。2021-12-207 轉(zhuǎn)位轉(zhuǎn)位和易位易位是兩個不同的概念

4、。 易位是指染色體發(fā)生斷裂后,通過同另一條染色體斷端連接轉(zhuǎn)移到另一條染色體上。此時,染色體斷片上的基因也隨著染色體的重接而移動到新的位置。 轉(zhuǎn)位則是在轉(zhuǎn)位酶的作用下,轉(zhuǎn)位因子或是直接從原來位置上切離下來,然后插入染色體新的位置;或是染色體上的DNA序列轉(zhuǎn)錄成RNA,隨后反轉(zhuǎn)錄為cDNA,再插入染色體上新的位置。這樣,在原來位置上仍然保留轉(zhuǎn)位因子,而其拷貝則插入新的位置,也就是使轉(zhuǎn)位因子在基因組中的拷貝數(shù)又增加一份。2021-12-208 2、斷裂基因或不連續(xù)基因 通過對真核生物編碼基因的研究發(fā)現(xiàn),在編碼序列中間插有與氨基酸編碼無關(guān)的DNA間隔區(qū),這些間隔區(qū)稱為內(nèi)含子內(nèi)含子(intronintr

5、on)、內(nèi)元、介入序列或間隔子;而編碼區(qū)則稱為外顯子(外顯子(exonexon)、外元或表達(dá)子。含有內(nèi)含子的編碼序列稱為不連續(xù)基因或斷裂基因(split genes)。2021-12-209 斷裂基因最早是在腺病毒中發(fā)現(xiàn)的斷裂基因最早是在腺病毒中發(fā)現(xiàn)的。Sharp及其同事在R-嚕噗(R-loop)實驗中發(fā)現(xiàn),腺病毒的hexon基因在與其相對應(yīng)的成熟轉(zhuǎn)錄產(chǎn)物mRNA進(jìn)行雜交時,會出現(xiàn)DNA嚕噗環(huán)(圖3-1)。說明: mRNA分子與其模板DNA相比,丟失了一些基因片段。 后來證實,這些片段是在mRNA加工過程中從初級轉(zhuǎn)錄本上被“剪切出去”的。2021-12-20102021-12-2011 內(nèi)含子

6、的起源和它存在的生物學(xué)意義 是一個極其誘人的研究課題,但是目前還不完全清楚,可能與基因的分子進(jìn)化相關(guān)。2021-12-2012 斷裂基因在表達(dá)時首先轉(zhuǎn)錄成初級轉(zhuǎn)錄產(chǎn)物,即前體mRNA或核內(nèi)不均一RNA(hnRNA);然后經(jīng)過刪除和連接,除去無關(guān)的DNA內(nèi)含子序列的轉(zhuǎn)錄物,稱為成熟的mRNA分子。 這種刪除內(nèi)含子、連接外顯子的過程,稱為RNARNA拼接拼接(RNA splicing)(圖3-2)。2021-12-20132021-12-2014 例外:例外: 現(xiàn)在已經(jīng)知道,并非所有的內(nèi)含子都“含而不顯”。有些內(nèi)含子可以編碼蛋白質(zhì),這些蛋白質(zhì)的功能與內(nèi)含子序列的刪除或傳播擴(kuò)散相關(guān)。 如1980年,

7、Church等人發(fā)現(xiàn)酵母線粒體細(xì)胞色素氧化酶基因的內(nèi)含子產(chǎn)物是該基因mRNA前體進(jìn)行拼接的反式作用因子。2021-12-2015 真核生物的外顯子也并非都“顯“(編碼氨基酸)。除了tRNA基因和rRNA基因的外顯子是理所當(dāng)然地不顯以外,幾乎全部的蛋白質(zhì)基因的首尾兩個外顯子首尾兩個外顯子都只有部分核苷酸序列編碼氨基酸,還有完全不編碼氨基酸的外顯子(如人類尿激酶基因的第一個外顯子的88個核苷酸序列)。2021-12-2016 3、假基因 有些基因核苷酸序列與相應(yīng)的正常功能基因基本相同,但卻不能合成出功能蛋白質(zhì),這些失活基因稱為假基因(pseudo gene),通常用表示。1977年在爪蟾的5S基因

8、家族中首先發(fā)現(xiàn)了假基因。以后在珠蛋白基因家族、免疫球蛋白基因家族以及組織相容性抗原基因家族中也都發(fā)現(xiàn)了假基因。2021-12-2017 如: 珠蛋白基因編碼血紅蛋白的珠蛋白鏈,人類珠蛋白基因由分別位于不同染色體上的兩個相關(guān)的基因家族(和)組成,其中,人類的簇分布在50kb范圍的DNA上,包含5個有功能的基因(,兩個,)和一個假基因1。兩個基因只有一個氨基酸的差別,第136位在G中為Gly,而在A為Ala。2021-12-2018 簇含有3個功能基因,3個假基因和1個未知功能的基因,排列順序為、2、1、2、1、(圖3-3)。序列分析表明,1基因同三個有功能的-珠蛋白基因DNA序列相似(1基因同有

9、功能的2基因的序列相似性為73),只是假基因中含有很多突變,如起始密碼子ATG變成GTG;5端的兩個內(nèi)含子也有突變,可能導(dǎo)致RNA拼接的破壞;在編碼區(qū)內(nèi)也存在許多點突變和缺失。2021-12-20192021-12-2020 假基因的來源: 來源一: 1假基因被認(rèn)為是由-珠蛋白基因復(fù)制產(chǎn)生的:開始復(fù)制生成的基因是有功能的,后來在進(jìn)化中產(chǎn)生了一個失活突變。由于該基因是復(fù)制產(chǎn)生的,所以盡管失去了功能,但是不至影響到生物體的存活。隨后在假基因中又積累了更多的突變,從而形成了現(xiàn)今的假基因序列。2021-12-2021 除了重復(fù)的假基因外,在真核生物的染色體基因組中還存在著一類加工的假基因(proces

10、sed pseudogene)。這類假基因不與“親本基因”連鎖,結(jié)構(gòu)與轉(zhuǎn)錄本而非“親本基因”相似,如都沒有啟動子和內(nèi)含子,但在基因的3端都有一段延伸的腺嘌呤短序列,類似mRNA 3末端的polyA尾巴。這些特征表明(假基因的來源二): 這類假基因很可能來自加工后的RNA的DNA拷貝,稱為加工的假基因。2021-12-2022 4、重疊序列 傳統(tǒng)的基因概念把基因看作彼此獨立的、非重疊的實體。但是,隨著DNA測序技術(shù)的發(fā)展,在一些噬菌體和動物病毒中發(fā)現(xiàn),不同基因的核苷酸序列有時是可以共用的。也就是說,它們的核苷酸序列可以是彼此重疊的。這種具有獨立性但使用部分共同序列的基因稱為重疊基因(overla

11、pping genes)或嵌套基因(nested genes)。2021-12-2023 如: 大腸桿菌X174噬菌體單鏈DNA共有5 387個核苷酸。如果使用單一的讀碼結(jié)構(gòu),它最多只能編碼1 795個氨基酸。按每個氨基酸的平均分子量為110計算,該噬菌體所合成的全部蛋白質(zhì)總分子量最多為197 000。2021-12-2024 但實際測定發(fā)現(xiàn): X174噬菌體共編碼11種蛋白質(zhì),總分子量高達(dá)262 000。 如何設(shè)計實驗解釋? 1977年,Sanger等人測定了X174噬菌體的核苷酸序列,發(fā)現(xiàn)它的一部分DNA能夠編碼兩種不同的蛋白質(zhì),從而解釋了上述矛盾。2021-12-2025 根據(jù)Sange

12、r等人的研究,X174噬菌體DNA中存在兩種不同的重疊基因: 第一種是一個基因的核苷酸序列完全包含在另一個基因的核苷酸序列中。例如,B基因位于A基因之中,E基因位于D基因中,只是它們的讀碼結(jié)構(gòu)不同,因此編碼不同的蛋白質(zhì)(圖3-4)。2021-12-2026 第二種類型,兩個基因的核苷酸序列的末端密碼子相互重疊。例如,A基因終止密碼子的3個核苷酸TGA,與C基因的起始密碼子ATG相互重疊了2個核苷酸;D基因的終止密碼子TAA與J基因的起始密碼子ATG重疊了一個核苷酸。后來在G4病毒的單鏈環(huán)狀DNA基因組中還發(fā)現(xiàn)三個基因共有一段重疊的DNA序列。2021-12-2027 不僅在細(xì)菌、噬菌體和病毒等

13、低等生物基因組中存在重疊序列,在一些真核生物中也存在不同于原核生物的其它類型的重疊序列。有一種特殊的重疊基因,一個基因的編碼序列完全寓居于另一個基因的內(nèi)含子序列中。例如果蠅的GART基因(該基因編碼參與嘌呤生物合成的酶蛋白)的內(nèi)含子中寓居著一個與之無關(guān)的編碼蛹角質(zhì)膜蛋白(cuticle protein)的基因,但是它的轉(zhuǎn)錄方向與GART基因相反。2021-12-2028 重疊基因是近年來在基因結(jié)構(gòu)與功能研究上的一個非常有意義的發(fā)現(xiàn)。它修正了關(guān)于各個基因的多核苷酸序列彼此分立、互不重疊的傳統(tǒng)觀念。 目前在X174噬菌體、G4噬菌體以及一些病毒和少數(shù)真核基因中發(fā)現(xiàn)了重疊基因的現(xiàn)象。但是,它是否具有

14、普遍意義,特別是在真核生物中是否廣泛存在,都還有待于進(jìn)一步深入研究。2021-12-2029三、基因的種類和結(jié)構(gòu) 1、基因的種類 基因按其功能主要分為結(jié)構(gòu)基因、調(diào)控基因和RNA基因。 (1)、結(jié)構(gòu)基因(structure gene):結(jié)構(gòu)基因是能決定某些多肽鏈(蛋白質(zhì))或酶分子結(jié)構(gòu)的基因。結(jié)構(gòu)基因的突變可導(dǎo)致特定蛋白質(zhì)(或酶)一級結(jié)構(gòu)的改變。2021-12-2030 (2)、調(diào)控基因(regulator gene):調(diào)控基因是具有調(diào)節(jié)控制結(jié)構(gòu)基因表達(dá)功能的基因。調(diào)控基因的突變可以影響一個或多個結(jié)構(gòu)基因的功能,導(dǎo)致蛋白質(zhì)(或酶)量或活性的改變。 (3)、RNA基因:有的基因只轉(zhuǎn)錄不翻譯,如核糖體

15、RNA基因和轉(zhuǎn)運RNA基因,產(chǎn)物分別為rRNA和tRNA。2021-12-2031圖3-6原核基因的典型結(jié)構(gòu)2、基因的結(jié)構(gòu)2021-12-2032 圖3-5 真核基因的典型結(jié)構(gòu)2021-12-2033 真核生物基因以單順反子單順反子的形式存在,編碼單基因產(chǎn)物。 原核生物的基因以多順反子多順反子的形式存在,轉(zhuǎn)錄產(chǎn)生的mRNA,可同時編碼兩種甚至數(shù)種基因產(chǎn)物。2021-12-2034四、生物體內(nèi)基因的大小和數(shù)目 1、基因的大小 真核生物中,由于內(nèi)含子序列的存在,基因比實際編碼蛋白質(zhì)的序列要大得多。 外顯子的大小與基因的大小沒有必然的聯(lián)系。與整個基因相比,編碼蛋白質(zhì)的外顯子要小得多,大多數(shù)外顯子編碼

16、的氨基酸數(shù)小于100。2021-12-2035 內(nèi)含子通常比外顯子大得多,因此基因的大小取決于它所包含的內(nèi)含子的長度,一些基因的內(nèi)含子特別長,例如哺乳動物的二氫葉酸還原酶基因含有6個外顯子,其mRNA的長度為2kb,但基因的總長度達(dá)2531kb,含有長達(dá)幾十kb的內(nèi)含子。內(nèi)含子之間也有很大的差別,大小從幾百個堿基對到幾萬個堿基對不等。2021-12-2036 基因的大小還與所包含的內(nèi)含子的數(shù)目有關(guān)。 在不同的基因中,內(nèi)含子的數(shù)目變化很大,有些斷裂基因含有一個或少數(shù)幾個內(nèi)含子,如珠蛋白基因;某些基因含有較多的內(nèi)含子,如雞卵清蛋白基因有7個內(nèi)含子,伴清蛋白基因含有16個內(nèi)含子。2021-12-20

17、37 由于基因的大小取決于內(nèi)含子的長度和基因的大小取決于內(nèi)含子的長度和數(shù)目數(shù)目,導(dǎo)致酵母和高等真核生物的基因大小差異很大。大多數(shù)酵母基因小于2kb,很少有超過5kb的。而高等真核生物的大多數(shù)基因長度在5100kb之間。2021-12-2038種類平均外顯子數(shù)目平均基因長度(kb)平均mRNA長度(kb)酵母11.61.6真菌31.51.5藻蟲44.03.0果蠅411.32.7雞913.92.4哺乳動物716.62.2表3-1 不同生物的平均基因大小2021-12-2039 2、基因的數(shù)目 從基因組的大小可以粗略地算出基因的數(shù)目。雖然一些基因通過選擇性表達(dá)可以產(chǎn)生一個以上的產(chǎn)物,但這種現(xiàn)象并不常

18、見,對基因數(shù)目的計算影響不大。2021-12-2040 為準(zhǔn)確地確定基因數(shù)目,需要知道整個基因組的DNA序列和基因密度。 目前已知酵母基因組的全序列,其基因密度較高,平均每個開放閱讀框(open reading frame,ORF)為1.4kb,基因間的平均分隔為600bp,即大約70的序列為開放閱讀框。其中約一半基因是已知的基因或與已知基因有關(guān)的基因,其余是新基因。因此可推測未發(fā)現(xiàn)基因的數(shù)目。2021-12-2041種類基因組大小(bp)基因數(shù)目人3.31093000035000果蠅1.41088750酵母1.31076100大腸桿菌4.21064288支原體1.0106750噬菌體T41.

19、6105200表3-2不同生物的基因數(shù)目2021-12-2042 如果不知道基因組的基因密度,就難以估計基因數(shù)目。可采取的方法有: 基因分離鑒定 計算表達(dá)基因的數(shù)目 突變分析2021-12-2043 五、基因簇與重復(fù)基因 1、基因家族和基因簇 基因家族(gene family)是真核生物基因組中來源相同、結(jié)構(gòu)相似、功能相關(guān)的一組基因。盡管基因家族各成員序列上具有相關(guān)性,但序列相似的程度以及組織方式不同。其中大部分有功能的家族成員之間相似程度很高,有些家族成員間的差異很大,甚至有無功能的假基因。2021-12-2044 基因家族的成員在染色體上的分布形式是不同的: 有些基因家族的成員在特殊的染色

20、體區(qū)域上成簇存在; 另一些基因家族的成員在整個染色體上廣泛地分布,甚至可存在于不同的染色體上。2021-12-2045 根據(jù)家族成員的分布形式,可以把不同的基因家族分為成簇存在的基因家族(clustered gene family)即基因簇以及散布的基因家族(interspersed gene family)。2021-12-2046 (1) 基因簇基因簇(gene cluster):基因家族的各成員緊密成簇排列成大段的串聯(lián)重復(fù)單位,定位于染色體的特殊區(qū)域。它們是同一個祖先基因擴(kuò)增的產(chǎn)物同一個祖先基因擴(kuò)增的產(chǎn)物。 基因簇中也包括沒有生物功能的假基因。通?;虼貎?nèi)各序列間的同源性大于基因簇間的序

21、列同源性。2021-12-2047 (2)散布的基因家族散布的基因家族:家族成員在DNA上無明顯的物理聯(lián)系,甚至分散在多條染色體上。各成員在序列上有明顯差別,其中也含有假基因。但這種假基因與基因簇中的假基因不同,它們來源于RNA介導(dǎo)的轉(zhuǎn)座作用。2021-12-2048 按照基因家族成員之間序列相似的程度,可把基因家族分為以下幾類: (1)經(jīng)典的基因家族,家族中各基因的全序列或至少編碼序列具有高度的同源性,如rRNA基因家族和組蛋白基因家族。在進(jìn)化過程中,這些家族成員有自動均一化的趨勢。它們的特點是:各成員間有高度的序列一致性,甚至完全相同;拷貝數(shù)高,常有幾十個甚至幾百個拷貝;非轉(zhuǎn)錄的間隔區(qū)短而

22、且一致。2021-12-2049 (2)基因家族各成員的編碼產(chǎn)物上具有大段的高度保守氨基酸序列,這對基因發(fā)揮功能是必不可少的。基因家族的各基因中有部分十分保守的序列,但總的序列相似性卻很低。 (3)家族各成員的編碼產(chǎn)物之間只有一些很短的保守氨基酸序列。從DNA水平上看,這些基因家族成員之間的序列同源性更低。但其基因編碼產(chǎn)物具有相同的功能,因為在蛋白質(zhì)中存在發(fā)揮生物功能所必不可少的保守區(qū)域。2021-12-2050 (4)超基因家族(gene superfamily),家族中各基因序列間沒有同源性,但其基因產(chǎn)物的功能相似。蛋白質(zhì)產(chǎn)物中雖沒有明顯保守的氨基酸序列,但從整體上看卻有相同的結(jié)構(gòu)特征,如

23、免疫球蛋白家族。2021-12-2051 2、重復(fù)序列 除了基因家族外,染色體上還有大量無轉(zhuǎn)錄活性的重復(fù)DNA序列家族,主要是基因以外的DNA序列。重復(fù)序列有兩種組織形式: 一種是串聯(lián)重復(fù)DNA,成簇存在于染色體的特定區(qū)域; 另一種是散布的重復(fù)DNA,重復(fù)單位并不成簇存在,而是分散于染色體的各個位點上,來源于RNA介導(dǎo)的轉(zhuǎn)座作用。散布的重復(fù)序列家族的許多成員是可轉(zhuǎn)移的元件,是不穩(wěn)定的,可轉(zhuǎn)移到基因組的不同位置。2021-12-2052 (1)串聯(lián)重復(fù)DNA 有些高度重復(fù)DNA序列的堿基組成和浮力密度同主體DNA有區(qū)別,在浮力密度梯度離心時,可形成不同于主DNA帶的衛(wèi)星帶,稱為衛(wèi)星DNA。 衛(wèi)星

24、DNA由非常短的串聯(lián)重復(fù)DNA序列組成。這些序列一般對應(yīng)于染色體上的異染色質(zhì)區(qū)域。2021-12-2053 有些高度重復(fù)序列的堿基組成與主體DNA相差不大,不能通過浮力密度梯度離心法分離,但可以通過其它方法鑒定(如限制性作圖),這樣的DNA序列稱為隱蔽衛(wèi)星DNA。2021-12-2054 根據(jù)重復(fù)單位的大小,這些非編碼的高度重復(fù)的DNA序列可以進(jìn)一步分為 衛(wèi)星DNA(satellite DNA)、 小衛(wèi)星DNA(minisatellite DNA)、 微衛(wèi)星DNA(microsatellite DNA)三類(表3-3)。2021-12-2055分類長度重復(fù)單位大小(bp)染色體定位衛(wèi)星衛(wèi)星DN

25、A100kb數(shù)Mb衛(wèi)星序列2和35整個染色體衛(wèi)星序列12548大多數(shù)染色體著絲粒和其它異染色質(zhì)區(qū)域171所有染色體著絲粒(Sau3A家族)681,9,13,14,15,21,22號和染色體的著絲粒小衛(wèi)星小衛(wèi)星DNA0.120kb端粒家族6所有染色體端粒高變家族微衛(wèi)星微衛(wèi)星DNA小于150bp92414所有染色體,通??拷肆K腥旧w表3-3人類基因組的主要串聯(lián)重復(fù)序列2021-12-2056 2、散布的重復(fù)DNA 重復(fù)序列以散在方式分布于基因組內(nèi)。根據(jù)重復(fù)序列的長短不同,可以分為短散布元件和長散布元件。 短散布元件的重復(fù)序列長度在500bp以下,在人基因組中的重復(fù)拷貝數(shù)達(dá)10萬以上。 長散布

26、元件的重復(fù)序列在1000bp以上,在人類基因組中有上萬份拷貝。2021-12-2057 在人類基因組中有一種中等重復(fù)序列,長約300bp,30萬個成員分散分布在單倍體基因組中,在其170bp處有一個限制性酶AluI的酶切位點,因此被稱為AluAlu基因基因家族(家族(Alu familyAlu family)。 人類基因組中,大約平均每隔6kb左右就有一個Alu序列,一般出現(xiàn)在內(nèi)含子或基因附近,可以作為人類DNA片段的特征標(biāo)記。2021-12-2058 Alu家族的廣泛存在暗示它可能具有一定的功能。 部分Alu序列中有14bp與乳頭瘤病毒、乙型肝炎病毒的復(fù)制起始區(qū)有同源性,因此推測Alu家族可

27、能和真核基因組的復(fù)制區(qū)相連接。但是Alu家族的成員數(shù)要比推測的復(fù)制區(qū)多10倍。2021-12-2059第二節(jié)基因組 基因組(genome)一詞最早出現(xiàn)于1922年,指的是單倍體細(xì)胞中所含的整套染色體。近年來,學(xué)術(shù)界更多地把基因組定義為整套染色體中的全部基因。隨著對不同生物的基因組DNA的測序,人們發(fā)現(xiàn),對基因組這個名詞需要做出更精確的定義?,F(xiàn)在認(rèn)為,基因組指的是細(xì)胞或生物體中所有的DNA,包括所有的基因和基因間隔區(qū)域。2021-12-2060 原核生物基因組就是原核細(xì)胞內(nèi)構(gòu)成染色體的一個DNA分子。 真核生物有細(xì)胞核,染色體位于細(xì)胞核內(nèi),所以真核生物的核基因組是指單倍體細(xì)胞核內(nèi)整套染色體所含有

28、的DNA分子。 除了核基因組以外,真核細(xì)胞內(nèi)還有細(xì)胞器基因組,即動物細(xì)胞和植物細(xì)胞的線粒體基因組以及存在于植物細(xì)胞的葉綠體基因組。2021-12-2061 目前已經(jīng)完成了多種模式生物如大腸桿菌、酵母菌、線蟲、果蠅和小鼠以及芥南菜等的基因組測序工作,2001年,人類基因組的測序工作也基本完成。2021-12-2062 一、原核生物基因組 原核生物的遺傳信息是雙鏈脫氧核糖核酸分子(DNA)。 在原核生物中有兩類DNA分子: 一是染色體,攜帶了細(xì)胞生存和繁殖所必需的所有遺傳信息; 二是質(zhì)粒,是細(xì)胞核外獨立存在的DNA分子,與細(xì)胞的生長沒有必然的關(guān)系。2021-12-2063 1、細(xì)菌染色體的結(jié)構(gòu) 所

29、有已知的原核生物的染色體都由DNA的四種不同堿基構(gòu)成: 腺嘌呤(A),鳥嘌呤(G), 胸腺嘧啶(T),胞嘧啶(C)。 每個物種具有特定的平均G+C含量,變化范圍從24%(支原體)到76%(微球菌),多數(shù)為50%左右。2021-12-2064 原核生物一般只有一個染色體即一個DNA分子。但是在不同生長條件下,染色體分子可能有一個、兩個、甚至更多的拷貝。 例如,當(dāng)大腸桿菌在適宜的生長培養(yǎng)基中培養(yǎng)時,可以有四個以上的染色體拷貝。2021-12-2065 2、其它自主的遺傳物質(zhì): 質(zhì)粒和噬菌體 質(zhì)粒是細(xì)菌染色體外的可以自主復(fù)制的DNA分子。大多數(shù)質(zhì)粒都是環(huán)狀超螺旋大多數(shù)質(zhì)粒都是環(huán)狀超螺旋雙鏈雙鏈DNA

30、,DNA, 稱為共價閉合環(huán)狀分子。 細(xì)胞中質(zhì)粒DNA分子具有穩(wěn)定的拷貝數(shù)。正常生理條件下,其拷貝數(shù)在世代之間保持不變。2021-12-2066 質(zhì)粒DNA和寄主細(xì)胞染色體DNA分離:密度梯度離心。 當(dāng)含有溴化乙錠(EtBr)的氯化銫(CsCl)溶液加到大腸桿菌裂解液中時,染色體DNA和質(zhì)粒DNA因為結(jié)合的EtBr分子數(shù)不同而具有不同的密度,在密度梯度離心時形成不同的平衡條帶,達(dá)到分離目的(圖3-7)。 2021-12-2067圖圖3-7 氯化銫密度梯度離心氯化銫密度梯度離心法制備質(zhì)粒法制備質(zhì)粒2021-12-2068 噬菌體是以細(xì)菌為寄主的病毒。 噬菌體被一層蛋白包膜覆蓋,可以在細(xì)菌外生存,再

31、結(jié)合到細(xì)菌上。 噬菌體由兩類生物大分子組成,即蛋白質(zhì)和核酸。 一種病毒顆粒具有一種類型的核酸。2021-12-2069 噬菌體的核酸: 最常見的是雙鏈線性DNA。 此外也有雙鏈環(huán)狀DNA、 單鏈環(huán)狀DNA、 單鏈線性DNA 以及單鏈RNA等多種形式。2021-12-2070圖圖3-8 噬菌體的生長周期噬菌體的生長周期識別如HIV2021-12-2071 適當(dāng)條件下,噬菌體基因組DNA開始表達(dá)噬菌體的殼體蛋白、噬菌體組裝所需蛋白等,在宿主細(xì)胞內(nèi)完成子代噬菌體的組裝,并裂解宿主細(xì)胞,釋放子代噬菌體,進(jìn)入裂解期。 噬菌體需要結(jié)合到宿主細(xì)胞上才能生長和繁殖2021-12-2072 二、真核生物基因組

32、大多數(shù)真核生物基因組包含于細(xì)胞核內(nèi),大部分DNA序列不編碼蛋白質(zhì)。 1、C值矛盾與基因組大小 一個單倍體基因組的全部DNA含量總是恒定的,這是物種的一個特征,通常稱為該物種的C值。不同物種的C值差異很大,從小于106bp到1011bp。由圖3-9可見,隨著生物的進(jìn)化,生物體的結(jié)構(gòu)和功能越復(fù)雜,其C值就越大。2021-12-2073圖3-9 單倍體基因組DNA 含量在低等真核生物中與形態(tài)復(fù)雜性有一定的正相關(guān),但在高等真核生物中卻非如此,它們的單倍體基因組DNA含量變化不定。2021-12-2074 在結(jié)構(gòu)、功能很相似的同類生物中,甚至在親緣關(guān)系非常接近的物種之間,C值可以相差數(shù)十倍乃至上百倍。

33、突出的例子是兩棲動物,C值小的可以低至109bp以下,C值大的可以高達(dá)1011bp。而哺乳類動物C值均在109bp。 這種現(xiàn)象稱為C值矛盾。2021-12-2075 2、重復(fù)序列 真核生物基因組序列包括三種類型,分別是 快復(fù)性組分即高度重復(fù)序列,占總DNA的25%; 中度復(fù)性成分即中度重復(fù)序列,占總DNA的30%; 慢復(fù)性組分即非重復(fù)序列,占總DNA的45%。2021-12-2076 3、細(xì)胞器基因組 除了在低等的真核生物中有一些線性的細(xì)胞器DNA外,大多數(shù)真核生物中,細(xì)胞器基因組都是環(huán)狀非重復(fù)環(huán)狀非重復(fù)DNADNA序列序列。 每個細(xì)胞中有多個細(xì)胞器,因此有多個獨立存在的細(xì)胞器基因組。2021

34、-12-2077 (1)線粒體基因組 動物細(xì)胞線粒體基因組比較小,人、鼠和牛的線粒體基因組都只有16.5kb。與核DNA相比,線粒體DNA所占的比例不到1。 酵母線粒體基因組很大,釀酒酵母的線粒體基因組為84kb,而且每個線粒體中有4個拷貝。2021-12-2078圖圖3-10人線粒體基因組人線粒體基因組2021-12-2079 現(xiàn)代研究發(fā)現(xiàn)線粒體DNA的重要性。 線粒體有自己的蛋白質(zhì)合成體系,其中rRNA和tRNA均由線粒體自身基因組編碼合成。線粒體tRNA比核基因編碼的tRNA要小,核糖體也比較小。其RNA聚合酶、氨酰-tRNA合成酶和核糖體蛋白質(zhì)均由核基因編碼,但卻是細(xì)胞器專用的,不同于

35、細(xì)胞質(zhì)中的蛋白質(zhì)合成系統(tǒng)。2021-12-2080 線粒體中其它蛋白質(zhì)的合成也常常由核基因和線粒體基因共同參與。 如酵母線粒體中ATP合成酶、細(xì)胞色素c氧化酶的各亞基、細(xì)胞色素bc1復(fù)合物都是核基因組和細(xì)胞器基因組共同編碼的。2021-12-2081 (2)葉綠體基因組 葉綠體基因組相對來說比較大,從高等植物的140kb到低等真核生物的200kb。葉綠體基因組可編碼與蛋白質(zhì)合成有關(guān)的rRNA和tRNA,以及大約50種蛋白質(zhì),包括RNA聚合酶和一些核糖體蛋白。2021-12-2082 4、染色體和染色質(zhì) 染色體是細(xì)胞在有絲分裂時遺傳物質(zhì)存在的特定形式,是間期細(xì)胞染色質(zhì)結(jié)構(gòu)緊密包裝的結(jié)果。染色體和

36、染色質(zhì)是真核生物遺傳物質(zhì)存在的兩種不同形態(tài),反映了它們處于細(xì)胞分裂周期的不同功能階段,兩者不存在成分上的差異。2021-12-2083 染色質(zhì)(chromatin)是指真核生物細(xì)胞核中,在細(xì)胞分裂期間能被堿性染料著色的物質(zhì),由DNA、組蛋白、非組蛋白和少量RNA組成,是細(xì)胞分裂間期遺傳物質(zhì)的存在形式。染色質(zhì)由最基本的單位核小體成串排列而成的。2021-12-2084 染色質(zhì)根據(jù)形態(tài)特征和染色性能可分為兩種類型: 常染色質(zhì)(euchromatin)和異染色質(zhì)(heterochromatin)。 常染色質(zhì)中DNA的包裝比(packing ration)約為10002000,即DNA的實際長度是染色

37、質(zhì)長度的1000倍2000倍。2021-12-2085 構(gòu)成常染色質(zhì)的DNA主要是單一序列DNA和中度重復(fù)序列DNA。 常染色質(zhì)中并非所有基因都具有轉(zhuǎn)錄活性,處于常染色質(zhì)狀態(tài)只是基因轉(zhuǎn)錄的必要條件,而不是充分條件。2021-12-2086 異染色質(zhì)分為結(jié)構(gòu)異染色質(zhì)或組成型異染色質(zhì)和兼性異染色質(zhì)。 結(jié)構(gòu)異染色質(zhì)指的是除復(fù)制期外,在整個細(xì)胞周期均處于聚縮狀態(tài),DNA包裝比在整個細(xì)胞周期中基本沒有較大變化的異染色質(zhì),主要包括衛(wèi)星DNA序列、著絲粒區(qū)、端粒、次縊痕和染色體臂的某些節(jié)段等。2021-12-2087 兼性異染色質(zhì)是指在某些細(xì)胞類型或一定的發(fā)育階段,原來的常染色質(zhì)聚縮,并喪失基因轉(zhuǎn)錄活性,變

38、為異染色質(zhì)。 兼性異染色質(zhì)的總量隨不同細(xì)胞類型而變化,一般胚胎細(xì)胞含量很少,而高度特化的細(xì)胞含量較多,說明隨著細(xì)胞分化,較多的基因漸次以聚縮狀態(tài)而關(guān)閉,再也不能接近基因活化蛋白。染色質(zhì)的緊密折疊壓縮可能是關(guān)閉基因活性的一種途徑。2021-12-2088 最典型的例子就是哺乳動物雌性個體中的兩個X染色體中有一個隨機(jī)失活,失去轉(zhuǎn)錄活性而導(dǎo)致異染色質(zhì)化。2021-12-2089 5、染色體功能實現(xiàn)的三要素 任何真核生物染色體的生物學(xué)功能都嚴(yán)格依賴于三種DNA序列結(jié)構(gòu):復(fù)制起點復(fù)制起點、著絲粒和端粒。、著絲粒和端粒。2021-12-2090 (1)復(fù)制起點(ARS) DNA序列分析發(fā)現(xiàn),不同來源的AR

39、S序列包含一段1114bp的高度同源的富含AT的共有序列及其上下游各200bp左右的區(qū)域,這是維持ARS功能所必需的。絕大多數(shù)真核細(xì)胞的染色體,含有多個復(fù)制起點,以確保染色體快速復(fù)制。2021-12-2091 (2)著絲粒DNA序列 (CEN) 著絲粒就是細(xì)胞分裂過程中染色體與紡錘絲(spindle fiber)結(jié)合的區(qū)域。因此,著絲粒在細(xì)胞分裂過程中對于母細(xì)胞中的遺傳物質(zhì)能否均衡地分配到子細(xì)胞中去是至關(guān)重要的。缺少著絲粒的染色體片斷,就不能和紡錘絲相連,在細(xì)胞分裂過程中容易丟失。2021-12-2092 CEN序列的共同特點是含有兩個相鄰的核心區(qū):8090bp的AT區(qū); 11bp的保守區(qū)。

40、缺失損傷試驗和插入突變實驗發(fā)現(xiàn)一旦傷及這兩個核心區(qū)序列,CEN即喪失生物學(xué)功能。2021-12-2093 (3)端粒DNA序列(TEL) 端粒由一系列短重復(fù)序列構(gòu)成,在人類的DNA里,端粒長約10至15kb,由重復(fù)的GGGTTA組成。其它生物端粒的重復(fù)序列也多為T和G,端粒的重復(fù)序列不是染色體DNA復(fù)制時連續(xù)合成的,而是由端粒酶(telomerase)合成、添加到染色體末端的。2021-12-20942021-12-2095 端粒酶端粒酶是由RNA和蛋白質(zhì)組成的核糖核蛋白,具有逆轉(zhuǎn)錄酶的性質(zhì),可以以特異的內(nèi)在RNA為模板,合成端粒重復(fù)序列,添加到染色體的3端。端粒與細(xì)胞壽命有關(guān),在細(xì)胞內(nèi)起著細(xì)

41、胞分裂計時器的作用,端粒長度與細(xì)胞分裂次數(shù)和細(xì)胞的衰老有關(guān)。腫瘤細(xì)胞具有端粒酶活性,使癌細(xì)胞獲得無限增殖的能力。2021-12-2096三、人類基因組計劃 “人類基因組計劃 (Human Genome Project, HGP)”和“曼哈頓原子彈計劃”、“人類登月計劃”一起被譽(yù)為二十世紀(jì)科學(xué)史上的三個里程碑。 1985年5月,美國能源部正式提出開展人類基因組的測序工作,形成了能源部的“人類基因組計劃”草案。1986年,美國生物學(xué)家、諾貝爾獎獲得者Renato Dulbecco 在“Science”上發(fā)表短文首次提出人類基因組計劃的設(shè)想,2021-12-2097 并建議組織國家級和國際級的項目來

42、進(jìn)行這方面的研究。1986年3月美國能源部在召開的一次專門會議上,正式提出實施測定人類基因組全順序的計劃。1988年4月,國際人類基因組織(HUGO)成立。1988年10月美國能源部和美國國立衛(wèi)生研究院達(dá)成協(xié)議,共同管理和實施這一計劃。1990年10月由美國國會批準(zhǔn)正式啟動HGP研究,隨后法國、英國、意大利、德國、日本等也相繼宣布開始各自的HGP研究。中國于1987年在“863計劃”中開始設(shè)立人類基因組研究課題。2021-12-2098 人類基因組計劃是一項國際性的研究計劃,目標(biāo)是通過以美國為主的全球性的國際合作,在大約15年的時間里完成人類24條染色體的基因組作圖和DNA全長序列分析,進(jìn)行基

43、因的鑒定和功能分析。人類基因組計劃的最終目標(biāo)是確定人類基因組所攜帶的全部遺傳信息,并確定、闡明和記錄組成人類基因組的全部DNA序列。2021-12-2099 具體任務(wù)有以下幾個方面: (1)基因組作圖 繪制兩大人類基因組圖譜,即遺傳連鎖圖譜和物理圖譜。 遺傳連鎖圖譜是通過家譜分析和遺傳性狀的連鎖分析而建立的; 物理圖譜是通過對構(gòu)成人類基因組的脫氧核糖核酸分子的化學(xué)測定而繪制的,包括限制酶切圖譜、排序的脫氧核糖核酸克隆庫以及對表達(dá)基因或無特征(功能不清)的脫氧核糖核酸片段的低分辨圖譜。2021-12-20100 所有圖譜的目標(biāo)都是把有關(guān)基因的遺傳信息,按其在每條染色體上相對位置線性地系統(tǒng)地排列出

44、來。2021-12-20101 (2)基因組測序(genome sequencing) 基因組的核苷酸順序是分辨率最高的物理圖譜,就人而言,意味著要排出30億個核苷酸的順序。同時,測定其它生物的基因組順序,以便與人類基因組進(jìn)行比較研究。 (3)基因識別(gene identification) 在作圖、基因定位和測序的同時,識別出基因的序列,設(shè)法克隆基因,以及著手研究基因的生物學(xué)功能。2021-12-20102 (4)模式生物(model organism)研究 從模式生物獲得的數(shù)據(jù)資料,可以為人類基因組的研究進(jìn)行技術(shù)的探索和經(jīng)驗的積累。有助于闡明人類的生物學(xué)規(guī)律。常用的模式生物有大腸桿菌、酵

45、母菌、線蟲、果蠅和小鼠等。在研究植物基因組時常用的模式生物是擬南芥菜(Arabideopis thaliana)。2021-12-20103斑馬魚小鼠2021-12-20104 (5)發(fā)展生物信息學(xué)和計算機(jī)學(xué) 隨著基因組研究的開展,全世界各個實驗室每天都產(chǎn)生大量的數(shù)據(jù),其中包括DNA測序、蛋白質(zhì)的氨基酸序列、基因組作圖標(biāo)記與定位等。涉及數(shù)據(jù)的收集、甄別、組裝、詮釋、分配和使用等各個環(huán)節(jié),因此,需要建立各種類型的數(shù)據(jù)庫,發(fā)展新的計算機(jī)設(shè)備和軟件,使生物學(xué)同信息科學(xué)和計算機(jī)科學(xué)緊密結(jié)合,形成了生物信息學(xué)(bioinformatics)和計算生物學(xué)(computational biology)。20

46、21-12-20105第三節(jié)基因組學(xué) 基因組研究應(yīng)該包括兩方面的內(nèi)容:以全基因組測序為目標(biāo)的結(jié)構(gòu)基因組學(xué)和以基因功能鑒定為目標(biāo)的功能基因組學(xué)。結(jié)構(gòu)基因組學(xué)代表基因組分析的早期階段,以建立生物體高分辨率遺傳圖譜、物理圖譜和大規(guī)模測序為基礎(chǔ)。功能基因組學(xué)代表基因分析的新階段,是利用結(jié)構(gòu)基因組學(xué)提供的信息系統(tǒng)地研究基因功能,以高通量、大規(guī)模的實驗方法以及統(tǒng)計與計算機(jī)分析為特征。2021-12-20106 隨著人類基因組作圖和基因組測序工作的完成,當(dāng)前的研究重心從結(jié)構(gòu)基因組學(xué)轉(zhuǎn)移到功能基因組學(xué)。2021-12-20107 一、結(jié)構(gòu)基因組學(xué) 結(jié)構(gòu)基因組學(xué)的內(nèi)容包括基因組作圖和基因組測序。2021-12-

47、20108 又稱染色體作圖: 由于人的染色體巨大,不能直接用于測序,將人類基因組這一的研究對象進(jìn)行分解,將其分為容易操作的小的結(jié)構(gòu)區(qū)域,這個過程簡稱為染色體作圖。 人類最大的1號染色體有263 Mb,最小的21號染色體也有50 Mb。 根據(jù)使用的標(biāo)記和手段的不同,染色體作圖可以分為遺傳連鎖作圖和物理作圖。2021-12-20109 (1)遺傳學(xué)圖又稱連鎖圖譜(linkage map),它是以具有遺傳多態(tài)性(在一個遺傳位點具有一個以上的等位基因,在群體中的出現(xiàn)頻率皆高于1%的遺傳標(biāo)記)為“路標(biāo)”,以遺傳學(xué)距離(在減數(shù)分裂事件中兩個位點之間進(jìn)行交換、重組的百分率,1%的重組率稱為1cM)為圖距的基

48、因組圖。2021-12-20110 人類基因組遺傳連鎖圖的繪制需要應(yīng)用多態(tài)性標(biāo)記。 人的DNA序列上平均每幾百個堿基會出現(xiàn)一些變異(variation),這些變異通常不產(chǎn)生病理性后果,并按照孟德爾遺傳規(guī)律由親代傳給子代,從而在不同個體間表現(xiàn)出不同,因而被稱為多態(tài)性(Polymorphism)?,F(xiàn)在的多態(tài)性標(biāo)記主要有三種:2021-12-20111 限制性片段長度多態(tài)性(限制性片段長度多態(tài)性( RFLPRFLP) RFLP是第1代標(biāo)記,用限制性內(nèi)切酶特異性切割DNA鏈,由于DNA的一個“點”上的突變所造成的能切與不能切兩種狀況,而產(chǎn)生不同長度的片段(等位片段),可用凝膠電泳顯示多態(tài)性,用作基因突

49、變分析、基因定位和遺傳病基因的早期檢測等方面。2021-12-20112 DNADNA重復(fù)序列的多態(tài)性標(biāo)記重復(fù)序列的多態(tài)性標(biāo)記 人類基因的多態(tài)性較多的是由重復(fù)序列造成的,這也是人類基因組的重要特點之一。重復(fù)序列的多態(tài)性有小衛(wèi)星DNA多態(tài)性或不同數(shù)目的串聯(lián)重復(fù)(VNTR)的多態(tài)性和微衛(wèi)星的DNA多態(tài)性等多種。2021-12-20113 指的是基因組DNA中有數(shù)十到數(shù)百個核苷酸片段的重復(fù),重復(fù)的次數(shù)在人群中有高度變異,總長不超過20kb,是一種遺傳信息量很大的標(biāo)記物,可以用Southern雜交或PCR法檢測。2021-12-20114 是基因組中由1-6個堿基的重復(fù),如(CA)n,(GT)n等產(chǎn)生

50、的,以CA重復(fù)序列的利用度為最高。 微衛(wèi)星DNA重復(fù)序列在染色體DNA中散在分布,其數(shù)量被認(rèn)為可達(dá)五到十萬,是目前最有用的遺傳標(biāo)記。第二代DNA遺傳標(biāo)記多指STR標(biāo)記。2021-12-20115 單核苷酸多態(tài)性標(biāo)記單核苷酸多態(tài)性標(biāo)記(SNP)(SNP),是1996年美國MIT的E.Lander提出的,被稱為“第三代DNA遺傳標(biāo)記”。 這種遺傳標(biāo)記的特點是單個堿基的置換,與第一代的RFLP及第二代的STR以長度的差異作為遺傳標(biāo)記的特點不同,而且SNP的分布密集,每千個核苷酸中可出現(xiàn)一個SNP標(biāo)記位點,2021-12-20116 在人類基因組中有300萬個以上的SNP遺傳標(biāo)記,這可能達(dá)到了人類基因

51、組多態(tài)位點數(shù)目的極限。這些SNP標(biāo)記以同樣的頻率存在于基因組編碼區(qū)或非編碼區(qū),存在于編碼區(qū)的SNP約有20萬個,稱為cSNP(coding SNP)。2021-12-20117 (2)物理圖譜(physical map) 是指DNA序列上兩點的實際距離,通常由DNA的限制酶片段或克隆的DNA片段有序排列而成,其基本單位是千堿基對(Kb)或百萬堿基對(Mb)。連鎖圖譜2021-12-20118 物理圖譜反應(yīng)的是DNA序列上兩點之間的實際距離,而遺傳圖譜則反應(yīng)這兩點之間的連鎖關(guān)系。在DNA交換頻繁的區(qū)域,兩個物理位置相距很近的基因或DNA片段可能具有較大的遺傳距離,而兩個物理位置相距很遠(yuǎn)的基因或D

52、NA片段則可能因該部位在遺傳過程中很少發(fā)生交換而具有很近的遺傳距離。2021-12-20119 全基因組的全基因組的“鳥槍法鳥槍法”測序策略測序策略 全基因組的“鳥槍法”測序策略,是指在獲得一定的遺傳和物理圖譜信息的基礎(chǔ)上,繞過建立連續(xù)的BAC克隆系的過程,直接將基因組DNA分解成小片段,進(jìn)行隨機(jī)測序,并輔以一定數(shù)量的10kb克隆和BAC克隆的末端測序結(jié)果,在此基礎(chǔ)上進(jìn)行序列拼接,直接得到待測基因組的完整序列。2021-12-201202021-12-20121 這一策略從一提出就受到質(zhì)疑,并不為主流的公共領(lǐng)域所采納。1995年,由Craig Venter領(lǐng)導(dǎo)的私營研究所TIGR(The In

53、stitute of Genomic Research)將這種方法應(yīng)用于對嗜血流感桿菌(H. influenzae)全基因組的測序中,成功的測定了它的全基因組序列。該方法隨后在對包括枯草桿菌、大腸桿菌等20多種微生物的基因組測序中得到了成功的應(yīng)用。2021-12-20122 1998年,TIGR和PE公司聯(lián)合組建了一個新的Celera公司,宣布計劃采用全基因組的“鳥槍法”測序策略,在2003年底前測定人類的全部基因組序列。接著,Celera公司與加州大學(xué)伯克利果蠅計劃(BDGD)合作,僅用了4個月的時間,就用全基因組的“鳥槍法”測序策略完成了果蠅基因組120Mb的全序列測定和組裝,證明了這一技

54、術(shù)路線的可行性,成為利用同一策略進(jìn)行人類基因組測序的一次預(yù)實驗。2021-12-20123 cDNA測序測序 人類基因組中發(fā)生轉(zhuǎn)錄表達(dá)的序列(即基因)僅占總序列的約5,對這一部分序列進(jìn)行測定將直接導(dǎo)致基因的發(fā)現(xiàn)。由于與重要疾病相關(guān)的基因或具有重要生理功能的基因具有潛在的應(yīng)用價值,使得cDNA測序受到制藥工業(yè)界和研究機(jī)構(gòu)的青睞,紛紛投入重金進(jìn)行研究并搶占專利。2021-12-20124 cDNA測序的研究重點首先放在基因表達(dá)的短CDNA序列(EST)測序。 比較不同條件下(如正常組織和腫瘤組織)的EST測序結(jié)果,可以獲得豐富的生物學(xué)信息(如基因表達(dá)與腫瘤發(fā)生、發(fā)展的關(guān)系)。 其次,利用EST可以

55、對基因進(jìn)行染色體定位。2021-12-20125 至2005年5月13日,公共數(shù)據(jù)庫內(nèi)有26,858,818條EST(其中人類EST有6,057,800),更多的EST和全長cDNA則掌握在一批以基因組信息為產(chǎn)品的生物技術(shù)公司手中。2021-12-20126 隨著研究的深入,EST測序固有的局限性變得日益顯著。首先,由于文庫構(gòu)建的原因,絕大多數(shù)EST分布在基因的3端,數(shù)據(jù)庫中代表基因5上游信息的EST只占很小的比例。其次,EST的長度都在300500bp之間,僅從EST中很難獲得基因結(jié)構(gòu)的全部信息(如基因的不同拼接形式)。2021-12-20127 鑒于此,cDNA研究的熱點目前已由EST轉(zhuǎn)變

56、為全長cDNA研究。 美國國立癌癥研究院(NCI)最近決定資助每年獲得2萬條全長cDNA的計劃。日本的人類基因組計劃也將獲得全長cDNA列為重點, 到1999年底已獲得40,000條全長cDNA。為了獲得全長cDNA,除了利用cDNA末端快速擴(kuò)增法(RACE)得到cDNA末端(主要是5端)的序列以外,另外一個關(guān)鍵是構(gòu)建高質(zhì)量的全長cDNA文庫。2021-12-20128 模式生物體的基因組測序模式生物體的基因組測序 意義: 可以為人類基因組的研究進(jìn)行技術(shù)的探索和經(jīng)驗的積累; 有助于人們在基因組水平上認(rèn)識進(jìn)化規(guī)律; 可以通過對不同生物體中的同源基因的研究,以及利用模式生物體的轉(zhuǎn)基因和基因剔除術(shù)(

57、knockout)等方法研究基因的功能。2021-12-20129 人類基因組的測序人類基因組的測序 1998年,由PE公司和TIGR合作成立的Celera公司宣布將在3年時間內(nèi)完成人類基因組全序列的測定工作,建立用于商業(yè)開發(fā)的數(shù)據(jù)庫,并對一大批重要的人類基因注冊專利。面對私營領(lǐng)域的挑戰(zhàn),公共領(lǐng)域的測序計劃也加快了步伐。2021-12-20130 2000年6月25日,美、英、日、法、德和中國的16個測序中心或協(xié)作組獲得了占人類基因組21.1的完成序列及覆蓋人類基因組65.7的工作草圖,兩者相加達(dá)到86.8。同時,對整條染色體的精細(xì)測序也獲得突破性進(jìn)展。1999年12月,英、日、美、加拿大和瑞

58、典科學(xué)家共同完成了人類22號染色體的常染色體部分共33.4 Mb的測序。2021-12-20131 2001年2月15日,國際公共領(lǐng)域人類基因組計劃和美國的Celera公司分別在“Nature”和“Science”雜志上公布了人類基因組序列工作草圖,完成全基因DNA序列95的測序。2003年4月14日,國際人類基因組測序共同負(fù)責(zé)人Francis Collins博士宣布,人類基因組序列圖繪制成功,全基因組測序完成99。2021-12-20132二、功能基因組學(xué) 人類功能基因組學(xué)涉及眾多的新技術(shù),包括生物信息學(xué)技術(shù)、生物芯片技術(shù)、轉(zhuǎn)基因和基因敲除技術(shù)、酵母雙雜交技術(shù)、基因表達(dá)譜系分析、蛋白質(zhì)組學(xué)技

59、術(shù)、高通量細(xì)胞篩選技術(shù)等等。以解決有關(guān)基因功能研究中的基本問題:基因何時開始表達(dá);基因表達(dá)產(chǎn)物定位于何處;該基因?qū)⑴c其它哪些基因相互影響;該基因如出現(xiàn)突變將會導(dǎo)致什么后果等2021-12-20133 1、蛋白質(zhì)組學(xué) 是對蛋白質(zhì)性質(zhì)和功能的大規(guī)模研究,包括對蛋白質(zhì)的表達(dá)水平、翻譯后修飾以及與其它分子的相互作用的研究,從而可以得到細(xì)胞進(jìn)程在蛋白質(zhì)水平上的宏觀映象。蛋白質(zhì)作為mRNA的產(chǎn)物在細(xì)胞中行使著大部分的功能,但是蛋白質(zhì)水平與mRNA水平之間并不一定有嚴(yán)格的線性關(guān)系。2021-12-20134 實驗證明,組織中mRNA豐度與蛋白質(zhì)豐度的相關(guān)性并不好,尤其對于低豐度蛋白質(zhì)來說,相關(guān)性更差。蛋白質(zhì)復(fù)雜的翻譯后修飾、蛋白質(zhì)的亞細(xì)胞定位或遷移、蛋白質(zhì)-蛋白質(zhì)相互作用等都幾乎無法從mRNA水平來判斷。蛋白質(zhì)本身的存在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論