




已閱讀5頁,還剩141頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2020 1 15 1 第三章基因 基因組和基因組學(xué) 基因的化學(xué)本質(zhì)是DNA 它是遺傳信息的物質(zhì)載體 傳遞著支配生命活動(dòng)的指令 是構(gòu)建生物體藍(lán)圖中的一頁 也是可以人工操作用于改造生命屬性的元件 2020 1 15 2 基因組是指生物體的細(xì)胞中一套完整的遺傳信息 包括所有的基因和基因間區(qū)域 專門研究基因組結(jié)構(gòu)和功能的學(xué)科 稱為基因組學(xué) 它主要通過基因組作圖 基因測序和基因定位等方法來研究基因組結(jié)構(gòu)和變異 2020 1 15 3 第一節(jié)基因的概念 一 對(duì)基因的認(rèn)識(shí)對(duì)基因的認(rèn)識(shí)和研究大體上可以分為三個(gè)階段 1 在20世紀(jì)50年代以前 主要從細(xì)胞的染色體水平上進(jìn)行研究 屬于基因的染色體遺傳學(xué)階段 2 50年代以后 主要從DNA大分子水平上進(jìn)行研究 屬于基因的分子生物學(xué)階段 2020 1 15 4 3 最近20多年來 由于重組DNA技術(shù)的完善和應(yīng)用 人們改變了從表型到基因的傳統(tǒng)研究途徑 而能夠直接從克隆目的基因出發(fā) 研究基因的功能及其與表型的關(guān)系 使基因的研究進(jìn)入了反向生物學(xué)階段 反向生物學(xué)是指利用重組DNA技術(shù)和離體定向誘變的方法研究結(jié)構(gòu)已知基因的相應(yīng)功能 在體外使基因突變 再導(dǎo)入體內(nèi) 檢測突變的遺傳效應(yīng) 即以表型來探索基因的結(jié)構(gòu)和功能 2020 1 15 5 二 基因概念的擴(kuò)展分子生物學(xué)和分子遺傳學(xué)的不斷發(fā)展 特別是DNA分子克隆技術(shù) DNA序列的快速測定 以及核酸分子雜交技術(shù)等現(xiàn)代實(shí)驗(yàn)手段的不斷涌現(xiàn) 為進(jìn)一步深入研究基因結(jié)構(gòu)和功能提供了條件 移動(dòng)基因 斷裂基因 假基因 重疊基因 等有關(guān)基因的新概念 豐富了對(duì)基因本質(zhì)的認(rèn)識(shí) 2020 1 15 6 1 移動(dòng)基因移動(dòng)基因 movablegenes 又稱轉(zhuǎn)位因子 transposableelements 由于它可以從染色體基因組上的一個(gè)位置轉(zhuǎn)移到另一個(gè)位置 甚至在不同染色體之間躍遷 因此也稱跳躍基因 jumpinggenes 2020 1 15 7 轉(zhuǎn)位和易位是兩個(gè)不同的概念 易位是指染色體發(fā)生斷裂后 通過同另一條染色體斷端連接轉(zhuǎn)移到另一條染色體上 此時(shí) 染色體斷片上的基因也隨著染色體的重接而移動(dòng)到新的位置 轉(zhuǎn)位則是在轉(zhuǎn)位酶的作用下 轉(zhuǎn)位因子或是直接從原來位置上切離下來 然后插入染色體新的位置 或是染色體上的DNA序列轉(zhuǎn)錄成RNA 隨后反轉(zhuǎn)錄為cDNA 再插入染色體上新的位置 這樣 在原來位置上仍然保留轉(zhuǎn)位因子 而其拷貝則插入新的位置 也就是使轉(zhuǎn)位因子在基因組中的拷貝數(shù)又增加一份 2020 1 15 8 2 斷裂基因或不連續(xù)基因通過對(duì)真核生物編碼基因的研究發(fā)現(xiàn) 在編碼序列中間插有與氨基酸編碼無關(guān)的DNA間隔區(qū) 這些間隔區(qū)稱為內(nèi)含子 intron 內(nèi)元 介入序列或間隔子 而編碼區(qū)則稱為外顯子 exon 外元或表達(dá)子 含有內(nèi)含子的編碼序列稱為不連續(xù)基因或斷裂基因 splitgenes 2020 1 15 9 斷裂基因最早是在腺病毒中發(fā)現(xiàn)的 Sharp及其同事在R 嚕噗 R loop 實(shí)驗(yàn)中發(fā)現(xiàn) 腺病毒的hexon基因在與其相對(duì)應(yīng)的成熟轉(zhuǎn)錄產(chǎn)物mRNA進(jìn)行雜交時(shí) 會(huì)出現(xiàn)DNA嚕噗環(huán) 圖3 1 說明 mRNA分子與其模板DNA相比 丟失了一些基因片段 后來證實(shí) 這些片段是在mRNA加工過程中從初級(jí)轉(zhuǎn)錄本上被 剪切出去 的 2020 1 15 10 2020 1 15 11 內(nèi)含子的起源和它存在的生物學(xué)意義是一個(gè)極其誘人的研究課題 但是目前還不完全清楚 可能與基因的分子進(jìn)化相關(guān) 2020 1 15 12 斷裂基因在表達(dá)時(shí)首先轉(zhuǎn)錄成初級(jí)轉(zhuǎn)錄產(chǎn)物 即前體mRNA或核內(nèi)不均一RNA hnRNA 然后經(jīng)過刪除和連接 除去無關(guān)的DNA內(nèi)含子序列的轉(zhuǎn)錄物 稱為成熟的mRNA分子 這種刪除內(nèi)含子 連接外顯子的過程 稱為RNA拼接 RNAsplicing 圖3 2 2020 1 15 13 2020 1 15 14 例外 現(xiàn)在已經(jīng)知道 并非所有的內(nèi)含子都 含而不顯 有些內(nèi)含子可以編碼蛋白質(zhì) 這些蛋白質(zhì)的功能與內(nèi)含子序列的刪除或傳播擴(kuò)散相關(guān) 如1980年 Church等人發(fā)現(xiàn)酵母線粒體細(xì)胞色素氧化酶基因的內(nèi)含子產(chǎn)物是該基因mRNA前體進(jìn)行拼接的反式作用因子 2020 1 15 15 真核生物的外顯子也并非都 顯 編碼氨基酸 除了tRNA基因和rRNA基因的外顯子是理所當(dāng)然地不顯以外 幾乎全部的蛋白質(zhì)基因的首尾兩個(gè)外顯子都只有部分核苷酸序列編碼氨基酸 還有完全不編碼氨基酸的外顯子 如人類尿激酶基因的第一個(gè)外顯子的88個(gè)核苷酸序列 2020 1 15 16 3 假基因有些基因核苷酸序列與相應(yīng)的正常功能基因基本相同 但卻不能合成出功能蛋白質(zhì) 這些失活基因稱為假基因 pseudogene 通常用 表示 1977年在爪蟾的5S基因家族中首先發(fā)現(xiàn)了假基因 以后在珠蛋白基因家族 免疫球蛋白基因家族以及組織相容性抗原基因家族中也都發(fā)現(xiàn)了假基因 2020 1 15 17 如 珠蛋白基因編碼血紅蛋白的珠蛋白鏈 人類珠蛋白基因由分別位于不同染色體上的兩個(gè)相關(guān)的基因家族 和 組成 其中 人類的 簇分布在50kb范圍的DNA上 包含5個(gè)有功能的基因 兩個(gè) 和一個(gè)假基因 1 兩個(gè) 基因只有一個(gè)氨基酸的差別 第136位在 G中為Gly 而在 A為Ala 2020 1 15 18 簇含有3個(gè)功能基因 3個(gè)假基因和1個(gè)未知功能的 基因 排列順序?yàn)?2 1 2 1 圖3 3 序列分析表明 1基因同三個(gè)有功能的 珠蛋白基因DNA序列相似 1基因同有功能的 2基因的序列相似性為73 只是假基因中含有很多突變 如起始密碼子ATG變成GTG 5 端的兩個(gè)內(nèi)含子也有突變 可能導(dǎo)致RNA拼接的破壞 在編碼區(qū)內(nèi)也存在許多點(diǎn)突變和缺失 2020 1 15 19 2020 1 15 20 假基因的來源 來源一 1假基因被認(rèn)為是由 珠蛋白基因復(fù)制產(chǎn)生的 開始復(fù)制生成的基因是有功能的 后來在進(jìn)化中產(chǎn)生了一個(gè)失活突變 由于該基因是復(fù)制產(chǎn)生的 所以盡管失去了功能 但是不至影響到生物體的存活 隨后在假基因中又積累了更多的突變 從而形成了現(xiàn)今的假基因序列 2020 1 15 21 除了重復(fù)的假基因外 在真核生物的染色體基因組中還存在著一類加工的假基因 processedpseudogene 這類假基因不與 親本基因 連鎖 結(jié)構(gòu)與轉(zhuǎn)錄本而非 親本基因 相似 如都沒有啟動(dòng)子和內(nèi)含子 但在基因的3 端都有一段延伸的腺嘌呤短序列 類似mRNA3 末端的polyA尾巴 這些特征表明 假基因的來源二 這類假基因很可能來自加工后的RNA的DNA拷貝 稱為加工的假基因 2020 1 15 22 4 重疊序列傳統(tǒng)的基因概念把基因看作彼此獨(dú)立的 非重疊的實(shí)體 但是 隨著DNA測序技術(shù)的發(fā)展 在一些噬菌體和動(dòng)物病毒中發(fā)現(xiàn) 不同基因的核苷酸序列有時(shí)是可以共用的 也就是說 它們的核苷酸序列可以是彼此重疊的 這種具有獨(dú)立性但使用部分共同序列的基因稱為重疊基因 overlappinggenes 或嵌套基因 nestedgenes 2020 1 15 23 如 大腸桿菌 X174噬菌體單鏈DNA共有5387個(gè)核苷酸 如果使用單一的讀碼結(jié)構(gòu) 它最多只能編碼1795個(gè)氨基酸 按每個(gè)氨基酸的平均分子量為110計(jì)算 該噬菌體所合成的全部蛋白質(zhì)總分子量最多為197000 2020 1 15 24 但實(shí)際測定發(fā)現(xiàn) X174噬菌體共編碼11種蛋白質(zhì) 總分子量高達(dá)262000 如何設(shè)計(jì)實(shí)驗(yàn)解釋 1977年 Sanger等人測定了 X174噬菌體的核苷酸序列 發(fā)現(xiàn)它的一部分DNA能夠編碼兩種不同的蛋白質(zhì) 從而解釋了上述矛盾 2020 1 15 25 根據(jù)Sanger等人的研究 X174噬菌體DNA中存在兩種不同的重疊基因 第一種是一個(gè)基因的核苷酸序列完全包含在另一個(gè)基因的核苷酸序列中 例如 B基因位于A基因之中 E基因位于D基因中 只是它們的讀碼結(jié)構(gòu)不同 因此編碼不同的蛋白質(zhì) 圖3 4 2020 1 15 26 第二種類型 兩個(gè)基因的核苷酸序列的末端密碼子相互重疊 例如 A基因終止密碼子的3個(gè)核苷酸TGA 與C基因的起始密碼子ATG相互重疊了2個(gè)核苷酸 D基因的終止密碼子TAA與J基因的起始密碼子ATG重疊了一個(gè)核苷酸 后來在G4病毒的單鏈環(huán)狀DNA基因組中還發(fā)現(xiàn)三個(gè)基因共有一段重疊的DNA序列 2020 1 15 27 不僅在細(xì)菌 噬菌體和病毒等低等生物基因組中存在重疊序列 在一些真核生物中也存在不同于原核生物的其它類型的重疊序列 有一種特殊的重疊基因 一個(gè)基因的編碼序列完全寓居于另一個(gè)基因的內(nèi)含子序列中 例如果蠅的GART基因 該基因編碼參與嘌呤生物合成的酶蛋白 的內(nèi)含子中寓居著一個(gè)與之無關(guān)的編碼蛹角質(zhì)膜蛋白 cuticleprotein 的基因 但是它的轉(zhuǎn)錄方向與GART基因相反 2020 1 15 28 重疊基因是近年來在基因結(jié)構(gòu)與功能研究上的一個(gè)非常有意義的發(fā)現(xiàn) 它修正了關(guān)于各個(gè)基因的多核苷酸序列彼此分立 互不重疊的傳統(tǒng)觀念 目前在 X174噬菌體 G4噬菌體以及一些病毒和少數(shù)真核基因中發(fā)現(xiàn)了重疊基因的現(xiàn)象 但是 它是否具有普遍意義 特別是在真核生物中是否廣泛存在 都還有待于進(jìn)一步深入研究 2020 1 15 29 三 基因的種類和結(jié)構(gòu) 1 基因的種類基因按其功能主要分為結(jié)構(gòu)基因 調(diào)控基因和RNA基因 1 結(jié)構(gòu)基因 structuregene 結(jié)構(gòu)基因是能決定某些多肽鏈 蛋白質(zhì) 或酶分子結(jié)構(gòu)的基因 結(jié)構(gòu)基因的突變可導(dǎo)致特定蛋白質(zhì) 或酶 一級(jí)結(jié)構(gòu)的改變 2020 1 15 30 2 調(diào)控基因 regulatorgene 調(diào)控基因是具有調(diào)節(jié)控制結(jié)構(gòu)基因表達(dá)功能的基因 調(diào)控基因的突變可以影響一個(gè)或多個(gè)結(jié)構(gòu)基因的功能 導(dǎo)致蛋白質(zhì) 或酶 量或活性的改變 3 RNA基因 有的基因只轉(zhuǎn)錄不翻譯 如核糖體RNA基因和轉(zhuǎn)運(yùn)RNA基因 產(chǎn)物分別為rRNA和tRNA 2020 1 15 31 圖3 6原核基因的典型結(jié)構(gòu) 2 基因的結(jié)構(gòu) 2020 1 15 32 圖3 5真核基因的典型結(jié)構(gòu) 2020 1 15 33 真核生物基因以單順反子的形式存在 編碼單基因產(chǎn)物 原核生物的基因以多順反子的形式存在 轉(zhuǎn)錄產(chǎn)生的mRNA 可同時(shí)編碼兩種甚至數(shù)種基因產(chǎn)物 2020 1 15 34 四 生物體內(nèi)基因的大小和數(shù)目 1 基因的大小真核生物中 由于內(nèi)含子序列的存在 基因比實(shí)際編碼蛋白質(zhì)的序列要大得多 外顯子的大小與基因的大小沒有必然的聯(lián)系 與整個(gè)基因相比 編碼蛋白質(zhì)的外顯子要小得多 大多數(shù)外顯子編碼的氨基酸數(shù)小于100 2020 1 15 35 內(nèi)含子通常比外顯子大得多 因此基因的大小取決于它所包含的內(nèi)含子的長度 一些基因的內(nèi)含子特別長 例如哺乳動(dòng)物的二氫葉酸還原酶基因含有6個(gè)外顯子 其mRNA的長度為2kb 但基因的總長度達(dá)25 31kb 含有長達(dá)幾十kb的內(nèi)含子 內(nèi)含子之間也有很大的差別 大小從幾百個(gè)堿基對(duì)到幾萬個(gè)堿基對(duì)不等 2020 1 15 36 基因的大小還與所包含的內(nèi)含子的數(shù)目有關(guān) 在不同的基因中 內(nèi)含子的數(shù)目變化很大 有些斷裂基因含有一個(gè)或少數(shù)幾個(gè)內(nèi)含子 如珠蛋白基因 某些基因含有較多的內(nèi)含子 如雞卵清蛋白基因有7個(gè)內(nèi)含子 伴清蛋白基因含有16個(gè)內(nèi)含子 2020 1 15 37 由于基因的大小取決于內(nèi)含子的長度和數(shù)目 導(dǎo)致酵母和高等真核生物的基因大小差異很大 大多數(shù)酵母基因小于2kb 很少有超過5kb的 而高等真核生物的大多數(shù)基因長度在5 100kb之間 2020 1 15 38 表3 1不同生物的平均基因大小 2020 1 15 39 2 基因的數(shù)目從基因組的大小可以粗略地算出基因的數(shù)目 雖然一些基因通過選擇性表達(dá)可以產(chǎn)生一個(gè)以上的產(chǎn)物 但這種現(xiàn)象并不常見 對(duì)基因數(shù)目的計(jì)算影響不大 2020 1 15 40 為準(zhǔn)確地確定基因數(shù)目 需要知道整個(gè)基因組的DNA序列和基因密度 目前已知酵母基因組的全序列 其基因密度較高 平均每個(gè)開放閱讀框 openreadingframe ORF 為1 4kb 基因間的平均分隔為600bp 即大約70 的序列為開放閱讀框 其中約一半基因是已知的基因或與已知基因有關(guān)的基因 其余是新基因 因此可推測未發(fā)現(xiàn)基因的數(shù)目 2020 1 15 41 表3 2不同生物的基因數(shù)目 2020 1 15 42 如果不知道基因組的基因密度 就難以估計(jì)基因數(shù)目 可采取的方法有 基因分離鑒定計(jì)算表達(dá)基因的數(shù)目突變分析 2020 1 15 43 五 基因簇與重復(fù)基因1 基因家族和基因簇基因家族 genefamily 是真核生物基因組中來源相同 結(jié)構(gòu)相似 功能相關(guān)的一組基因 盡管基因家族各成員序列上具有相關(guān)性 但序列相似的程度以及組織方式不同 其中大部分有功能的家族成員之間相似程度很高 有些家族成員間的差異很大 甚至有無功能的假基因 2020 1 15 44 基因家族的成員在染色體上的分布形式是不同的 有些基因家族的成員在特殊的染色體區(qū)域上成簇存在 另一些基因家族的成員在整個(gè)染色體上廣泛地分布 甚至可存在于不同的染色體上 2020 1 15 45 根據(jù)家族成員的分布形式 可以把不同的基因家族分為成簇存在的基因家族 clusteredgenefamily 即基因簇以及散布的基因家族 interspersedgenefamily 2020 1 15 46 1 基因簇 genecluster 基因家族的各成員緊密成簇排列成大段的串聯(lián)重復(fù)單位 定位于染色體的特殊區(qū)域 它們是同一個(gè)祖先基因擴(kuò)增的產(chǎn)物 基因簇中也包括沒有生物功能的假基因 通?;虼貎?nèi)各序列間的同源性大于基因簇間的序列同源性 2020 1 15 47 2 散布的基因家族 家族成員在DNA上無明顯的物理聯(lián)系 甚至分散在多條染色體上 各成員在序列上有明顯差別 其中也含有假基因 但這種假基因與基因簇中的假基因不同 它們來源于RNA介導(dǎo)的轉(zhuǎn)座作用 2020 1 15 48 按照基因家族成員之間序列相似的程度 可把基因家族分為以下幾類 1 經(jīng)典的基因家族 家族中各基因的全序列或至少編碼序列具有高度的同源性 如rRNA基因家族和組蛋白基因家族 在進(jìn)化過程中 這些家族成員有自動(dòng)均一化的趨勢 它們的特點(diǎn)是 各成員間有高度的序列一致性 甚至完全相同 拷貝數(shù)高 常有幾十個(gè)甚至幾百個(gè)拷貝 非轉(zhuǎn)錄的間隔區(qū)短而且一致 2020 1 15 49 2 基因家族各成員的編碼產(chǎn)物上具有大段的高度保守氨基酸序列 這對(duì)基因發(fā)揮功能是必不可少的 基因家族的各基因中有部分十分保守的序列 但總的序列相似性卻很低 3 家族各成員的編碼產(chǎn)物之間只有一些很短的保守氨基酸序列 從DNA水平上看 這些基因家族成員之間的序列同源性更低 但其基因編碼產(chǎn)物具有相同的功能 因?yàn)樵诘鞍踪|(zhì)中存在發(fā)揮生物功能所必不可少的保守區(qū)域 2020 1 15 50 4 超基因家族 genesuperfamily 家族中各基因序列間沒有同源性 但其基因產(chǎn)物的功能相似 蛋白質(zhì)產(chǎn)物中雖沒有明顯保守的氨基酸序列 但從整體上看卻有相同的結(jié)構(gòu)特征 如免疫球蛋白家族 2020 1 15 51 2 重復(fù)序列除了基因家族外 染色體上還有大量無轉(zhuǎn)錄活性的重復(fù)DNA序列家族 主要是基因以外的DNA序列 重復(fù)序列有兩種組織形式 一種是串聯(lián)重復(fù)DNA 成簇存在于染色體的特定區(qū)域 另一種是散布的重復(fù)DNA 重復(fù)單位并不成簇存在 而是分散于染色體的各個(gè)位點(diǎn)上 來源于RNA介導(dǎo)的轉(zhuǎn)座作用 散布的重復(fù)序列家族的許多成員是可轉(zhuǎn)移的元件 是不穩(wěn)定的 可轉(zhuǎn)移到基因組的不同位置 2020 1 15 52 1 串聯(lián)重復(fù)DNA有些高度重復(fù)DNA序列的堿基組成和浮力密度同主體DNA有區(qū)別 在浮力密度梯度離心時(shí) 可形成不同于主DNA帶的衛(wèi)星帶 稱為衛(wèi)星DNA 衛(wèi)星DNA由非常短的串聯(lián)重復(fù)DNA序列組成 這些序列一般對(duì)應(yīng)于染色體上的異染色質(zhì)區(qū)域 2020 1 15 53 有些高度重復(fù)序列的堿基組成與主體DNA相差不大 不能通過浮力密度梯度離心法分離 但可以通過其它方法鑒定 如限制性作圖 這樣的DNA序列稱為隱蔽衛(wèi)星DNA 2020 1 15 54 根據(jù)重復(fù)單位的大小 這些非編碼的高度重復(fù)的DNA序列可以進(jìn)一步分為衛(wèi)星DNA satelliteDNA 小衛(wèi)星DNA minisatelliteDNA 微衛(wèi)星DNA microsatelliteDNA 三類 表3 3 2020 1 15 55 表3 3人類基因組的主要串聯(lián)重復(fù)序列 2020 1 15 56 2 散布的重復(fù)DNA重復(fù)序列以散在方式分布于基因組內(nèi) 根據(jù)重復(fù)序列的長短不同 可以分為短散布元件和長散布元件 短散布元件的重復(fù)序列長度在500bp以下 在人基因組中的重復(fù)拷貝數(shù)達(dá)10萬以上 長散布元件的重復(fù)序列在1000bp以上 在人類基因組中有上萬份拷貝 2020 1 15 57 在人類基因組中有一種中等重復(fù)序列 長約300bp 30萬個(gè)成員分散分布在單倍體基因組中 在其170bp處有一個(gè)限制性酶AluI的酶切位點(diǎn) 因此被稱為Alu基因家族 Alufamily 人類基因組中 大約平均每隔6kb左右就有一個(gè)Alu序列 一般出現(xiàn)在內(nèi)含子或基因附近 可以作為人類DNA片段的特征標(biāo)記 2020 1 15 58 Alu家族的廣泛存在暗示它可能具有一定的功能 部分Alu序列中有14bp與乳頭瘤病毒 乙型肝炎病毒的復(fù)制起始區(qū)有同源性 因此推測Alu家族可能和真核基因組的復(fù)制區(qū)相連接 但是Alu家族的成員數(shù)要比推測的復(fù)制區(qū)多10倍 2020 1 15 59 第二節(jié)基因組 基因組 genome 一詞最早出現(xiàn)于1922年 指的是單倍體細(xì)胞中所含的整套染色體 近年來 學(xué)術(shù)界更多地把基因組定義為整套染色體中的全部基因 隨著對(duì)不同生物的基因組DNA的測序 人們發(fā)現(xiàn) 對(duì)基因組這個(gè)名詞需要做出更精確的定義 現(xiàn)在認(rèn)為 基因組指的是細(xì)胞或生物體中所有的DNA 包括所有的基因和基因間隔區(qū)域 2020 1 15 60 原核生物基因組就是原核細(xì)胞內(nèi)構(gòu)成染色體的一個(gè)DNA分子 真核生物有細(xì)胞核 染色體位于細(xì)胞核內(nèi) 所以真核生物的核基因組是指單倍體細(xì)胞核內(nèi)整套染色體所含有的DNA分子 除了核基因組以外 真核細(xì)胞內(nèi)還有細(xì)胞器基因組 即動(dòng)物細(xì)胞和植物細(xì)胞的線粒體基因組以及存在于植物細(xì)胞的葉綠體基因組 2020 1 15 61 目前已經(jīng)完成了多種模式生物如大腸桿菌 酵母菌 線蟲 果蠅和小鼠以及芥南菜等的基因組測序工作 2001年 人類基因組的測序工作也基本完成 2020 1 15 62 一 原核生物基因組原核生物的遺傳信息是雙鏈脫氧核糖核酸分子 DNA 在原核生物中有兩類DNA分子 一是染色體 攜帶了細(xì)胞生存和繁殖所必需的所有遺傳信息 二是質(zhì)粒 是細(xì)胞核外獨(dú)立存在的DNA分子 與細(xì)胞的生長沒有必然的關(guān)系 2020 1 15 63 1 細(xì)菌染色體的結(jié)構(gòu)所有已知的原核生物的染色體都由DNA的四種不同堿基構(gòu)成 腺嘌呤 A 鳥嘌呤 G 胸腺嘧啶 T 胞嘧啶 C 每個(gè)物種具有特定的平均G C含量 變化范圍從24 支原體 到76 微球菌 多數(shù)為50 左右 2020 1 15 64 原核生物一般只有一個(gè)染色體即一個(gè)DNA分子 但是在不同生長條件下 染色體分子可能有一個(gè) 兩個(gè) 甚至更多的拷貝 例如 當(dāng)大腸桿菌在適宜的生長培養(yǎng)基中培養(yǎng)時(shí) 可以有四個(gè)以上的染色體拷貝 2020 1 15 65 2 其它自主的遺傳物質(zhì) 質(zhì)粒和噬菌體質(zhì)粒是細(xì)菌染色體外的可以自主復(fù)制的DNA分子 大多數(shù)質(zhì)粒都是環(huán)狀超螺旋雙鏈DNA 稱為共價(jià)閉合環(huán)狀分子 細(xì)胞中質(zhì)粒DNA分子具有穩(wěn)定的拷貝數(shù) 正常生理?xiàng)l件下 其拷貝數(shù)在世代之間保持不變 2020 1 15 66 質(zhì)粒DNA和寄主細(xì)胞染色體DNA分離 密度梯度離心 當(dāng)含有溴化乙錠 EtBr 的氯化銫 CsCl 溶液加到大腸桿菌裂解液中時(shí) 染色體DNA和質(zhì)粒DNA因?yàn)榻Y(jié)合的EtBr分子數(shù)不同而具有不同的密度 在密度梯度離心時(shí)形成不同的平衡條帶 達(dá)到分離目的 圖3 7 2020 1 15 67 圖3 7氯化銫密度梯度離心法制備質(zhì)粒 2020 1 15 68 噬菌體是以細(xì)菌為寄主的病毒 噬菌體被一層蛋白包膜覆蓋 可以在細(xì)菌外生存 再結(jié)合到細(xì)菌上 噬菌體由兩類生物大分子組成 即蛋白質(zhì)和核酸 一種病毒顆粒具有一種類型的核酸 2020 1 15 69 噬菌體的核酸 最常見的是雙鏈線性DNA 此外也有雙鏈環(huán)狀DNA 單鏈環(huán)狀DNA 單鏈線性DNA以及單鏈RNA等多種形式 2020 1 15 70 圖3 8噬菌體的生長周期 識(shí)別如HIV 2020 1 15 71 適當(dāng)條件下 噬菌體基因組DNA開始表達(dá)噬菌體的殼體蛋白 噬菌體組裝所需蛋白等 在宿主細(xì)胞內(nèi)完成子代噬菌體的組裝 并裂解宿主細(xì)胞 釋放子代噬菌體 進(jìn)入裂解期 噬菌體需要結(jié)合到宿主細(xì)胞上才能生長和繁殖 2020 1 15 72 二 真核生物基因組大多數(shù)真核生物基因組包含于細(xì)胞核內(nèi) 大部分DNA序列不編碼蛋白質(zhì) 1 C值矛盾與基因組大小一個(gè)單倍體基因組的全部DNA含量總是恒定的 這是物種的一個(gè)特征 通常稱為該物種的C值 不同物種的C值差異很大 從小于106bp到1011bp 由圖3 9可見 隨著生物的進(jìn)化 生物體的結(jié)構(gòu)和功能越復(fù)雜 其C值就越大 2020 1 15 73 圖3 9單倍體基因組DNA含量在低等真核生物中與形態(tài)復(fù)雜性有一定的正相關(guān) 但在高等真核生物中卻非如此 它們的單倍體基因組DNA含量變化不定 2020 1 15 74 在結(jié)構(gòu) 功能很相似的同類生物中 甚至在親緣關(guān)系非常接近的物種之間 C值可以相差數(shù)十倍乃至上百倍 突出的例子是兩棲動(dòng)物 C值小的可以低至109bp以下 C值大的可以高達(dá)1011bp 而哺乳類動(dòng)物C值均在109bp 這種現(xiàn)象稱為C值矛盾 2020 1 15 75 2 重復(fù)序列真核生物基因組序列包括三種類型 分別是快復(fù)性組分即高度重復(fù)序列 占總DNA的25 中度復(fù)性成分即中度重復(fù)序列 占總DNA的30 慢復(fù)性組分即非重復(fù)序列 占總DNA的45 2020 1 15 76 3 細(xì)胞器基因組除了在低等的真核生物中有一些線性的細(xì)胞器DNA外 大多數(shù)真核生物中 細(xì)胞器基因組都是環(huán)狀非重復(fù)DNA序列 每個(gè)細(xì)胞中有多個(gè)細(xì)胞器 因此有多個(gè)獨(dú)立存在的細(xì)胞器基因組 2020 1 15 77 1 線粒體基因組動(dòng)物細(xì)胞線粒體基因組比較小 人 鼠和牛的線粒體基因組都只有16 5kb 與核DNA相比 線粒體DNA所占的比例不到1 酵母線粒體基因組很大 釀酒酵母的線粒體基因組為84kb 而且每個(gè)線粒體中有4個(gè)拷貝 2020 1 15 78 圖3 10人線粒體基因組 2020 1 15 79 現(xiàn)代研究發(fā)現(xiàn)線粒體DNA的重要性 線粒體有自己的蛋白質(zhì)合成體系 其中rRNA和tRNA均由線粒體自身基因組編碼合成 線粒體tRNA比核基因編碼的tRNA要小 核糖體也比較小 其RNA聚合酶 氨酰 tRNA合成酶和核糖體蛋白質(zhì)均由核基因編碼 但卻是細(xì)胞器專用的 不同于細(xì)胞質(zhì)中的蛋白質(zhì)合成系統(tǒng) 2020 1 15 80 線粒體中其它蛋白質(zhì)的合成也常常由核基因和線粒體基因共同參與 如酵母線粒體中ATP合成酶 細(xì)胞色素c氧化酶的各亞基 細(xì)胞色素bc1復(fù)合物都是核基因組和細(xì)胞器基因組共同編碼的 2020 1 15 81 2 葉綠體基因組葉綠體基因組相對(duì)來說比較大 從高等植物的140kb到低等真核生物的200kb 葉綠體基因組可編碼與蛋白質(zhì)合成有關(guān)的rRNA和tRNA 以及大約50種蛋白質(zhì) 包括RNA聚合酶和一些核糖體蛋白 2020 1 15 82 4 染色體和染色質(zhì)染色體是細(xì)胞在有絲分裂時(shí)遺傳物質(zhì)存在的特定形式 是間期細(xì)胞染色質(zhì)結(jié)構(gòu)緊密包裝的結(jié)果 染色體和染色質(zhì)是真核生物遺傳物質(zhì)存在的兩種不同形態(tài) 反映了它們處于細(xì)胞分裂周期的不同功能階段 兩者不存在成分上的差異 2020 1 15 83 染色質(zhì) chromatin 是指真核生物細(xì)胞核中 在細(xì)胞分裂期間能被堿性染料著色的物質(zhì) 由DNA 組蛋白 非組蛋白和少量RNA組成 是細(xì)胞分裂間期遺傳物質(zhì)的存在形式 染色質(zhì)由最基本的單位 核小體成串排列而成的 2020 1 15 84 染色質(zhì)根據(jù)形態(tài)特征和染色性能可分為兩種類型 常染色質(zhì) euchromatin 和異染色質(zhì) heterochromatin 常染色質(zhì)中DNA的包裝比 packingration 約為1000 2000 即DNA的實(shí)際長度是染色質(zhì)長度的1000倍 2000倍 2020 1 15 85 構(gòu)成常染色質(zhì)的DNA主要是單一序列DNA和中度重復(fù)序列DNA 常染色質(zhì)中并非所有基因都具有轉(zhuǎn)錄活性 處于常染色質(zhì)狀態(tài)只是基因轉(zhuǎn)錄的必要條件 而不是充分條件 2020 1 15 86 異染色質(zhì)分為結(jié)構(gòu)異染色質(zhì)或組成型異染色質(zhì)和兼性異染色質(zhì) 結(jié)構(gòu)異染色質(zhì)指的是除復(fù)制期外 在整個(gè)細(xì)胞周期均處于聚縮狀態(tài) DNA包裝比在整個(gè)細(xì)胞周期中基本沒有較大變化的異染色質(zhì) 主要包括衛(wèi)星DNA序列 著絲粒區(qū) 端粒 次縊痕和染色體臂的某些節(jié)段等 2020 1 15 87 兼性異染色質(zhì)是指在某些細(xì)胞類型或一定的發(fā)育階段 原來的常染色質(zhì)聚縮 并喪失基因轉(zhuǎn)錄活性 變?yōu)楫惾旧|(zhì) 兼性異染色質(zhì)的總量隨不同細(xì)胞類型而變化 一般胚胎細(xì)胞含量很少 而高度特化的細(xì)胞含量較多 說明隨著細(xì)胞分化 較多的基因漸次以聚縮狀態(tài)而關(guān)閉 再也不能接近基因活化蛋白 染色質(zhì)的緊密折疊壓縮可能是關(guān)閉基因活性的一種途徑 2020 1 15 88 最典型的例子就是哺乳動(dòng)物雌性個(gè)體中的兩個(gè)X染色體中有一個(gè)隨機(jī)失活 失去轉(zhuǎn)錄活性而導(dǎo)致異染色質(zhì)化 2020 1 15 89 5 染色體功能實(shí)現(xiàn)的三要素任何真核生物染色體的生物學(xué)功能都嚴(yán)格依賴于三種DNA序列結(jié)構(gòu) 復(fù)制起點(diǎn) 著絲粒和端粒 2020 1 15 90 1 復(fù)制起點(diǎn) ARS DNA序列分析發(fā)現(xiàn) 不同來源的ARS序列包含一段11 14bp的高度同源的富含AT的共有序列及其上下游各200bp左右的區(qū)域 這是維持ARS功能所必需的 絕大多數(shù)真核細(xì)胞的染色體 含有多個(gè)復(fù)制起點(diǎn) 以確保染色體快速復(fù)制 2020 1 15 91 2 著絲粒DNA序列 CEN 著絲粒就是細(xì)胞分裂過程中染色體與紡錘絲 spindlefiber 結(jié)合的區(qū)域 因此 著絲粒在細(xì)胞分裂過程中對(duì)于母細(xì)胞中的遺傳物質(zhì)能否均衡地分配到子細(xì)胞中去是至關(guān)重要的 缺少著絲粒的染色體片斷 就不能和紡錘絲相連 在細(xì)胞分裂過程中容易丟失 2020 1 15 92 CEN序列的共同特點(diǎn)是含有兩個(gè)相鄰的核心區(qū) 80 90bp的AT區(qū) 11bp的保守區(qū) 缺失損傷試驗(yàn)和插入突變實(shí)驗(yàn)發(fā)現(xiàn)一旦傷及這兩個(gè)核心區(qū)序列 CEN即喪失生物學(xué)功能 2020 1 15 93 3 端粒DNA序列 TEL 端粒由一系列短重復(fù)序列構(gòu)成 在人類的DNA里 端粒長約10至15kb 由重復(fù)的GGGTTA組成 其它生物端粒的重復(fù)序列也多為T和G 端粒的重復(fù)序列不是染色體DNA復(fù)制時(shí)連續(xù)合成的 而是由端粒酶 telomerase 合成 添加到染色體末端的 2020 1 15 94 2020 1 15 95 端粒酶是由RNA和蛋白質(zhì)組成的核糖核蛋白 具有逆轉(zhuǎn)錄酶的性質(zhì) 可以以特異的內(nèi)在RNA為模板 合成端粒重復(fù)序列 添加到染色體的3 端 端粒與細(xì)胞壽命有關(guān) 在細(xì)胞內(nèi)起著細(xì)胞分裂計(jì)時(shí)器的作用 端粒長度與細(xì)胞分裂次數(shù)和細(xì)胞的衰老有關(guān) 腫瘤細(xì)胞具有端粒酶活性 使癌細(xì)胞獲得無限增殖的能力 2020 1 15 96 三 人類基因組計(jì)劃 人類基因組計(jì)劃 HumanGenomeProject HGP 和 曼哈頓原子彈計(jì)劃 人類登月計(jì)劃 一起被譽(yù)為二十世紀(jì)科學(xué)史上的三個(gè)里程碑 1985年5月 美國能源部正式提出開展人類基因組的測序工作 形成了能源部的 人類基因組計(jì)劃 草案 1986年 美國生物學(xué)家 諾貝爾獎(jiǎng)獲得者RenatoDulbecco在 Science 上發(fā)表短文首次提出人類基因組計(jì)劃的設(shè)想 2020 1 15 97 并建議組織國家級(jí)和國際級(jí)的項(xiàng)目來進(jìn)行這方面的研究 1986年3月美國能源部在召開的一次專門會(huì)議上 正式提出實(shí)施測定人類基因組全順序的計(jì)劃 1988年4月 國際人類基因組織 HUGO 成立 1988年10月美國能源部和美國國立衛(wèi)生研究院達(dá)成協(xié)議 共同管理和實(shí)施這一計(jì)劃 1990年10月由美國國會(huì)批準(zhǔn)正式啟動(dòng)HGP研究 隨后法國 英國 意大利 德國 日本等也相繼宣布開始各自的HGP研究 中國于1987年在 863計(jì)劃 中開始設(shè)立人類基因組研究課題 2020 1 15 98 人類基因組計(jì)劃是一項(xiàng)國際性的研究計(jì)劃 目標(biāo)是通過以美國為主的全球性的國際合作 在大約15年的時(shí)間里完成人類24條染色體的基因組作圖和DNA全長序列分析 進(jìn)行基因的鑒定和功能分析 人類基因組計(jì)劃的最終目標(biāo)是確定人類基因組所攜帶的全部遺傳信息 并確定 闡明和記錄組成人類基因組的全部DNA序列 2020 1 15 99 具體任務(wù)有以下幾個(gè)方面 1 基因組作圖繪制兩大人類基因組圖譜 即遺傳連鎖圖譜和物理圖譜 遺傳連鎖圖譜是通過家譜分析和遺傳性狀的連鎖分析而建立的 物理圖譜是通過對(duì)構(gòu)成人類基因組的脫氧核糖核酸分子的化學(xué)測定而繪制的 包括限制酶切圖譜 排序的脫氧核糖核酸克隆庫以及對(duì)表達(dá)基因或無特征 功能不清 的脫氧核糖核酸片段的低分辨圖譜 2020 1 15 100 所有圖譜的目標(biāo)都是把有關(guān)基因的遺傳信息 按其在每條染色體上相對(duì)位置線性地系統(tǒng)地排列出來 2020 1 15 101 2 基因組測序 genomesequencing 基因組的核苷酸順序是分辨率最高的物理圖譜 就人而言 意味著要排出30億個(gè)核苷酸的順序 同時(shí) 測定其它生物的基因組順序 以便與人類基因組進(jìn)行比較研究 3 基因識(shí)別 geneidentification 在作圖 基因定位和測序的同時(shí) 識(shí)別出基因的序列 設(shè)法克隆基因 以及著手研究基因的生物學(xué)功能 2020 1 15 102 4 模式生物 modelorganism 研究從模式生物獲得的數(shù)據(jù)資料 可以為人類基因組的研究進(jìn)行技術(shù)的探索和經(jīng)驗(yàn)的積累 有助于闡明人類的生物學(xué)規(guī)律 常用的模式生物有大腸桿菌 酵母菌 線蟲 果蠅和小鼠等 在研究植物基因組時(shí)常用的模式生物是擬南芥菜 Arabideopisthaliana 2020 1 15 103 斑馬魚小鼠 2020 1 15 104 5 發(fā)展生物信息學(xué)和計(jì)算機(jī)學(xué)隨著基因組研究的開展 全世界各個(gè)實(shí)驗(yàn)室每天都產(chǎn)生大量的數(shù)據(jù) 其中包括DNA測序 蛋白質(zhì)的氨基酸序列 基因組作圖標(biāo)記與定位等 涉及數(shù)據(jù)的收集 甄別 組裝 詮釋 分配和使用等各個(gè)環(huán)節(jié) 因此 需要建立各種類型的數(shù)據(jù)庫 發(fā)展新的計(jì)算機(jī)設(shè)備和軟件 使生物學(xué)同信息科學(xué)和計(jì)算機(jī)科學(xué)緊密結(jié)合 形成了生物信息學(xué) bioinformatics 和計(jì)算生物學(xué) computationalbiology 2020 1 15 105 第三節(jié)基因組學(xué) 基因組研究應(yīng)該包括兩方面的內(nèi)容 以全基因組測序?yàn)槟繕?biāo)的結(jié)構(gòu)基因組學(xué)和以基因功能鑒定為目標(biāo)的功能基因組學(xué) 結(jié)構(gòu)基因組學(xué)代表基因組分析的早期階段 以建立生物體高分辨率遺傳圖譜 物理圖譜和大規(guī)模測序?yàn)榛A(chǔ) 功能基因組學(xué)代表基因分析的新階段 是利用結(jié)構(gòu)基因組學(xué)提供的信息系統(tǒng)地研究基因功能 以高通量 大規(guī)模的實(shí)驗(yàn)方法以及統(tǒng)計(jì)與計(jì)算機(jī)分析為特征 2020 1 15 106 隨著人類基因組作圖和基因組測序工作的完成 當(dāng)前的研究重心從結(jié)構(gòu)基因組學(xué)轉(zhuǎn)移到功能基因組學(xué) 2020 1 15 107 一 結(jié)構(gòu)基因組學(xué)結(jié)構(gòu)基因組學(xué)的內(nèi)容包括基因組作圖和基因組測序 2020 1 15 108 又稱染色體作圖 由于人的染色體巨大 不能直接用于測序 將人類基因組這一的研究對(duì)象進(jìn)行分解 將其分為容易操作的小的結(jié)構(gòu)區(qū)域 這個(gè)過程簡稱為染色體作圖 人類最大的1號(hào)染色體有263Mb 最小的21號(hào)染色體也有50Mb 根據(jù)使用的標(biāo)記和手段的不同 染色體作圖可以分為遺傳連鎖作圖和物理作圖 2020 1 15 109 1 遺傳學(xué)圖又稱連鎖圖譜 linkagemap 它是以具有遺傳多態(tài)性 在一個(gè)遺傳位點(diǎn)具有一個(gè)以上的等位基因 在群體中的出現(xiàn)頻率皆高于1 的遺傳標(biāo)記 為 路標(biāo) 以遺傳學(xué)距離 在減數(shù)分裂事件中兩個(gè)位點(diǎn)之間進(jìn)行交換 重組的百分率 1 的重組率稱為1cM 為圖距的基因組圖 2020 1 15 110 人類基因組遺傳連鎖圖的繪制需要應(yīng)用多態(tài)性標(biāo)記 人的DNA序列上平均每幾百個(gè)堿基會(huì)出現(xiàn)一些變異 variation 這些變異通常不產(chǎn)生病理性后果 并按照孟德爾遺傳規(guī)律由親代傳給子代 從而在不同個(gè)體間表現(xiàn)出不同 因而被稱為多態(tài)性 Polymorphism 現(xiàn)在的多態(tài)性標(biāo)記主要有三種 2020 1 15 111 限制性片段長度多態(tài)性 RFLP RFLP是第1代標(biāo)記 用限制性內(nèi)切酶特異性切割DNA鏈 由于DNA的一個(gè) 點(diǎn) 上的突變所造成的能切與不能切兩種狀況 而產(chǎn)生不同長度的片段 等位片段 可用凝膠電泳顯示多態(tài)性 用作基因突變分析 基因定位和遺傳病基因的早期檢測等方面 2020 1 15 112 DNA重復(fù)序列的多態(tài)性標(biāo)記人類基因的多態(tài)性較多的是由重復(fù)序列造成的 這也是人類基因組的重要特點(diǎn)之一 重復(fù)序列的多態(tài)性有小衛(wèi)星DNA多態(tài)性或不同數(shù)目的串聯(lián)重復(fù) VNTR 的多態(tài)性和微衛(wèi)星的DNA多態(tài)性等多種 2020 1 15 113 指的是基因組DNA中有數(shù)十到數(shù)百個(gè)核苷酸片段的重復(fù) 重復(fù)的次數(shù)在人群中有高度變異 總長不超過20kb 是一種遺傳信息量很大的標(biāo)記物 可以用Southern雜交或PCR法檢測 2020 1 15 114 是基因組中由1 6個(gè)堿基的重復(fù) 如 CA n GT n等產(chǎn)生的 以CA重復(fù)序列的利用度為最高 微衛(wèi)星DNA重復(fù)序列在染色體DNA中散在分布 其數(shù)量被認(rèn)為可達(dá)五到十萬 是目前最有用的遺傳標(biāo)記 第二代DNA遺傳標(biāo)記多指STR標(biāo)記 2020 1 15 115 單核苷酸多態(tài)性標(biāo)記 SNP 是1996年美國MIT的E Lander提出的 被稱為 第三代DNA遺傳標(biāo)記 這種遺傳標(biāo)記的特點(diǎn)是單個(gè)堿基的置換 與第一代的RFLP及第二代的STR以長度的差異作為遺傳標(biāo)記的特點(diǎn)不同 而且SNP的分布密集 每千個(gè)核苷酸中可出現(xiàn)一個(gè)SNP標(biāo)記位點(diǎn) 2020 1 15 116 在人類基因組中有300萬個(gè)以上的SNP遺傳標(biāo)記 這可能達(dá)到了人類基因組多態(tài)位點(diǎn)數(shù)目的極限 這些SNP標(biāo)記以同樣的頻率存在于基因組編碼區(qū)或非編碼區(qū) 存在于編碼區(qū)的SNP約有20萬個(gè) 稱為cSNP codingSNP 2020 1 15 117 2 物理圖譜 physicalmap 是指DNA序列上兩點(diǎn)的實(shí)際距離 通常由DNA的限制酶片段或克隆的DNA片段有序排列而成 其基本單位是千堿基對(duì) Kb 或百萬堿基對(duì) Mb 連鎖圖譜 2020 1 15 118 物理圖譜反應(yīng)的是DNA序列上兩點(diǎn)之間的實(shí)際距離 而遺傳圖譜則反應(yīng)這兩點(diǎn)之間的連鎖關(guān)系 在DNA交換頻繁的區(qū)域 兩個(gè)物理位置相距很近的基因或DNA片段可能具有較大的遺傳距離 而兩個(gè)物理位置相距很遠(yuǎn)的基因或DNA片段則可能因該部位在遺傳過程中很少發(fā)生交換而具有很近的遺傳距離 2020 1 15 119 全基因組的 鳥槍法 測序策略全基因組的 鳥槍法 測序策略 是指在獲得一定的遺傳和物理圖譜信息的基礎(chǔ)上 繞過建立連續(xù)的BAC克隆系的過程 直接將基因組DNA分解成小片段 進(jìn)行隨機(jī)測序 并輔以一定數(shù)量的10kb克隆和BAC克隆的末端測序結(jié)果 在此基礎(chǔ)上進(jìn)行序列拼接 直接得到待測基因組的完整序列 2020 1 15 120 2020 1 15 121 這一策略從一提出就受到質(zhì)疑 并不為主流的公共領(lǐng)域所采納 1995年 由CraigVenter領(lǐng)導(dǎo)的私營研究所TIGR TheInstituteofGenomicResearch 將這種方法應(yīng)用于對(duì)嗜血流感桿菌 H influenzae 全基因組的測序中 成功的測定了它的全基因組序列 該方法隨后在對(duì)包括枯草桿菌 大腸桿菌等20多種微生物的基因組測序中得到了成功的應(yīng)用 2020 1 15 122 1998年 TIGR和PE公司聯(lián)合組建了一個(gè)新的Celera公司 宣布計(jì)劃采用全基因組的 鳥槍法 測序策略 在2003年底前測定人類的全部基因組序列 接著 Celera公司與加州大學(xué)伯克利果蠅計(jì)劃 BDGD 合作 僅用了4個(gè)月的時(shí)間 就用全基因組的 鳥槍法 測序策略完成了果蠅基因組120Mb的全序列測定和組裝 證明了這一技術(shù)路線的可行性 成為利用同一策略進(jìn)行人類基因組測序的一次預(yù)實(shí)驗(yàn) 2020 1 15 123 cDNA測序人類基因組中發(fā)生轉(zhuǎn)錄表達(dá)的序列 即基因 僅占總序列的約5 對(duì)這一部分序列進(jìn)行測定將直接導(dǎo)致基因的發(fā)現(xiàn) 由于與重要疾病相關(guān)的基因或具有重要生理功能的基因具有潛在的應(yīng)用價(jià)值 使得cDNA測序受到制藥工業(yè)界和研究機(jī)構(gòu)的青睞 紛紛投入重金進(jìn)行研究并搶占專利 2020 1 15 124 cDNA測序的研究重點(diǎn)首先放在基因表達(dá)的短CDNA序列 EST 測序 比較不同條件下 如正常組織和腫瘤組織 的EST測序結(jié)果 可以獲得豐富的生物學(xué)信息 如基因表達(dá)與腫瘤發(fā)生 發(fā)展的關(guān)系 其次 利用EST可以對(duì)基因進(jìn)行染色體定位 2020 1 15 125 至2005年5月13日 公共數(shù)據(jù)庫內(nèi)有26 858 818條EST 其中人類EST有6 057 800 更多的EST和全長cDNA則掌握在一批以基因組信息為產(chǎn)品的生物技術(shù)公司手中 2020 1 15 126 隨著研究的深入 EST測序固有的局限性變得日益顯著 首先 由于文庫構(gòu)建的原因 絕大多數(shù)EST分布在基因的3 端 數(shù)據(jù)庫中代表基因5 上游信息的EST只占很小的比例 其次 EST的長度都在300 500bp之間 僅從EST中很難獲得基因結(jié)構(gòu)的全部信息 如基因的不同拼接形式 2020 1 15 127 鑒于此 cDNA研究的熱點(diǎn)目前已由EST轉(zhuǎn)變?yōu)槿LcDNA研究 美國國立癌癥研究院 NCI 最近決定資助每年獲得2萬條全長cDNA的計(jì)劃 日本的人類基因組計(jì)劃也將獲得全長cDNA列為重點(diǎn) 到1999年底已獲得40 000條全長cDNA 為了獲得全長cDNA 除了利用cDNA末端快速擴(kuò)增法 RACE 得到cDNA末端 主要是5 端 的序列以外 另外一個(gè)關(guān)鍵是構(gòu)建高質(zhì)量的全長cDNA文庫 2020 1 15 128 模式生物體的基因組測序意義 可以為人類基因組的研究進(jìn)行技術(shù)的探索和經(jīng)驗(yàn)的積累 有助于人們在基因組水平上認(rèn)識(shí)進(jìn)化規(guī)律 可以通過對(duì)不同生物體中的同源基因的研究 以及利用模式生物體的轉(zhuǎn)基因和基因剔除術(shù) knockout 等方法研究基因的功能 2020 1 15 129 人類基因組的測序1998年 由PE公司和TIGR合作成立的Celera公司宣布將在3年時(shí)間內(nèi)完成人類基因組全序列的測定工作 建立用于商業(yè)開發(fā)的數(shù)據(jù)庫 并對(duì)一大批重要的人類基因注冊專利 面對(duì)私營領(lǐng)域的挑戰(zhàn) 公共領(lǐng)域的測序計(jì)劃也加快了步伐 2020 1 15 130 2000年6月25日 美 英 日 法 德和中國的16個(gè)測序中心或協(xié)作組獲得了占人類基因組21 1 的完成序列及覆蓋人類基因組65 7 的工作草圖 兩者相加達(dá)到86 8 同時(shí) 對(duì)整條染色體的精細(xì)測序也獲得突破性進(jìn)展 1999年12月 英 日 美 加拿大和瑞典科學(xué)家共同完成了人類22號(hào)染色體的常染色體部分共33 4Mb的測序 2020 1 15 131 2001年2月15日 國際公共領(lǐng)域人類基因組計(jì)劃和美國的Celera公司分別在 Nature 和 Science 雜志上公布了人類基因組序列工作草圖 完成全基因DNA序列95 的測序 2003年4月14日 國際人類基因組測序共同負(fù)責(zé)人FrancisCollins博士宣布 人類基因組序列圖繪制成功 全基因組測序完成99 2020 1 15 132 二 功能基因組學(xué) 人類功能基因組學(xué)涉及眾多的新技術(shù) 包括生物信息學(xué)技術(shù) 生物芯片技術(shù) 轉(zhuǎn)基因和基因敲除技術(shù) 酵母雙雜交技術(shù) 基因表達(dá)譜系分析 蛋白質(zhì)組學(xué)技術(shù) 高通量細(xì)胞篩選技術(shù)等等 以解決有關(guān)基因功能研究中的基本問題 基因何時(shí)開始表達(dá) 基因表達(dá)產(chǎn)物定位于何處 該基因?qū)⑴c其它哪些基因相互影響 該基因如出現(xiàn)突變將會(huì)導(dǎo)致什么后果等 2020 1 15 133 1 蛋白質(zhì)組學(xué)是對(duì)蛋白質(zhì)性質(zhì)和功能的大規(guī)模研究 包括對(duì)蛋白質(zhì)的表達(dá)水平 翻譯后修飾以及與其它分子的相互作用的研究 從而可以得到細(xì)胞進(jìn)程在蛋白質(zhì)水平上的宏觀映象 蛋白質(zhì)作為mRNA的產(chǎn)物在細(xì)胞中行使著大部分的功能 但是蛋白質(zhì)水平與mRNA水平之間并不一定有嚴(yán)格的線性關(guān)系 2020 1 15 134 實(shí)驗(yàn)證明 組織中mRNA豐度與蛋白質(zhì)豐度的相關(guān)性并不好 尤其對(duì)于低豐度蛋白質(zhì)來說 相關(guān)性更差 蛋白質(zhì)復(fù)雜的翻譯后修飾 蛋白質(zhì)的亞細(xì)胞定位或遷移 蛋白質(zhì) 蛋白質(zhì)相互作用等都幾乎無法從mRNA水平來判斷 蛋白質(zhì)本身的存在形式和活動(dòng)規(guī)律 必須從直接對(duì)蛋白質(zhì)的研究來解決 內(nèi)容 蛋白質(zhì)分離蛋白質(zhì)分析蛋白質(zhì)相互作用蛋白質(zhì)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 勞動(dòng)合同續(xù)簽后的培訓(xùn)安排
- 2025年度游樂園與動(dòng)漫IP合作開發(fā)合同
- 二零二五年度婚內(nèi)債務(wù)償還與夫妻共同財(cái)產(chǎn)分配合同
- 二零二五年度酒店業(yè)高級(jí)管理人員勞動(dòng)合同終止及酒店管理交接合同
- 2025年度高校大學(xué)生畢業(yè)論文保密及成果轉(zhuǎn)化合作協(xié)議
- 2025年度股份代持與公司安全生產(chǎn)協(xié)議
- 二零二五年度電焊工職業(yè)病防治勞動(dòng)合同書
- 二零二五年度文化產(chǎn)業(yè)合作合同終止聲明
- 二零二五年度高效光伏發(fā)電房租賃合同
- 二零二五年度農(nóng)村自建房使用權(quán)及配套設(shè)施轉(zhuǎn)讓協(xié)議
- 肺部感染臨床路徑
- 電商平臺(tái)定價(jià)策略優(yōu)化
- 人美版美術(shù) 二年級(jí)下冊全冊教學(xué)設(shè)計(jì)(表格式)
- 保險(xiǎn)經(jīng)紀(jì)人考試題庫含答案
- 2024-2030年中國骨傳導(dǎo)耳機(jī)行業(yè)銷售渠道及供需前景預(yù)測報(bào)告
- 2024年導(dǎo)游服務(wù)技能大賽《導(dǎo)游綜合知識(shí)測試》題庫及答案
- 專項(xiàng)訓(xùn)練-解決問題訓(xùn)練(專項(xiàng)訓(xùn)練) 六年級(jí)下冊數(shù)學(xué)人教版
- 心肺復(fù)蘇技能操作考核表
- SHT 3060-2013 石油化工企業(yè)供電系統(tǒng)設(shè)計(jì)規(guī)范
- 2024年俄羅斯高空作業(yè)平臺(tái)車行業(yè)應(yīng)用與市場潛力評(píng)估
- 蕪湖2024年安徽蕪湖傳媒中心招聘編外工作人員5人筆試歷年典型考題及考點(diǎn)附答案解析
評(píng)論
0/150
提交評(píng)論