




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、真核生物基因組真核生物基因組一 真核生物基因結構1 啟動子元件 開放閱讀框標志: 由于大量內含子的存在,真核生物中沒有發(fā)現(xiàn)原核生物具有的顯著長度的開放閱讀框標志。 RNA聚合酶種類: 與原核生物只使用一種由多種蛋白質聚合而成的RNA聚合酶不同,真核生物至少使用由812種蛋白質組成的3種不同類型的RNA聚合酶。 啟動子元件多樣性: 每種真核生物RNA聚合酶都能識別一套不同的啟動子,并轉錄不同類型的基因。RNA聚合酶啟動子位置啟動子的復雜性所轉錄的基因RNA聚合酶-45至20簡單核糖體RNARNA聚合酶上游遠端至-25非常復雜蛋白質編碼基因RNA聚合酶50至100簡單tRNA和其他小RNA3種真核
2、生物RNA聚合酶2 斷裂基因內含子和外顯子 內含子(intron):已發(fā)現(xiàn)真核細胞中至少有8種明顯不同的內含子,但只有一種遵循GU-AG規(guī)則(GU-AGrule)的內含子與真核細胞蛋白編碼基因有關系。 GU-AG規(guī)則:所有內含子序列5端起始的兩個核苷酸總是5-GU-3,而3端的最后兩個堿基總是5-AG-3 。 內含子和外顯子的長度: 內含子至少長60bp; 在脊椎動物中外顯子長度的變化范圍也很廣,于1002000bp之間,常見的長約450bp。Eukaryotic Gene 真核基因的內含子/外顯子結構和對應的hmRNA轉錄物經過加工后的mRNA:(a)顯示了與酵母內含子的5和3剪接位點相關聯(lián)
3、的保守序列。每個核苷酸旁的下標數字表示該核苷酸在所有已知酵母基因內含子中的出現(xiàn)頻率。(b)剪接體通過配對識別剪接位點,從而產生mRNA以供核糖體翻譯之用。 不同生物基因組內含子的特點: 在簡單的真核基因組中內含子一般出現(xiàn)得較少(如酵母基因組6000個基因中總共只有239個內含子 95%的人類基因至少有一個內含子,某些單個基因中就具有100個或更多內含子 內含子在給定基因中的位置具有進化保守性,在同源基因的序列比對中內含子經常出現(xiàn)在相同的位置。3 基因的轉錄真核真核mRNA原始轉錄體(原始轉錄體(primary transcripts):):n 簡單原始轉錄體經剪接僅生成一條成熟mRNA和翻譯出
4、一條多肽鏈n 復雜原始轉錄體在不同的時(不同發(fā)育階段)空(不同組織細胞),同一原始轉錄體因轉錄起點、剪接方式或終止點的不同,可產生兩種或多種成熟mRNA和多肽鏈。 例如例如果蠅肌球蛋白重鏈轉錄體,在不同發(fā)育階段有三種不同表達產物。相同的降鈣素基因相關肽(calcitonin gene related peptide)原始轉錄體,在甲狀腺、腦等不同組織細胞內,因剪接方式不同使其表達產物不同。 1. 不同B細胞的免疫球蛋白原始轉錄體都是相同的4 轉錄后加工加帽、剪接和加尾:RNA聚合酶轉錄物在加工前稱為hnRNA(異質RNA),通過加帽(capping)、剪接和多聚腺苷酸化轉化成適合核糖體翻譯的m
5、RNA。加帽(capping)是指所有發(fā)生在hnRNA5末端的化學改變(包括甲基化作用)剪接(splicing)從hnRNA中大批地精確切除大片段的過程多聚腺酸化(polyadenylation)指用一段大約由250個腺嘌呤(A)組成的序列替換hnRNA3端的過程,這段序列不被翻譯??勺兗羟?大部分真核基因被加工成一種類型的剪接后mRNA,約有20%的人類基因因為可變剪接而產生兩種或多種的人類基因因為可變剪接而產生兩種或多種mRNA序列序列 有一個人類基因已被證明,相同的原始轉錄物可以產生64種不同的mRNA 外顯子的相互排斥: 小鼠肌鈣蛋白T基因的外顯子2和3是相互排斥的,外顯子2用在平滑肌
6、中,而外顯子3用于其他所有組織中 剪接裝置: 由多種細胞核內小RNA和一些蛋白組成,不同的細胞類型中可不同RepressorRepressor stops splicing that would otherwise occurActivatorActivator initiates splicing that otherwise wouldnt occurBasic MechanismAlternative splicingWith a few genes, alternative splicing generates more than one mRNA from the primary t
7、ranscript.Exons, or parts of exons, may be skipped.二 重復序列 重復序列是指多拷貝的相同或近似序列的DNA片段。 重復序列一般可以分為兩類: 高度重復序列和中度重復序列 串行重復DNA和分散在整個基因組中的重復片段1 高度重復序列:衛(wèi)星衛(wèi)星DNA、小、小/微衛(wèi)星微衛(wèi)星 重復頻度105。 在真核生物基因組中,約有45%60%的DNA中G:C堿基對含量較高,相對浮力密度大,將DNA打碎后,進行密度梯度超離心分離,可見一主峰和12個小峰,這種小峰被看成是主峰的衛(wèi)星,稱為衛(wèi)星DNA,它是多種短重復序列的混合物。 根據衛(wèi)星DNA的長度,又可分成3種。衛(wèi)
8、星DNA(satellite DNA): 其重復序列長度在5 bp 200 bp,串聯(lián)排列,通常存在著幾百萬個拷貝,總長度最長可達100 Mb, 它們主要存在于異染色體以及中心粒和端粒附近,通常不轉錄。小衛(wèi)星小衛(wèi)星DNA(mini-satellite DNA):): 重復序列長度在重復序列長度在1570 bp之間,串聯(lián)排列,總長度在之間,串聯(lián)排列,總長度在0.5 kb 30 kb 主要分布于常染色體,在人群中有高度的多態(tài)性(也即主要分布于常染色體,在人群中有高度的多態(tài)性(也即有高度的特異性或拷貝的多態(tài)性)。有高度的特異性或拷貝的多態(tài)性)。微衛(wèi)星微衛(wèi)星DNA(micro-satellite DN
9、A) 由26個核苷酸長的重復序列組成,又稱為簡單串聯(lián)重復序列(simple tandem repeats STRs) 以(CA)n、(GT)n、(CAG)n較常見,重復次數多為1560次,總長度一般在400 bp以下。 存在于常染色體,除著絲粒及端粒區(qū)域外, 微衛(wèi)星DNA在染色體的其他區(qū)域均廣泛均勻分布。很隨機地分布在整個基因組中,而不像衛(wèi)星或小/微衛(wèi)星那樣串聯(lián)成簇存在 微衛(wèi)星DNA在基因組中的功能尚不清楚,已知其有自身特異結合蛋白,是一種非?;钴S的堿基序列, 且能直接編碼蛋白質; 另外,微衛(wèi)星DNA能參與遺傳物質的結構改變,染色體折疊及端粒形成,是基因重排和變異的來源, 通過改變DNA結構或
10、與特異性蛋白質結合而發(fā)揮其基因調控作用。 在人類基因組中,由CA重復序列構成的微衛(wèi)星如5-CACACACACACA-3大約每1萬bp出現(xiàn)一次,占整個基因組的0.5%(總共15Mb),而單堿基重復(即5-AAAAAAAA-3)占人類基因組的0.3%微衛(wèi)星的產生機理 大多認為是DNA復制和修復過程中的復制滑脫復制和修復過程中的復制滑脫( replication slippage ),滑鏈錯配滑鏈錯配(slipped-strand mispairing)或染色體減數分裂時姊妹染色單體不均等交染色體減數分裂時姊妹染色單體不均等交換換的結果。 微衛(wèi)星DNA的核心序列是高度保守的,而微衛(wèi)星DNA本身的重復
11、單位變異則是形成多態(tài)性的基礎,其高度多態(tài)性主要表現(xiàn)在核苷酸重復單位數目的多態(tài)性和重復序列中核苷酸的替換多態(tài)性。 重復單位數目的多態(tài)性是由于STR在精子和卵子產生時,以及在生殖細胞減數分裂過程中發(fā)生不相等的交叉重組造成的。 由于這種不相等的交叉重組,使STR的長度在每一個個體中有差別,這也是進行DNA指紋分析的基礎。 中度重復序列 由較大的片段(由100 bp到幾千bp)串聯(lián)重復組成,分散在整個基因組中,重復頻度不等 一般具有種屬特異性,可作為DNA標記 有多種類型的中度重復序列,其表達產物常是細胞大量需要的,如rRNA、tRNA和組蛋白等。1、rRNA基因 真核生物的rRNA有28s、18s、
12、5.8s和5s 4種,其中28s、18s和5.8s 3種的編碼基因串聯(lián)排列,組成一個轉錄單位,在人類基因組中約有300個拷貝,分布在13、14、15、21和22號染色體上。 在每個轉錄單位的各種rRNA編碼基因間都有一個基因間隔區(qū),在28s rRNA基因中還存在插入序列,在轉錄時一并轉錄,形成rRNA前體,經轉錄后加工,切除間隔區(qū),插入序列等加工成3種成熟的rRNA。 5s rRNA基因單獨為一個轉錄單位,在人類基因組中約有2000個拷貝, 位于1號染色體。rRNA基因可以作為一種遺傳標志,在分子遺傳學中有重要的意義。2、tRNA基因: 每一種tRNA基因的拷貝數有幾十到幾百個。同一種tRNA
13、基因常常串聯(lián)在一起排列成基因簇,各個編碼tRNA基因之間也有間隔區(qū) 有的tRNA基因編碼序列中插入有內含子3、Alu家族:家族: 每個長度約300bp,富含CG,因在其第170bp處有一個限制性內切酶Alu I(AGCT)的位點而得名 占人類基因組的3%6%,Alu家族分散于整個基因組的間隔序列中,多位于一些編碼基因的5端和3端的遠端,個別的也有存在于內含子中。 Alu序列具有種屬特異性,其功能可能與hnRNA的加工成熟,DNA復制及轉錄調節(jié)有關。三、基因家族(gene family) 在真核細胞編碼蛋白質的基因中,約有25%50%是以單個基因存在于基因組中。而剩余的基因都有2個或2個以上序列
14、相似而又不全相同的基因。 是一組功能相似且核苷酸序列具有同源性的基因,可能由某一共同祖先基因經重復和突變產生,這一組基因就稱為基因家族,被其編碼的同源蛋白稱為蛋白質家族,具有相似的功能。 基因家族有大有小,從幾個到幾十個,少數情況可有幾百個,稱為超級家族。珠蛋白和組蛋白基因家族是研究得最多的例子。組蛋白基因家族組蛋白基因家族四 移動基因 轉座子(transposon) 插入序列(insertion sequence)(末端反向重復中間的編碼轉座酶基因),轉座酶促使對應的轉座子以保守(重復拷貝的數目沒有變化)或復制(拷貝數增加)的方式從基因組的一個部位插入到另一個部位(轉座)。 復合轉座子(指I
15、S元件其他基因) Tn3型轉座子(一般以復制的方式轉座) 可轉座的噬菌體(將復制性轉座作為它們正常感染周期一部分的病毒) 人類基因組中的DNA轉座子數少于1000。 真核轉座子mariner長1250bp,最早是在果蠅中發(fā)現(xiàn)的,但現(xiàn)在包括人類在內的多種真核生物中都發(fā)現(xiàn)了這種轉座子。Replicative Transposition; Tn3Element encodes a transposase for transposition, a repressor that regulates the transposase and an antibiotic resistance geneAgai
16、n, the ends of the element are critical for movementReplicative Transposition五 人類基因組n 人類基因組概貌:人類基因組概貌:人類基因組結構大編碼蛋白質的結構基因比例極少作為真核生物,人類基因組也具有真核生物基因組的一般結構特點 假基因 CpG島 甲基化等。 2 假基因根據是否保留相應功能基因的間隔序列(如內含子),分兩大類: 保留了間隔序列,稱為復制型假基因( duplicated pseudogene),通常因基因的復制修飾,如點突變、插入、缺失和移碼突變而導致復制后的基因在轉錄和翻譯時出現(xiàn)異常,喪失正常功能,它
17、與功能基因通常在同一條染色體上,也稱非加工假基因(non-processed pseudogene) 。 缺少間隔序列的已加工假基因(processed pseudogene),主要是轉錄過程中mRNA以cDNA的方式重新整合進入基因組(很可能發(fā)生在生殖細胞中),在長期進化選擇過程中因為隨機突變積累而喪失功能。已加工假基因序列兩邊有小的側翼定向重復序列(flanking direct repeat) ,3端多具多聚腺苷酸尾。目前已知人類基因組上的假基因,數目估計約在20 000個以上,呈現(xiàn)極不均一分布。意義:一些在醫(yī)學中非常重要的人類基因也有假基因,這可能干擾疾病的診斷和治療,系統(tǒng)和準確地對基
18、因組上假基因進行分類有助于對功能基因的預測和研究。3 DNA甲基化 是哺乳動物DNA最常見的復制后調節(jié)方式之一,由甲基轉移酶介導,將胞嘧啶(C)轉變?yōu)?甲基胞嘧啶(5mC)。 DNA甲基化與基因表達呈負相關,即基因在它不表達的組織中被甲基化,而在特異表達的組織中非甲基化。 甲基化一方面可在發(fā)育和分化中調控基因表達,還可中和潛在的危險的DNA序列,如外源病毒和轉座子等。 DNA甲基化調控基因表達直接的機制:調控基因表達直接的機制: 可能是因為甲基從DNA分子的大溝中突出,阻止了轉錄因子與基因相互作用, 還可能直接抑制RNA聚合酶活性而抑制基因的表達。 DNA甲基化是腫瘤中最常見的一種分子改變,包
19、括基因組總體甲基化水平降低和某些基因啟動區(qū)域的高甲基化(hypermethylation)。 基因組總體甲基化水平降低導致染色體的不穩(wěn)定 發(fā)生于細胞周期調控基因、DNA 修復基因、血管形成基因及細胞凋亡基因相應的CpG 島的甲基化,則引起轉錄沉默(silencing),進而促進了腫瘤細胞形成。 4 CpG島 CG兩聯(lián)核苷酸的出現(xiàn)頻率低: CG兩聯(lián)核苷酸的出現(xiàn)頻率僅為其隨機出現(xiàn)頻率的20% 許多人類基因5端的12kb片段中發(fā)現(xiàn)CpG島: 這些CpG島一般跨越-1500500,并且其CpG密度達到隨機預測的水平。 CpG島的意義: CpG與已知轉錄增強子如Sp1等的結合位點有關 人類基因組大約有4
20、5000個CpG島,有一半左右與已知的管家基因關聯(lián),其余的CpG島有許多和組織特異性基因的啟動子相關聯(lián) CpG島很少出現(xiàn)在不含基因的區(qū)域或那些發(fā)生多次突變的基因中 兔類球蛋白基因族:人類基因組富含GC的一組組織特異性基因。對應基因的區(qū)域用黑色框來表示,而兔基因組中主要短散布元件的拷貝(C重復)用數字標注并表示為黑色箭頭。 下一幅圖顯示200bp滑動窗口中出現(xiàn)核苷酸G或C的頻率。 底部兩附圖表示200bp滑動窗口中兩聯(lián)核苷酸CpG和GpC和出現(xiàn)次數。在-1球蛋白基因的5端都出現(xiàn)了CpG島。另外兩聯(lián)核苷酸5-GC-3的出現(xiàn)次數一般比CpG高,這是因為CpG易被甲基化而發(fā)生突變。5. 人類基因組的多
21、態(tài)性及在分子診斷中的應用短串聯(lián)重復序列短串聯(lián)重復序列 ( short tandem repeat , STR): STR在人類基因組內分布廣泛,平均每15 kb20 kb就有一個STR位點,占基因組的10% 多存在于非編碼區(qū)及內含子中,具高度多態(tài)性且信息量大,檢測快速,成為非常重要的一種遺傳標記。STR的主要用途:的主要用途: 人類基因遺傳圖譜的制作。 目的基因篩選和基因診斷。若目的基因與STR位點鄰近且有連鎖關系,可通過對STR附近區(qū)域克隆測序而發(fā)現(xiàn)目的基因。通過家系和對照研究,運用連鎖和相關分析,可以找到與疾病高度相關STR位點。1993年首先發(fā)現(xiàn)肝臟苯丙氨酸羥化酶(phenylalani
22、ne hydroxylase,PHA)基因內含子3中,有STR位點(TCTA)存在于約700bp處,通過連鎖分析可對PKU患者進行產前基因診斷。 法醫(yī)學個體識別和親權鑒定。法醫(yī)案例中,特別對量極少和降解嚴重的生物檢材,通過PCR擴增STR位點并將幾個STR位點聯(lián)合起來分析,可得到相當高的累積個體識別率和父權排除率,可為司法偵案、破案提供有利的科學依據。 STR在醫(yī)學的意義: STR位點的不穩(wěn)定性與疾病的相關性是研究熱點,STR主要以三核苷酸為重復單位,如果父母本的某個或某些STR重復次數超過正常個體的上限,處于一種前突變狀態(tài),則易造成后代相應位點核心序列重復數目急劇增加。已發(fā)現(xiàn)有8種人類遺傳性
23、疾病與此相關,如脆性X 綜合癥、重癥肌無力(myasthenia gravis)、Huntington 舞蹈癥(Huntingtons chorea disease)等。 STR與腫瘤關系密切。1990年在遺傳性非息肉性結腸炎中發(fā)現(xiàn),與正常組織比較,腫瘤組織中STR拷貝數發(fā)生明顯變異,在胃癌、食道癌、乳腺癌及肺癌等多種腫瘤中均發(fā)現(xiàn)STR不穩(wěn)定現(xiàn)象,使STR成為腫瘤檢測的重要手段。單核苷酸的多態(tài)性 單核苷酸的多態(tài)性( single nucleotide polymorphism, SNP): 是因單個堿基的變異(主要是置換,也有缺失和插入)引起的DNA序列多態(tài)性,在特定核苷酸位置上存在兩種不同的
24、堿基,其中最少一種在群體中的頻率不小于1%。 人類基因組中每3001000個核苷酸就有一個SNP,占所有已知多態(tài)性的90%以上。 盡管遺傳密碼由4種堿基組成,但SNP通常是二等位基因(biallelic)的,CG序列出現(xiàn)最為頻繁,大多是C轉變?yōu)門,原因是CG中C常為甲基化的、自發(fā)地脫氨后即成為胸腺嘧啶。 SNP在單個基因或整個基因組中的分布不是均勻的,由于選擇壓力等原因,SNP在非轉錄序列中要多于轉錄序列,而且在轉錄區(qū)也是非同義突變的頻率比其它方式突變的頻率低得多。 在蛋白質編碼區(qū)的SNP被稱為基因編碼區(qū)SNPs(Coding-region SNPs,cSNPs),與蛋白的功能有關,在功能或致病方面具重要意義。ATGCACACACACACACACATGCACACACACACACACACACAType of variation Type of variation among populationamong populationSNPSNPSTRSTRSNP主要用途有: 疾病的連鎖分析與基因的定位,包括復雜疾病(如骨質疏松癥、糖尿病、心血管疾病、腫瘤等)的基因定位、關聯(lián)分析,并可用于遺傳病的單倍型診
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度特色餐飲檔口經營權轉讓合同
- 二零二五年度養(yǎng)殖場地承包與農業(yè)科技研發(fā)合同
- 二零二五年度土地經營權流轉與農產品品牌建設協(xié)議
- 2025年度校園安全責任協(xié)議書家長反饋流程
- 二零二五年度施工合同糾紛和解免責協(xié)議
- 2025年度都市時尚酒吧連鎖經營合作協(xié)議
- 工作交流座談會發(fā)言稿
- 整體防雷方案設計及接地系統(tǒng)方案
- 2025年郴州貨運從業(yè)資格考試題
- 影視劇本等信息保密合同
- 溫庭筠《望江南》ppt課件
- 口腔正畸學單詞
- 公共場所健康證體檢表
- 普通高等學校獨立學院教育工作合格評估指標體系(第六稿)
- 內襯修復用HTPO管材企標
- 部編教材一年級下冊生字筆順筆畫
- 多維閱讀第13級—A Stolen Baby 小猩猩被偷走了
- 二維火收銀使用手冊
- 2018版公路工程質量檢驗評定標準分項工程質量檢驗評定表交通安全設施
- EN12680.3中文
- 歐科模塊化風冷冷水熱泵機組報警代碼和維修步驟
評論
0/150
提交評論