基因組測(cè)序與序列組裝_第1頁
基因組測(cè)序與序列組裝_第2頁
基因組測(cè)序與序列組裝_第3頁
基因組測(cè)序與序列組裝_第4頁
基因組測(cè)序與序列組裝_第5頁
已閱讀5頁,還剩31頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

基因組測(cè)序與序列組裝第一頁,共三十六頁,編輯于2023年,星期五主要內(nèi)容:什么是基因組什么是基因DNA測(cè)序的方法DNA序列的組裝人類基因組計(jì)劃水稻基因組計(jì)劃后基因組學(xué)第二頁,共三十六頁,編輯于2023年,星期五1.什么是基因組

基因組就是一個(gè)物種中所有基因的整體組成?;蚪M有兩層意義:遺傳物質(zhì)和遺傳信息。要揭開生命的奧秘,就需要從整體水平研究基因的存在、基因的結(jié)構(gòu)與功能、基因之間的相互關(guān)系。第三頁,共三十六頁,編輯于2023年,星期五Zeamays8,000Homosapiens3,000Oryzasativa400Drosophilamelanogaster165Arabidopsisthaliana100Saccharomycescerevisiae12E.coli4.6GenomeSize(Mb)第四頁,共三十六頁,編輯于2023年,星期五什么是C值?通常是指一種生物單倍體基因組DNA的總量.

在真核生物中,C值一般隨著生物的進(jìn)化而增加,高等生物C值一般大于低等生物。

C值悖理:生物的復(fù)雜性與基因組的大小并不完全成比例增加第五頁,共三十六頁,編輯于2023年,星期五細(xì)菌真菌等動(dòng)物陰影部分為一個(gè)門內(nèi)C-值的范圍第六頁,共三十六頁,編輯于2023年,星期五重復(fù)順序高度重復(fù)順序:長度:幾個(gè)——幾千個(gè)bp

拷貝數(shù):幾百個(gè)——上百萬個(gè)首尾相連,串聯(lián)排列集中分布于染色體的特定區(qū)段(如端粒,著絲粒等)也稱衛(wèi)星DNA中度重復(fù)順序:一般分散于整個(gè)基因組中;長度和拷貝數(shù)差別很大單一順序:基因主要位于單一順序動(dòng)物中單一順序約占50%植物中單一順序約占20%第七頁,共三十六頁,編輯于2023年,星期五

是遺傳信息的物理和功能單位,包含產(chǎn)生一條多肽鏈或功能RNA所必需的全部核苷酸序列。

基因分類:編碼RNA的基因,如rRNA基因,snRNA基因等;編碼蛋白質(zhì)的基因2.什么是基因?第八頁,共三十六頁,編輯于2023年,星期五基因的不連續(xù)性Intron和Exon:大多數(shù)真核生物蛋白質(zhì)基因的編碼順序(Exon)都被或長或短的非編碼順序(Intron)隔開第九頁,共三十六頁,編輯于2023年,星期五基因家族

一群具有一致的或相似順序的基因,有的還擔(dān)負(fù)類似的生物學(xué)功能,可以相互補(bǔ)償,比如:E2ftranscriptionfactorMousesymbolHumanOrthologE2f1E2F1E2f2E2F2E2f3E2F3E2f4E2F4E2f5E2F5E2f6E2F6第十頁,共三十六頁,編輯于2023年,星期五假基因(Pseudogene)來源于功能基因但已失去活性的DNA序列產(chǎn)生假基因的原因有:由重復(fù)產(chǎn)生的假基因;加工的假基因,由RNA反轉(zhuǎn)錄為cDNA后再整合到基因組中;殘缺的基因(Truncatedgene)第十一頁,共三十六頁,編輯于2023年,星期五重疊基因:同一段DNA能攜帶兩種不同蛋白的信息.

重迭基因有以下幾種情況:*一個(gè)基因完全在另一個(gè)基因內(nèi)部*部分重疊*兩個(gè)基因共用少數(shù)堿基對(duì)第十二頁,共三十六頁,編輯于2023年,星期五*一個(gè)基因完全在另一個(gè)基因內(nèi)部如:B和A,E和D

其讀碼結(jié)構(gòu)互不相同---ATG-----//------AATGCC----//---ATAACG---//--TAA----A*BATGCCN----NNATAA第十三頁,共三十六頁,編輯于2023年,星期五*部分重疊如:K和C*兩個(gè)基因共用少數(shù)堿基對(duì)如:D和J-------TAATG-------D終止密碼子J起始密碼子第十四頁,共三十六頁,編輯于2023年,星期五3.DNA測(cè)序的方法鏈終止法測(cè)序化學(xué)降解法測(cè)序自動(dòng)化測(cè)序非常規(guī)DNA測(cè)序第十五頁,共三十六頁,編輯于2023年,星期五3.1鏈終止法測(cè)序(thechainterminationmethod)

基本原理:

通過合成與單鏈DNA互補(bǔ)的多核苷酸鏈,由于合成的互補(bǔ)鏈可在不同位置隨機(jī)終止反應(yīng),產(chǎn)生只差一個(gè)核苷酸的DNA分子,從而來讀取待測(cè)DNA分子的順序。第十六頁,共三十六頁,編輯于2023年,星期五技術(shù)路線與要求制備單鏈模板↓將單鏈模板與一小段引物退火↓加入DNA多聚酶

4種脫氧核苷酸分別加入少量4種雙脫氧核苷酸

↓將4種反應(yīng)產(chǎn)物分別在4條泳道電泳↓根據(jù)4個(gè)堿基在4條泳道的終止位置讀出基因序列

A克隆于質(zhì)粒中DNA→用堿或熱變性BM13克隆單鏈DNAC噬??寺NADPCR產(chǎn)生單鏈DNAA高酶活性B無5’→3′外切酶活性C無3′→5′外切酶活性ddATP/ddCTP/ddGTP/ddTTP的3’碳原子連接的是氫原子,不是羥基第十七頁,共三十六頁,編輯于2023年,星期五第十八頁,共三十六頁,編輯于2023年,星期五第十九頁,共三十六頁,編輯于2023年,星期五3.2化學(xué)降解法測(cè)序基本原理:

在選定的核苷酸堿基中引入化學(xué)基團(tuán),再用化合物處理,使DNA分子在被修飾的位置降解。第二十頁,共三十六頁,編輯于2023年,星期五技術(shù)路線

將雙鏈DNA樣品變?yōu)閱捂湣總€(gè)單鏈的同一方向末端都用放射性同位素標(biāo)記,以便顯示DNA條帶↓分別用不同方法處理,獲得只差一個(gè)核苷酸的降解DNA群體↓電泳,讀取DNA的核苷酸順序第二十一頁,共三十六頁,編輯于2023年,星期五Maxam-Gilbert法所用的化學(xué)技術(shù)

堿基特異修飾方法GPh8.0,用硫酸二甲酯對(duì)N7進(jìn)行甲基化,使C8-C9鍵對(duì)堿基裂解有特殊敏感性A+GpH2.0哌啶甲酸可使嘌呤環(huán)的N原子化,從而導(dǎo)致脫嘌呤,并因此消弱腺嘌呤和鳥嘌呤的糖苷鍵C+T肼可打開嘧啶環(huán),后者重新環(huán)化成五元環(huán)后易除去C1.5mol/LNaCl存在時(shí),可用肼除去胞嘧啶第二十二頁,共三十六頁,編輯于2023年,星期五化學(xué)法測(cè)序?qū)嵗哙さ诙摚踩?,編輯?023年,星期五3.3自動(dòng)化測(cè)序基本原理與鏈終止法測(cè)序原理相同,只是用不同的熒光色彩標(biāo)記ddNTP,如ddATP標(biāo)記紅色熒光,ddCTP標(biāo)記藍(lán)色熒光,ddGTP標(biāo)記黃色熒光,ddTTP標(biāo)記綠色熒光.由于每種ddNTP帶有各自特定的熒光顏色,而簡化為由1個(gè)泳道同時(shí)判讀4種堿基.第二十四頁,共三十六頁,編輯于2023年,星期五第二十五頁,共三十六頁,編輯于2023年,星期五3.4非常規(guī)測(cè)序毛細(xì)管電泳

用毛細(xì)管電泳取代聚丙烯凝膠平板電泳,節(jié)省時(shí)間,加快測(cè)序進(jìn)程,其他程序同鏈終止法或化學(xué)測(cè)序法。

第二十六頁,共三十六頁,編輯于2023年,星期五DNA芯片測(cè)序基本原理將各種排列順序的寡核苷酸點(diǎn)播在芯片上,每個(gè)點(diǎn)播的寡核苷酸在排列的方陣中都有指定的位置.待檢測(cè)的DNA分子與芯片溫浴,凡是能雜交的寡核苷酸都會(huì)在確定位置發(fā)出信號(hào),然后根據(jù)獲取的信息將寡核苷酸的順序進(jìn)行對(duì)比組裝,拼接成完全的DNA順序.第二十七頁,共三十六頁,編輯于2023年,星期五利用基因芯片進(jìn)行雜交測(cè)序的原理第二十八頁,共三十六頁,編輯于2023年,星期五4序列的組裝4.1隨機(jī)測(cè)序與序列組裝

隨機(jī)測(cè)序也稱”鳥槍法”。序列組裝原理:直接從已測(cè)序的小片段中尋找彼此重疊的測(cè)序克隆,然后依次向兩側(cè)鄰接的序列延伸。優(yōu)點(diǎn):不需預(yù)先了解任何基因組的情況.ABCABCABCABC小片段測(cè)序計(jì)算機(jī)拼裝第二十九頁,共三十六頁,編輯于2023年,星期五ABC小片段測(cè)序計(jì)算機(jī)拼裝鳥槍法(Shotgun)測(cè)序的問題CAATGCATTA……GCAGCCAATGCGAP錯(cuò)裝第三十頁,共三十六頁,編輯于2023年,星期五實(shí)例:流感嗜血桿菌基因組的測(cè)序及序列組裝超聲波打斷純化的基因組DNA↓瓊脂糖電泳收集1.6~2.0Kb的區(qū)段、純化

↓構(gòu)建到質(zhì)粒載體中↓隨機(jī)挑選19687個(gè)克隆,進(jìn)行28643次測(cè)序,得到可讀順序?yàn)?1631485bp↓組裝成140個(gè)覆蓋全基因組范圍的獨(dú)立的順序重疊群,↓第三十一頁,共三十六頁,編輯于2023年,星期五

各重疊群間仍有間隙

順序間隙物理間隙

↓↓

載體或宿主菌選用不當(dāng)而被丟失的順序測(cè)序時(shí)遺漏的測(cè)序解決辦法:通過相鄰已知順序作為探針篩選已有的基因組文庫解決辦法:利用其它宿主菌與載體重新構(gòu)建文庫第三十二頁,共三十六頁,編輯于2023年,星期五4.2

限制測(cè)序

限制測(cè)序:是指將一段染色體區(qū)段的DNA序列進(jìn)行組裝.

一些已繪制了遺傳圖與物理圖的微生物基因組測(cè)序中也采用這一方法.

如高等植物擬南芥基因組的測(cè)序完全依據(jù)克隆重疊群,先進(jìn)行各個(gè)BAC克隆的隨機(jī)測(cè)序,再進(jìn)行序列組裝;

水稻基因組測(cè)序計(jì)劃采取的策略與此相同.第三十三頁,共三十六頁,編輯于2023年,星期五4.3

指導(dǎo)測(cè)序與序列組裝

建立在基因組圖譜基礎(chǔ)上的”鳥槍法”,即所謂”指導(dǎo)鳥槍法”或”指導(dǎo)測(cè)序”。在人類基因組進(jìn)入測(cè)序組裝階段就采用此方法,其基本步驟如下:A構(gòu)建平均為2Kb的人類基因組質(zhì)粒文庫,進(jìn)行雙向測(cè)序;B構(gòu)建平均10Kb的人類基因組質(zhì)粒文庫,進(jìn)行雙向測(cè)序,讀取2個(gè)端部順序;C參考人類基因組圖,特別是大量的STS位標(biāo)作為基點(diǎn),進(jìn)行序列組裝,排成重疊克隆群.第三十四頁,共三十六頁,編輯于2023年,星期五

先將染色體打成比較大的片段(幾十-幾百Kb),利用分子標(biāo)記將這些大片段排成重疊的克隆群(Contig),分別測(cè)序后拼裝.這種策略叫基于克隆群(contig-based)的策略.ABCABC大片段con

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論