基因測序原理_第1頁
基因測序原理_第2頁
基因測序原理_第3頁
基因測序原理_第4頁
基因測序原理_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

關(guān)于基因測序原理主要內(nèi)容:什么是基因組什么是基因DNA測序的方法DNA序列的組裝人類基因組計(jì)劃水稻基因組計(jì)劃后基因組學(xué)第2頁,共81頁,2024年2月25日,星期天1.什么是基因組

基因組就是一個(gè)物種中所有基因的整體組成。基因組有兩層意義:遺傳物質(zhì)和遺傳信息。要揭開生命的奧秘,就需要從整體水平研究基因的存在、基因的結(jié)構(gòu)與功能、基因之間的相互關(guān)系。第3頁,共81頁,2024年2月25日,星期天Zeamays8,000Homosapiens3,000Oryzasativa400Drosophilamelanogaster165Arabidopsisthaliana100Saccharomycescerevisiae12E.coli4.6GenomeSize(Mb)第4頁,共81頁,2024年2月25日,星期天什么是C值?通常是指一種生物單倍體基因組DNA的總量.

在真核生物中,C值一般隨著生物的進(jìn)化而增加,高等生物C值一般大于低等生物。

C值悖理:生物的復(fù)雜性與基因組的大小并不完全成比例增加第5頁,共81頁,2024年2月25日,星期天細(xì)菌真菌等動(dòng)物陰影部分為一個(gè)門內(nèi)C-值的范圍第6頁,共81頁,2024年2月25日,星期天重復(fù)順序

高度重復(fù)順序:長度:幾個(gè)——幾千個(gè)bp

拷貝數(shù):幾百個(gè)——上百萬個(gè)首尾相連,串聯(lián)排列集中分布于染色體的特定區(qū)段(如端粒,著絲粒等)也稱衛(wèi)星DNA中度重復(fù)順序:一般分散于整個(gè)基因組中;長度和拷貝數(shù)差別很大單一順序:基因主要位于單一順序動(dòng)物中單一順序約占50%植物中單一順序約占20%第7頁,共81頁,2024年2月25日,星期天第8頁,共81頁,2024年2月25日,星期天第9頁,共81頁,2024年2月25日,星期天

是遺傳信息的物理和功能單位,包含產(chǎn)生一條多肽鏈或功能RNA所必需的全部核苷酸序列。

基因分類:編碼RNA的基因,如rRNA基因,snRNA基因等;編碼蛋白質(zhì)的基因2.什么是基因?第10頁,共81頁,2024年2月25日,星期天第11頁,共81頁,2024年2月25日,星期天第12頁,共81頁,2024年2月25日,星期天第13頁,共81頁,2024年2月25日,星期天第14頁,共81頁,2024年2月25日,星期天*一個(gè)基因完全在另一個(gè)基因內(nèi)部如:B和A,E和D

其讀碼結(jié)構(gòu)互不相同---ATG-----//------AATGCC----//---ATAACG---//--TAA----A*BATGCCN----NNATAA第15頁,共81頁,2024年2月25日,星期天*部分重疊如:K和C*兩個(gè)基因共用少數(shù)堿基對(duì)如:D和J-------TAATG-------D終止密碼子J起始密碼子第16頁,共81頁,2024年2月25日,星期天3.DNA測序的方法鏈終止法測序化學(xué)降解法測序自動(dòng)化測序非常規(guī)DNA測序第17頁,共81頁,2024年2月25日,星期天3.1鏈終止法測序(thechainterminationmethod)

基本原理:

通過合成與單鏈DNA互補(bǔ)的多核苷酸鏈,由于合成的互補(bǔ)鏈可在不同位置隨機(jī)終止反應(yīng),產(chǎn)生只差一個(gè)核苷酸的DNA分子,從而來讀取待測DNA分子的順序。第18頁,共81頁,2024年2月25日,星期天技術(shù)路線與要求制備單鏈模板↓將單鏈模板與一小段引物退火↓加入DNA多聚酶

4種脫氧核苷酸分別加入少量4種雙脫氧核苷酸

↓將4種反應(yīng)產(chǎn)物分別在4條泳道電泳↓根據(jù)4個(gè)堿基在4條泳道的終止位置讀出基因序列

A克隆于質(zhì)粒中DNA→用堿或熱變性BM13克隆單鏈DNAC噬粒克隆DNADPCR產(chǎn)生單鏈DNAA高酶活性B無5’→3′外切酶活性C無3′→5′外切酶活性ddATP/ddCTP/ddGTP/ddTTP的3’碳原子連接的是氫原子,不是羥基第19頁,共81頁,2024年2月25日,星期天第20頁,共81頁,2024年2月25日,星期天第21頁,共81頁,2024年2月25日,星期天3.2化學(xué)降解法測序基本原理:

在選定的核苷酸堿基中引入化學(xué)集團(tuán),再用化合物處理,使DNA分子在被修飾的位置降解.第22頁,共81頁,2024年2月25日,星期天技術(shù)路線

將雙鏈DNA樣品變?yōu)閱捂湣總€(gè)單鏈的同一方向末端都用放射性同位素標(biāo)記,以便顯示DNA條帶↓分別用不同方法處理,獲得只差一個(gè)核苷酸的降解DNA群體↓電泳,讀取DNA的核苷酸順序第23頁,共81頁,2024年2月25日,星期天Maxam-Gilbert法所用的化學(xué)技術(shù)

堿基特異修飾方法GPh8.0,用硫酸二甲酯對(duì)N7進(jìn)行甲基化,使C8-C9鍵對(duì)堿基裂解有特殊敏感性A+GpH2.0哌啶甲酸可使嘌呤環(huán)的N原子化,從而導(dǎo)致脫嘌呤,并因此消弱腺嘌呤和鳥嘌呤的糖苷鍵C+T肼可打開嘧啶環(huán),后者重新環(huán)化成五元環(huán)后易除去C1.5mol/LNaCl存在時(shí),可用肼除去胞嘧啶第24頁,共81頁,2024年2月25日,星期天第25頁,共81頁,2024年2月25日,星期天3.3自動(dòng)化測序基本原理與鏈終止法測序原理相同,只是用不同的熒光色彩標(biāo)記ddNTP,如ddATP標(biāo)記紅色熒光,ddCTP標(biāo)記藍(lán)色熒光,ddGTP標(biāo)記黃色熒光,ddTTP標(biāo)記綠色熒光.由于每種ddNTP帶有各自特定的熒光顏色,而簡化為由1個(gè)泳道同時(shí)判讀4種堿基.第26頁,共81頁,2024年2月25日,星期天第27頁,共81頁,2024年2月25日,星期天第28頁,共81頁,2024年2月25日,星期天DNA芯片測序基本原理將各種排列順序的寡核苷酸點(diǎn)播在芯片上,每個(gè)點(diǎn)播的寡核苷酸在排列的方陣中都有指定的位置.待檢測的DNA分子與芯片溫浴,凡是能雜交的寡核苷酸都會(huì)在確定位置發(fā)出信號(hào),然后根據(jù)獲取的信息將寡核苷酸的順序進(jìn)行對(duì)比組裝,拼接成完全的DNA順序.第29頁,共81頁,2024年2月25日,星期天利用基因芯片進(jìn)行雜交測序的原理第30頁,共81頁,2024年2月25日,星期天4序列的組裝4.1隨機(jī)測序與序列組裝

隨機(jī)測序也稱”鳥槍法”.

序列組裝原理:直接從已測序的小片段中尋找彼此重疊的測序克隆,然后依次向兩側(cè)鄰接的序列延伸.

優(yōu)點(diǎn):不需預(yù)先了解任何基因組的情況.ABCABCABCABC小片段測序計(jì)算機(jī)拼裝第31頁,共81頁,2024年2月25日,星期天ABC小片段測序計(jì)算機(jī)拼裝鳥槍法(Shotgun)測序的問題CAATGCATTA……GCAGCCAATGCGAP錯(cuò)裝第32頁,共81頁,2024年2月25日,星期天實(shí)例:流感嗜血桿菌基因組的測序及順序組裝超聲波打斷純化的基因組DNA↓瓊脂糖電泳收集1.6~2.0Kb的區(qū)段、純化

↓構(gòu)建到質(zhì)粒載體中↓隨機(jī)挑選19687個(gè)克隆,進(jìn)行28643次測序,得到可讀順序?yàn)?1631485bp↓組裝成140個(gè)覆蓋全基因組范圍的獨(dú)立的順序重疊群,↓第33頁,共81頁,2024年2月25日,星期天

各重疊群間仍有間隙

順序間隙物理間隙

↓↓

載體或宿主菌選用不當(dāng)而被丟失的順序測序時(shí)遺漏的測序解決辦法:通過相鄰已知順序作為探針篩選已有的基因組文庫解決辦法:利用其它宿主菌與載體重新構(gòu)建文庫第34頁,共81頁,2024年2月25日,星期天4.2

限制測序

限制測序:是指將一段染色體區(qū)段的DNA順序進(jìn)行組裝.

一些已繪制了遺傳圖與物理圖的微生物基因組測序中也采用這一方法.

如高等植物擬南芥基因組的測序完全依據(jù)克隆重疊群,先進(jìn)行各個(gè)BAC克隆的隨機(jī)測序,再進(jìn)行序列組裝;

水稻基因組測序計(jì)劃采取得策略與此相同.第35頁,共81頁,2024年2月25日,星期天4.3

指導(dǎo)測序與序列組裝

建立在基因組圖譜基礎(chǔ)上的”鳥槍法”,即所謂”指導(dǎo)鳥槍法”或”指導(dǎo)測序”。在人類基因組進(jìn)入測序組裝階段就采用此方法,其基本步驟如下:A構(gòu)建平均為2Kb的人類基因組質(zhì)粒文庫,進(jìn)行雙向測序;B構(gòu)建平均10Kb的人類基因組質(zhì)粒文庫,進(jìn)行雙向測序,讀取2個(gè)端部順序;C參考人類基因組圖,特別是大量的STS位標(biāo)作為基點(diǎn),進(jìn)行序列組裝,排成重疊克隆群.第36頁,共81頁,2024年2月25日,星期天

先將染色體打成比較大的片段(幾十-幾百Kb),利用分子標(biāo)記將這些大片段排成重疊的克隆群(Contig),分別測序后拼裝.這種策略叫基于克隆群(contig-based)的策略.ABCABC大片段contig小片段測序拼裝第37頁,共81頁,2024年2月25日,星期天兩種策略的比較鳥槍法策略指導(dǎo)測序策略不需背景信息構(gòu)建克隆群

(遺傳、物理圖譜)時(shí)間短需要幾年的時(shí)間需要大型計(jì)算機(jī)得到的是草圖(Draft)得到精細(xì)圖譜第38頁,共81頁,2024年2月25日,星期天4.5

其他測序路線重要區(qū)域優(yōu)先測序人們對(duì)感興趣的基因或與疾病相關(guān)的基因優(yōu)先測序.如:人類主要組織相容性復(fù)合區(qū)位于第6號(hào)染色體,與人類免疫系統(tǒng)有關(guān),因而優(yōu)先測序.第39頁,共81頁,2024年2月25日,星期天EST(Expressedsequencetag)測序

EST是一種重要的基因組圖分子標(biāo)記,以EST為探針很容易從cDNA文庫中篩選全基因,又可從BAC克隆中找到其基因組的基因序列.

優(yōu)點(diǎn):AmRNA可直接反轉(zhuǎn)錄成cDNA,而且cDNA文庫也比較容易構(gòu)建;B對(duì)cDNA文庫大量測序,即可獲得大量EST的序列;CEST為基因的編碼區(qū),不包括內(nèi)含子和基因間區(qū)域,一次測序的結(jié)果足以鑒定所代表的基因;第40頁,共81頁,2024年2月25日,星期天5.人類基因組計(jì)劃

人類基因組計(jì)劃(Humangenomeproject)于1990年啟動(dòng),我國于1999年加入該計(jì)劃,承擔(dān)其中1%的任務(wù),即人類3號(hào)染色體短臂上約30Mb的測序任務(wù)。

第41頁,共81頁,2024年2月25日,星期天5.1人類基因組計(jì)劃的目的

闡明人類基因組30億個(gè)堿基對(duì)的序列,發(fā)現(xiàn)所有人類基因,并搞清其在染色體上的位置;破譯人類全部遺傳信息,使人類第一次在分子水平上全面地認(rèn)識(shí)自我;解碼生命、了解生命的起源、了解生命體生長發(fā)育的規(guī)律;認(rèn)識(shí)種屬之間和個(gè)體之間存在差異的起因、認(rèn)識(shí)疾病產(chǎn)生的機(jī)制以及長壽與衰老等生命現(xiàn)象、為疾病的診治提供科學(xué)依據(jù)。第42頁,共81頁,2024年2月25日,星期天5.2人類基因組草圖的完成

2000年6月26日是人類歷史上值得紀(jì)念的一天。人類基因組的工作草圖已經(jīng)繪制完畢并于這天向全世界公布。最終完成圖要求測序所用的克隆能忠實(shí)地代表常染色體的基因組結(jié)構(gòu),序列錯(cuò)誤率低于萬分之一。第43頁,共81頁,2024年2月25日,星期天A.CeleraGenomics人類基因組的測序策略5.3人類基因組測序策略第44頁,共81頁,2024年2月25日,星期天采集5個(gè)自愿者的DNA樣品構(gòu)建3種不同插入子大小的基因組文庫2Kb,10Kb和50Kb完成約2700萬次插入子末端測序,總長14800MbGeneBank下載104018個(gè)BAC末端順序PFP發(fā)表的公開數(shù)據(jù)主要為BAC克隆的順序,共4443.3Mb隨機(jī)測序與序列組裝方法和指導(dǎo)測序與序列組裝方法相結(jié)合進(jìn)行序列組裝第45頁,共81頁,2024年2月25日,星期天B國際人類基因組測序策略構(gòu)建BAC克隆↓限制性酶處理獲得指紋↓根據(jù)指紋重疊方法組建BAC克隆重疊群↓根據(jù)STS標(biāo)記,將BAC克隆重疊群標(biāo)定在物理圖上↓每個(gè)BAC克隆內(nèi)部采用鳥槍法測序,組裝↓將BAC插入順序與BAC克隆指紋極重疊群對(duì)比,將已閱讀的順序錨定到物理圖上第46頁,共81頁,2024年2月25日,星期天第47頁,共81頁,2024年2月25日,星期天第48頁,共81頁,2024年2月25日,星期天人類基因組研究的驚人發(fā)現(xiàn)?19號(hào)染色體是含基因最豐富的染色體,而13號(hào)染色體含基因量最少?目前已經(jīng)發(fā)現(xiàn)和定位了26000多個(gè)功能基因,其中尚有42%的基因尚不知道功能?人類基因組中存在“熱點(diǎn)”和大片“荒漠”。在染色體上有基因成簇密集分布的區(qū)域,也有大片的區(qū)域只有“無用DNA”——不包含或含有極少基因的成分?;蚪M上大約有1/4的區(qū)域沒有基因的片段。

?35.3%的基因包含重復(fù)的序列。這說明那些原來被認(rèn)為是“垃圾”的DNA也起重要作用,應(yīng)該被進(jìn)一步研究。第49頁,共81頁,2024年2月25日,星期天什么是單核苷酸多態(tài)性

人類99.9%的基因密碼是相同的,而差異不到0.1%,不同人群僅有140萬個(gè)核苷酸差異。這些差異是由“單一核苷酸多樣性”(SNP)產(chǎn)生的,它構(gòu)成了不同個(gè)體的遺傳基礎(chǔ),個(gè)體的多樣性被認(rèn)為是產(chǎn)生遺傳疾病的原因。在整個(gè)基因組序列中,人與人之間的變異僅為萬分之一,從而說明人類不同“種屬”之間并沒有本質(zhì)上的區(qū)別。第50頁,共81頁,2024年2月25日,星期天5.5人類基因組計(jì)劃的意義隨著人類基因組逐漸被破譯,一張生命之圖將被繪就,人們的生活也將發(fā)生巨大變化。人類基因研究的意義在于它可以支持和推動(dòng)生命科學(xué)中一系列重要的基礎(chǔ)性研究。如基因組遺傳語言的破譯,基因的結(jié)構(gòu)與功能關(guān)系,生命的起源和進(jìn)化,細(xì)胞發(fā)育、生產(chǎn)、分化的分子機(jī)理,疾病發(fā)生的機(jī)理等。第51頁,共81頁,2024年2月25日,星期天5.6人類基因組計(jì)劃的論理學(xué)A個(gè)人DNA順序的隱私權(quán).

如:”次等”基因攜帶者可能受到岐視,職業(yè)限制,醫(yī)療保險(xiǎn)等問題;B基因?qū)@麊栴}第52頁,共81頁,2024年2月25日,星期天6.后人類基因組計(jì)劃

伴隨著人類基因組計(jì)劃的迅速進(jìn)展,基因的全序列逐步被完整的測出,會(huì)出現(xiàn)大量的不知道任何功能信息的序列。因此,在HGP完成之后,即全部人類基因被定序之后,還需要:破解貯存于基因組之中的遺傳語言;識(shí)別、分離、鑒定和克隆所有基因;搞清每個(gè)基因的功能及基因之間的相互作用和相互關(guān)系。第53頁,共81頁,2024年2月25日,星期天7水稻的基因組

2002年我國科學(xué)家完成了水稻基因組定序和初步分析。出人意表的是,水稻的基因竟比人類基因還要多得多。人類基因大約有3-4萬個(gè),水稻有46022-55615個(gè)基因。因此水稻基因組可說是繼人類基因組之后,完成定序的最大基因組,也是至今已知最大的植物基因組。由于水稻是全球半數(shù)以上人口的主食,對(duì)解決全球糧食問題具有重要意義。第54頁,共81頁,2024年2月25日,星期天本章要點(diǎn)鏈終止法測序人類基因組計(jì)劃了解其他基因測序方法和基因拼接方法第55頁,共81頁,2024年2月25日,星期天本章內(nèi)容結(jié)束謝謝!第56頁,共81頁,2024年2月25日,星期天第二講基因組序列詮釋第57頁,共81頁,2024年2月25日,星期天問題基因組序列所包含的全部遺傳信息是什么?基因組作為一個(gè)整體如何行使其功能?用什么方法尋找基因,研究基因地功能呢?第58頁,共81頁,2024年2月25日,星期天主要內(nèi)容:尋找基因獲取基因的全長cDNA序列確定DNA順序中基因的位置研究基因的功能基因表達(dá)蛋白質(zhì)組學(xué)第59頁,共81頁,2024年2月25日,星期天1.尋找基因1.1根據(jù)開放讀碼框預(yù)測基因A起始密碼子ATG第一個(gè)ATG的確定則依據(jù)Kozak規(guī)則;Kozak規(guī)則是基于已知數(shù)據(jù)的統(tǒng)計(jì)結(jié)果,所謂Kozak規(guī)則,即第一個(gè)ATG側(cè)翼序列的堿基分布所滿足的統(tǒng)計(jì)規(guī)律.第60頁,共81頁,2024年2月25日,星期天

若將第一個(gè)ATG中的堿基A,T,G分別標(biāo)為1,2,3位,則Kozak規(guī)則可描述如下:(1)第4位的偏好堿基為G;(2)ATG的5’端約15bp范圍的側(cè)翼序列內(nèi)不含堿基T;(3)在-3,-6和-9位置,G是偏好堿基;(4)除-3,-6和-9位,在整個(gè)側(cè)翼序列區(qū),C是偏好堿基。第61頁,共81頁,2024年2月25日,星期天信號(hào)肽分析信號(hào)肽分析軟件(SignalPhttp://www.cbs.dtu.dk/services/signalP)

把預(yù)測過程中證實(shí)含完整mRNA5’端的Contig翻譯為蛋白序列;

然后用SignalP軟件對(duì)前50個(gè)氨基酸序列(從第一個(gè)ATG對(duì)應(yīng)的甲硫氨酸Met開始)進(jìn)行評(píng)估,如果SignalP分析給出正面結(jié)果,則測試序列有可能為信號(hào)肽;

假如在該測試序列的第一個(gè)Met5’端存在終止密碼子,該序列為信號(hào)肽的可能性更大。第62頁,共81頁,2024年2月25日,星期天B終止密碼子終止密碼子:TAA,TAG,TGAGC%=50%終止密碼子每64bp出現(xiàn)一次;

GC%>50%終止密碼子每100-200bp出現(xiàn)一次;由于多數(shù)基因ORF均多于50個(gè)密碼子,因此最可能的選擇應(yīng)該是ORF不少于100個(gè)密碼子。第63頁,共81頁,2024年2月25日,星期天C3’端的確認(rèn)

3’端的確認(rèn)主要根據(jù)Poly(A)尾序列,若測試Contig不含Poly(A)序列,則根據(jù)加尾信號(hào)序列“AATAAA”和BLAST同源性比較結(jié)果共同判斷。第64頁,共81頁,2024年2月25日,星期天D非編碼序列、內(nèi)含子高等真核生物多數(shù)外顯子長度不少于100個(gè)密碼子,有的不到50個(gè)密碼子甚至更少;第65頁,共81頁,2024年2月25日,星期天E密碼子偏愛性編碼同一氨基酸的不同密碼子稱為同義密碼,其差別僅在密碼子的第3位堿基不同。不同種屬間使用同義密碼的頻率有很大差異,如人類基因中,丙氨酸(Ale)密碼子多為GCA,GCC或GCT,而GCG很少使用。第66頁,共81頁,2024年2月25日,星期天F外顯子-內(nèi)含子邊界外顯子和內(nèi)含子的邊界有一些明顯的特征,如:內(nèi)含子的5‘端或稱供體位(donorsite)常見的順序?yàn)?’-AG↓GTTAAGT-3’;

3’端又稱受體位(acceptorsite),多為5‘PyPyPyPyPyPyCAG-3’(“Py”嘧啶核苷酸,T或C);第67頁,共81頁,2024年2月25日,星期天G上游控制順序幾乎所有基因(或操縱子)上游都有調(diào)控序列,它們可與DNA結(jié)合蛋白作用,控制基因表達(dá)。另外個(gè)別生物的基因組特有組成也可作為判別依據(jù),如脊椎動(dòng)物基因組許多基因的上游都有CpG島。

第68頁,共81頁,2024年2月25日,星期天H軟件預(yù)測采用NCBI的ORF預(yù)測軟件(ORFfinder:/gorf/orfig.cgi)判斷ORF的可能范圍。第69頁,共81頁,2024年2月25日,星期天1.2mRNA的5’端即轉(zhuǎn)錄起始位點(diǎn)區(qū)通過同源性比較來預(yù)測mRNA的5’端,最常用的與轉(zhuǎn)錄起始位點(diǎn)相關(guān)的數(shù)據(jù)庫是真核啟動(dòng)子數(shù)據(jù)庫(TheTRADATProject,EukaryoticPromoterDatabase,EPD.http://www

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論