




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
基因組學共二百五十四頁
元素(yuánsù)周期表的發(fā)現(xiàn)奠定了二十世紀物理、化學研究和發(fā)展的基礎(chǔ)元素(yuánsù)周期表“基因組序列圖”將奠定二十一世紀生命科學研究和生物產(chǎn)業(yè)發(fā)展的基礎(chǔ)!
“基因組”----生命科學的“元素周期表”人體解剖圖奠定了現(xiàn)代醫(yī)學發(fā)展的基礎(chǔ)共二百五十四頁生命(shēngmìng)的奧秘蘊藏于“四字天書”之中…GCTTCTTCCTCATTTTCTCTTGCCGCCACCATGCCGCCACCATCATTTTCTCTTGCCGCCACCATGCTTCTTCCTCATTTTCTCTCCACCATGCCGCCACCACGCCACCATGCTTCTTCCTCATCTCGCTTTCTTGCCGCCACCATGCCGCCACCGCTTCTTCCtTCTCT…共二百五十四頁基因組學
§1基因組學概述(ɡàishù)
§2基因組圖譜的構(gòu)建§3基因組測序§4功能基因組學共二百五十四頁基因組學概念(gàiniàn)及范疇
基因組(genome)是德國遺傳學家H.Winkler在1920年將gene(基因)和chromosome(染色體)兩個詞縮合而創(chuàng)造的一個新詞,意思是指染色體上的全部基因。幾十年來,隨著分子生物學的發(fā)展,其含義擴展為在個體水平代表(dàibiǎo)一個個體所有遺傳性狀的總和,在細胞水平代表(dàibiǎo)一個細胞所有不同染色體(單倍體)的總和,在分子水平代表(dàibiǎo)一個物種所有DNA分子的總和。
共二百五十四頁基因組學概述(ɡàishù)基因組(genome),又稱染色體組一個物種單倍體的染色體數(shù)目(shùmù),物種全部遺傳信息的總和物種遺傳信息的“總詞典”控制發(fā)育的“總程序”生物進化歷史的“總檔案”共二百五十四頁基因組(genome)
基因組(genome)是德國遺傳學家H.Winkler在1920年將gene(基因)和chromosome(染色體)兩個詞縮合而創(chuàng)造的一個新詞,意思是指染色體上的全部基因。幾十年來,隨著分子生物學的發(fā)展,其含義擴展為在個體水平(shuǐpíng)代表一個個體所有遺傳性狀的總和,在細胞水平(shuǐpíng)代表一個細胞所有不同染色體(單倍體)的總和,在分子水平(shuǐpíng)代表一個物種所有DNA分子的總和。
共二百五十四頁基因組學(genomics)就是發(fā)展和應用DNA制圖、測序新技術(shù)以及計算機程序,分析生命體(包括人類)全部基因組結(jié)構(gòu)及功能(gōngnéng)的科學。1986年提出,至今20年,已經(jīng)發(fā)展成為遺傳學中最重要的分支學科。對物種的所有基因進行定位、作圖、測序和功能分析共二百五十四頁基因組學的基礎(chǔ)理論研究(yánjiū)基因組學是要揭示下述四種整合體系的相互關(guān)系:基因組作為信息載體
(堿基對、重復序列的整體守恒與局部不平衡的關(guān)系)基因組作為遺傳物質(zhì)的整合體
(基因作為功能和結(jié)構(gòu)單位與遺傳學機制的關(guān)系)基因組作為生物化學分子的整合體
(基因產(chǎn)物作為功能分子與分子、細胞機制的關(guān)系)物種進化的整合體
(物種在地理(dìlǐ)與大氣環(huán)境中的自然選擇)共二百五十四頁
基因組學是一個(yīɡè)大學科“界門綱目科屬種”,地球上現(xiàn)存物種近億,所有生生滅滅的生物,無一例外,都有個基因組。基因組作為信息載體,它所儲存的信息是最基本的生物學信息之一;既是生命本質(zhì)研究的出發(fā)點之一,又是生物信息的歸宿?;蚪M學研究包括對基因產(chǎn)物(轉(zhuǎn)錄子組和蛋白質(zhì)組)的系統(tǒng)生物學研究?;蚨鄳B(tài)性的規(guī)?;芯烤褪腔蚪M多態(tài)性的研究?;蚪M學的研究必然要上升到細胞機制、分子機制和系統(tǒng)生物學的水平(shuǐpíng)?;蚪M的起源與進化和物種的起源與進化一樣是一個新的科學領(lǐng)域?;蚪M信息正在以天文數(shù)字計算,規(guī)?;胤e累,它的深入研究必將形成一個嶄新的學科。共二百五十四頁
基因組學是一門(yīmén)大科學基因組的信息是用來發(fā)現(xiàn)和解釋具有普遍意義的生命現(xiàn)象和它們的變化、內(nèi)在規(guī)律、和相互關(guān)系(guānxì)。基因組的信息含量高?;蚪M學的研究又在于基因組間的比較?;蚪M學的復雜性必然導致多學科的引進和介入(各生物學科、醫(yī)學、藥學、計算機科學、化學、數(shù)學、物理學、電子工程學、考古學等)?;蚪M學研究的手段和技術(shù)已經(jīng)走在生命科學研究的最前沿?;蚪M信息來自于高效率和規(guī)?;a(chǎn)生的實驗數(shù)據(jù)。人類基因組計劃證明了基因組研究的迫切性和可行性。共二百五十四頁基因組與生命(shēngmìng)之謎基因組的產(chǎn)生(chǎnshēng)與進化。基因組DNA組分的變化、GC百分比、嘌呤:嘧啶守恒。遺傳密碼的發(fā)生、發(fā)展和進化。內(nèi)含子(尤其是大于100,000核苷酸的大內(nèi)含子)剪出后的運輸和降解。最小內(nèi)含子的生物學意義。動物基因組與植物基因組在基因分布上的共性和個性。物種衍變過程中基因組水平的變化。基因組大小變化與遺傳、分子、細胞機制的關(guān)系?!癑UNKDNA”的發(fā)生、分類、進化與功能。共二百五十四頁基因組學研究(yánjiū)的最終目標
獲得生物體全部基因組序列鑒定所有基因的功能明確(míngquè)基因之間的相互作用關(guān)系闡明基因組的進化規(guī)律
共二百五十四頁經(jīng)典(jīngdiǎn)遺傳學
在20世紀初,遺傳學剛剛誕生的時候,遺傳學家的工作主要是鑒別感興趣的基因,確定這些基因在染色體上的位置。第一個環(huán)節(jié):尋找自發(fā)突變體,或者利用(lìyòng)物理、化學因素誘發(fā)突變。第二個環(huán)節(jié):通過連鎖分析確定新基因與已知基因的相互關(guān)系,繪制遺傳連鎖圖。共二百五十四頁幾個(jǐɡè)代表物種的基因組大小共二百五十四頁基因組學的分類(fēnlèi)3基因組學(根據(jù)(gēnjù)所研究的生物體種類分類)結(jié)構(gòu)基因組學功能基因組學1基因組學(根據(jù)系統(tǒng)特征分類)2基因組學(根據(jù)與其它學科的關(guān)系分類)基因組繪制和測序基因和基因組組織基因組調(diào)節(jié)網(wǎng)絡結(jié)構(gòu)蛋白質(zhì)結(jié)構(gòu)特征轉(zhuǎn)錄組學蛋白組學代謝組學基礎(chǔ)基因組學應用基因組學生化基因組學遺傳基因組學進化基因組學生理基因組學計算基因組學生態(tài)基因組學工業(yè)基因組學農(nóng)業(yè)基因組學環(huán)境基因組學醫(yī)學基因組學植物基因組學動物基因組學人類基因組學微生物基因組學共二百五十四頁基因組學的研究(yánjiū)內(nèi)容
結(jié)構(gòu)(jiégòu)基因組學功能基因組學蛋白質(zhì)組學共二百五十四頁結(jié)構(gòu)(jiégòu)基因組學(structuralgenomics)
基因定位(dìngwèi)基因組作圖測定核苷酸序列共二百五十四頁功能(gōngnéng)基因組學(functionalgenomics)
又稱后基因組學(postgenomics)
基因的識別、鑒定、克隆基因結(jié)構(gòu)、功能及其相互關(guān)系基因表達調(diào)控(diàokònɡ)的研究共二百五十四頁蛋白質(zhì)組學(proteomics)鑒定(jiàndìng)蛋白質(zhì)的產(chǎn)生過程、結(jié)構(gòu)、功能和相互作用方式共二百五十四頁遺傳學與基因組學的里程碑
圖中所示的螺旋展示了遺傳學和基因組學重要進展的里程碑,從孟德爾遺傳法則的發(fā)現(xiàn)和其在20世紀初被重新發(fā)現(xiàn)[1]開始。DNA被確立是遺傳的物質(zhì)基礎(chǔ)[2]、DNA結(jié)構(gòu)的確定[3]、遺傳代碼的闡明[4]、DNA重組技術(shù)的發(fā)展[5,6]、以及自動化程度日益提高(tígāo)的DNA測序技術(shù)的建立[7-10],為1990年啟動人類基因組計劃(HGP)奠定了基礎(chǔ)共二百五十四頁研究功能(gōngnéng)基因組學的挑戰(zhàn)闡釋基因功能鑒別和表征生命的分子機構(gòu)描繪基因調(diào)節(jié)網(wǎng)絡(wǎngluò)系統(tǒng)水平上而非單個細胞水平上對生物系統(tǒng)的認識計算機上的挑戰(zhàn)多學科協(xié)作共二百五十四頁基因組的進化(jìnhuà)(1)基因組大小的進化包括基因組的含量、基因組的結(jié)構(gòu)(jiégòu)以及基因的數(shù)量等幾個方面。(2)基因組的分子進化DNA序列的進化:基因的不同區(qū)域進化速率不同。內(nèi)含子中堿基對趨異進化速率大于外顯子;編碼序列中同義突變的進化速率大于非同義突變,非同義突變的進化速率最低。假基因的進化速率最高。共二百五十四頁
多基因家族的進化(jìnhuà):通過基因擴增和不均等交換形成多拷貝基因,在通過突變積累、基因重排和自然選擇等因素形成多基因家族或新的基因。如珠蛋白基因家族的進化(jìnhuà)。外顯子混編:來自(láizì)不同基因的多個外顯子相互連接,或基因內(nèi)部的外顯子重復?;蛩睫D(zhuǎn)移:遺傳物質(zhì)從一個物種通過各種方式轉(zhuǎn)移到另一個物種的基因組中。如轉(zhuǎn)化、轉(zhuǎn)導、接合、轉(zhuǎn)染等。共二百五十四頁范圍和一般(yībān)方法結(jié)構(gòu)(jiégòu)基因組學轉(zhuǎn)錄物組學蛋白質(zhì)組學代謝物組學共二百五十四頁基因組學的發(fā)展(fāzhǎn)歷程年里程碑和事件參考文獻1985-1988美國科學院和研究委員會討論、辯論制定人類基因組計劃(HGP)Albers,19981990人類基因組計劃在美國正式開始Burris,19981995第一個自由存活生物,Haemophiusinfluenzae鳥槍法測序完成Fleischmann,19951996芽殖酵母測序完成——第一個真核生物基因組Goffeau,199619981998第一個多細胞生物秀麗線蟲測序完畢微陣列和基因組學一起列入最高十項科學突破C.Elegans,1998新聞編委會,19982000全基因組鳥槍法完成果蠅的全基因組測序Adams,20002000美國前總統(tǒng)克林頓宣布即將完成的HGP是人類描繪最奇妙的圖譜Marshall,20002000第一個模式植物擬南芥全基因組測序完成GenomeIntiative2001人類基因組序列草圖的兩個版本分別在nature和science上發(fā)表Venter,20012002兩個水稻亞種基因組序列草圖完成Yu,2002共二百五十四頁§2
基因組圖譜(túpǔ)的構(gòu)建基因組計劃的主要任務是獲得全基因組序列但是,現(xiàn)在的測序方法每次只能測800~1000bp大量的測序片段要拼接要知道序列在Chr上的位置才能正確拼接基因組計劃的第一個環(huán)節(jié)(huánjié):構(gòu)建基因組圖譜共二百五十四頁基因組圖譜(túpǔ)遺傳(yíchuán)圖譜(geneticmap)物理圖譜(physicalmap)共二百五十四頁遺傳(yíchuán)圖譜(geneticmap)
采用遺傳(yíchuán)分析的方法將基因或其它DNA序列標定在染色體上構(gòu)建連鎖圖。共二百五十四頁遺傳(yíchuán)標記有可以識別的標記,才能確定目標的方位及彼此之間的相對位置。構(gòu)建遺傳圖譜就是尋找基因組不同位置上的特征標記。包括(bāokuò):形態(tài)標記細胞學標記生化標記
DNA分子標記共二百五十四頁多態(tài)性(polymophism)所有的標記都必須具有多態(tài)性!花色:白色、紅色株高:高、矮血型:A、B、O型淀粉:糯、非糯所有多態(tài)性都是基因突變(jīyīntūbiàn)的結(jié)果!共二百五十四頁形態(tài)(xíngtài)標記形態(tài)性狀:株高、顏色、白化癥等又稱表型標記數(shù)量(shùliàng)少很多突變是致死的受環(huán)境、生育期等因素的影響共二百五十四頁
最早建立的果蠅連鎖圖,就是利用控制果蠅眼睛的形狀、顏色,軀體(qūtǐ)的顏色、翅膀的形狀等形態(tài)性狀作為標記,分析它們連鎖關(guān)系及遺傳距離,繪制而成的??刂菩誀畹钠鋵嵤腔颍孕螒B(tài)標記實質(zhì)上就是基因標記。共二百五十四頁果蠅(ɡuǒyínɡ)連鎖圖共二百五十四頁細胞學標記(biāojì)明確顯示遺傳(yíchuán)多態(tài)性的染色體結(jié)構(gòu)特征和數(shù)量特征染色體的核型染色體的帶型染色體的結(jié)構(gòu)變異染色體的數(shù)目變異優(yōu)點:不受環(huán)境影響缺點:數(shù)量少、費力、費時、對生物體的生長發(fā)育不利共二百五十四頁生化(shēnɡhuà)標記
又稱蛋白質(zhì)標記(biāojì)就是利用蛋白質(zhì)的多態(tài)性作為遺傳標記。
如:同工酶、貯藏蛋白優(yōu)點:數(shù)量較多,受環(huán)境影響小缺點:受發(fā)育時間的影響、有組織特異性、只反映基因編碼區(qū)的信息共二百五十四頁DNA分子(fēnzǐ)標記簡稱分子標記以DNA序列的多態(tài)性作為遺傳標記優(yōu)點:不受時間和環(huán)境的限制遍布整個基因組,數(shù)量無限不影響性狀表達自然存在的變異(biànyì)豐富,多態(tài)性好共顯性,能鑒別純合體和雜合體共二百五十四頁限制性片段(piànduàn)長度多態(tài)性
(restrictionfragmentlengthpolymorphism,RFLP)
DNA序列能或不能被某一酶酶切,相當于一對等位基因的差異。
如有兩個DNA分子(一對染色體),一個具有某一種酶的酶切位點,而另一個沒有這個位點,酶切后形成的DNA片段長度(chángdù)就有差異,即多態(tài)性。可將RFLP作為標記,定位在基因組中某一位置上。人類基因組中有105個RFLP位點,每一位點只有兩個等位基因。共二百五十四頁RFLP分析(fēnxī)共二百五十四頁RFLP標記(biāojì)位共顯性標記(biāojì)共二百五十四頁微衛(wèi)星(microsatellite)標記(biāojì)微衛(wèi)星又稱為簡單(jiǎndān)重復序列(simplesequencerepeat,SSR)。這種重復序列的重復單位很短,常常只有2個、3個或4個核苷酸如一條染色體TCTGAGAGAGACGC
另一染色體TCTGAGAGAGAGAGAGAGACGC,就構(gòu)成了多態(tài)性。共二百五十四頁遺傳(yíchuán)圖譜的構(gòu)建方法
理論(lǐlùn)基礎(chǔ):連鎖與交換基本方法:兩點測驗法和三點測驗法共二百五十四頁植物遺傳(yíchuán)圖譜的構(gòu)建
選擇研究材料(親本)構(gòu)建分離群體遺傳標記(biāojì)檢測標記間的連鎖分析共二百五十四頁選擇(xuǎnzé)親本
要求親緣關(guān)系遠,遺傳差異大但又不能相差太大以導致引起子代不育。對備選材料進行多態(tài)(差異)性檢測,綜合(zōnghé)測定結(jié)果,選擇有一定量多態(tài)性的一對或幾對材料作為遺傳作圖親本。共二百五十四頁構(gòu)建(ɡòujiàn)作圖群體
共二百五十四頁遺傳標記(biāojì)的染色體定位
利用遺傳學方法或其它方法將少數(shù)標記錨定在染色體上,作為確定(quèdìng)連鎖群的參照系。常用的方法:單體分析三體分析代換系分析附加系分析共二百五十四頁標記(biāojì)間的連鎖分析利用在兩個親本間有多態(tài)性的標記分析分離(fēnlí)群體中所有個體的基因型根據(jù)連鎖交換的情況,確定標記之間的連鎖關(guān)系和遺傳距離有計算機軟件可以應用共二百五十四頁水稻(shuǐdào)遺傳圖1994年,水稻第一張高密度遺傳圖譜
927個位點,1383個標記
1998年,1157個位點,2275個標記
2000年,3267個標記高密度的遺傳圖譜為基因組測序和遺傳研究(yánjiū)奠定了堅實的基礎(chǔ)。共二百五十四頁人類遺傳圖譜(túpǔ)的構(gòu)建
不可能根據(jù)需要選擇親本,設(shè)計雜交組合,構(gòu)建分離群體!只能檢測現(xiàn)存家庭(jiātíng)連續(xù)幾代成員的基因型家系分析法資料有限、必須借助于統(tǒng)計學方法共二百五十四頁現(xiàn)有(xiànyǒu)的人類遺傳圖譜1~22號染色體
8個家系134個成員
X染色體,12個家系170個成員
5364個SSR標記
2335個位點標記間的平均(píngjūn)距離599kb共二百五十四頁物理圖譜(túpǔ)的構(gòu)建
用分子生物學方法直接檢測DNA標記在染色體上的實際位置(wèizhi)繪制成的圖譜稱為物理圖譜。有遺傳圖譜為什么還要構(gòu)建物理圖譜?
共二百五十四頁遺傳圖譜(túpǔ)的缺陷
分別率有限人類只能研究少數(shù)減數(shù)分裂(jiǎnshùfēnliè)事件,不能獲得大量子代個體測序要求每個標記的間隔小于100kb
實際是599kb共二百五十四頁遺傳(yíchuán)圖譜的缺陷精確性不夠(bùgòu)經(jīng)典遺傳學認為,交換是隨機發(fā)生的基因組中有些區(qū)域是重組熱點倒位、重復等染色體結(jié)構(gòu)變異會限制交換重組共二百五十四頁酵母遺傳圖與物理(wùlǐ)圖比較A遺傳(yíchuán)圖B物理圖共二百五十四頁物理(wùlǐ)作圖的方法1、限制(xiànzhì)酶作圖2、依靠克隆的基因組作圖3、熒光原位雜交4、序列標簽位點作圖共二百五十四頁限制(xiànzhì)酶作圖(restrictionmapping)共二百五十四頁限制(xiànzhì)酶作圖(restrictionmapping)共二百五十四頁熒光(yíngguāng)原位雜交
(fluorescentinsituhybridization,F(xiàn)ISH)共二百五十四頁熒光(yíngguāng)原位雜交
(fluorescentinsituhybridization,F(xiàn)ISH)共二百五十四頁熒光(yíngguāng)原位雜交
(fluorescentinsituhybridization,F(xiàn)ISH)共二百五十四頁熒光(yíngguāng)原位雜交
(fluorescentinsituhybridization,F(xiàn)ISH)共二百五十四頁人類(rénlèi)基因組物理圖1987年,RFLP圖譜(túpǔ),403個標記,10Mb1994年,5800個標記,0.7Mb1996年,17000多個標記,100kb
完全適應全基因組測序的要求共二百五十四頁遺傳圖與物理(wùlǐ)圖的整合有些標記既是遺傳標記,又是物理標記
RFLP標記SSR標記某些基因序列借助這些(zhèxiē)標記可以將遺傳圖和物理圖整合起來共二百五十四頁§3基因組測序共二百五十四頁大規(guī)模基因組測序的幾個(jǐɡè)支撐技術(shù)
Sanger雙脫氧末端(mòduān)終止法
PCR技術(shù)
DNA自動測序儀的發(fā)展生物信息學分析軟硬件設(shè)施共二百五十四頁“雙脫氧末端終止(zhōngzhǐ)”的含義共二百五十四頁
PCR(聚合酶鏈式反應(liànshìfǎnyìng))原理反應所需物質(zhì):DNA模板、引物、DNA聚合(jùhé)酶、dNTP、緩沖液每個循環(huán)包括:變性(90℃)、退火(54
℃)、延伸(72℃)共二百五十四頁大規(guī)?;蚪M測序的
兩種策略逐步(zhúbù)克隆法(ClonebyClone)全基因組霰彈法(WholeGenomeShot-gun)共二百五十四頁………ATGCCGTAGGCCTAGCTAGGCCTAGCTCGGA……………ATGCCGTAGGCCTAGCTCGGA……基因組DNABAC文庫(wénkù)根據(jù)物理圖譜正確(zhèngquè)定位的BAC或contig用于霰彈法測序的候選克隆用于霰彈法測序的亞克隆測序并組裝完整的基因組序列逐步克隆法(ClonebyClone)
全基因組霰彈法(WholeGenomeShot-gun)基因組DNA
霰彈法克隆測序并進行全基因組序列組裝完整的基因組序列共二百五十四頁
兩種大規(guī)?;蚪M測序策略(cèlüè)的比較
項目
策略全基因組霰彈法逐步克隆法
遺傳背景不需要需要(需構(gòu)建精確的物理圖譜)速度快慢費用低高計算機性能高(以全基因組為單位進行拼接)低(以BAC為單位進行拼接)適用范圍工作框架圖精細圖代表測序物種果蠅、水稻人、線蟲共二百五十四頁BACbyBACWholeGenomeShotgun…thesequencingofthehumangenomeislikelytobetheonlylargesequencingprojectcarriedtocompletionbythemethodsdescribedinthisissue.MaynardV.Olson,Themaps:Clonebyclonebyclone,Nature409,816-818(2001)共二百五十四頁“WorkingDraft”(90%;4X)FinishedGenome(99.99%;8X)Gap1Gap2Chromosome工作(gōngzuò)草稿(框架圖)與完成圖共二百五十四頁BACbyBAC
共二百五十四頁ThesequenceofthehumangenomeC.Venteretal.Science16Feb.291:1304–1351,2001共二百五十四頁人類基因組計劃研究(yánjiū)的主要成果和進展表現(xiàn)在這“四張圖”上
遺傳圖譜
又稱為連鎖(liánsuǒ)圖譜(linkagemap),指基因或DNA標志在染色體上的相對位置與遺傳距離物理圖譜
以定位的DNA標記序列如STS作為路標,以DNA實際長度即bp、kb、Mb為圖距的基因組圖譜。轉(zhuǎn)錄圖譜
利用EST(expressedsequencetags
表達序列標簽)作為標記所構(gòu)建的分子遺傳圖譜序列圖譜
通過基因組測序得到的,以A、T、G、C為標記單位的基因組DNA序列
共二百五十四頁逐步(zhúbù)克隆法(ClonebyClone)物理圖譜(túpǔ)的構(gòu)建大片段克隆的篩選霰彈法測序與“工作框架圖”的構(gòu)建序列的全組裝與“完成圖”構(gòu)建共二百五十四頁物理圖譜(túpǔ)的制作
共二百五十四頁物理圖譜的制作——序列(xùliè)標簽位點(STS)作圖
物理圖譜是以特異的DNA序列為標志(biāozhì)所展示的染色體圖。標志(biāozhì)之間的距離或圖距以物理距離如堿基對(basepair;bp,Kb,Mb)表示。最精細的物理圖是核苷酸順序圖,最粗略的物理圖是染色體組型圖。
STS圖譜是最基本和最為有用的染色體物理圖譜之一,STS(SequenceTaggedSite)本身是隨機地從人類基因組上選擇出來的長度在200~300bp左右的特異性短序列(每個STS在基因組中是唯一的,STS圖譜就是以STS為路標(平均每100Kb一個),將DNA克隆片段有序地定位到基因組上。STS的來源隨機基因組序列表達基因序列,如EST遺傳標記序列,如微衛(wèi)星標記有關(guān)STS的信息可在基因組數(shù)據(jù)庫GDB中找到http://gdbwww.gdb.org共二百五十四頁物理圖譜構(gòu)建的步驟確定各STS序列及其在基因組中的位置大插入片段基因組文庫的構(gòu)建(BAC文庫)
以特定STS為標記(biāojì)篩選并定位克隆含有STS的克隆在基因組中排序基因組數(shù)據(jù)庫(GDB)中至少含有24568個STS路標(lùbiāo)信息
共二百五十四頁關(guān)于文庫作為(zuòwéi)載體的基本要求
能在宿主細胞中進行獨立的復制具有多克隆位點,可插入外源
DNA片段有合適(héshì)的篩選標記,如抗藥性大小合適,易于分離純化拷貝數(shù)多
文庫的概念
含有某種生物體全部基因的隨機片段的重組DNA克隆群體載體:能攜帶外源DNA進入宿主細胞的工具,常用的載體有質(zhì)粒載體、噬菌體載體、細菌人工染色體等宿主:能容納外源DNA片段的生物體,常用的有大腸桿菌、酵母等共二百五十四頁BAC文庫(wénkù)的構(gòu)建NotI、SacI脈沖場凝膠電泳得200Kb左右(zuǒyòu)的大片段DNA
純化后與載體連接
電轉(zhuǎn)化,將連接產(chǎn)物導入大腸桿菌感受態(tài)細胞插有外源DNA片段的BAC載體在含有氯霉素的固體培養(yǎng)基中培養(yǎng)每一個菌落為帶有相同外源DNA片段的單克隆共二百五十四頁BAC克隆(kèlónɡ)的篩選“STS-PCR反應(fǎnyìng)池”方案篩選種子克隆特定的STS標記
相互間具有重疊片段的BAC克隆根據(jù)STS信息組裝成contig,并定位于基因組上Contig每一個菌落為帶有相同外源DNA片段的單克隆共二百五十四頁共二百五十四頁Regionalmapping共二百五十四頁Regionalmapping共二百五十四頁Minimaltilingpathselectedforsequencing.Regionalmapping共二百五十四頁BeijingMap共二百五十四頁共二百五十四頁共48個每組8個每8個96孔板組成(zǔchénɡ)1個superpool,384個96孔板組成48個superpools
48superpools共二百五十四頁
Columnpools
Rowpools
123456789101112第八(dìbā)板第二(dìèr)板Platepools第一板
platepools,rowpools,columnpools的構(gòu)成
共二百五十四頁“STS-PCR反應(fǎnyìng)池”方案(PoolingProtocol)
1234567891011
12超級(chāojí)池(8個96孔板,共768個克隆)板池(96個克?。┬谐兀?2個克?。┝谐兀?個克?。┐蟠鬁p少篩選的工作量,降低成本,所得篩選結(jié)果準確可靠
28
VS
768共二百五十四頁sheetofsuperpools,platepools,rowpools,columnpools
共二百五十四頁
一
BACScreening前48個樣品(yàngpǐn)為引物OGG1.51對superpool(sp)的篩選結(jié)果后48個樣品為引物OGG1.52對superpool(sp)的篩選結(jié)果
共二百五十四頁引物OGG1.52對應sp#27,34,45的plate,row,columnpools的篩選(shāixuǎn)結(jié)果共二百五十四頁BACclone確定
(+為陽性(yángxìng)克隆)
共二百五十四頁引物OGG1.52的Colony-PCR
共二百五十四頁延伸克隆的篩選
STS的密度尚未達到繪制高精度物理圖譜的要求,且在基因組中的分布不均勻,造成(zàochénɡ)很多區(qū)域沒有陽性克隆覆蓋,形成空洞。因此需用指紋圖譜(FPC法)或末端序列(WalkingbyEndSequence)步移等手段對種子克隆進行延伸,形成連續(xù)克隆群。利用延伸方法篩選得到的克隆稱為延伸克隆。
Contig1Contig2重疊(chóngdié)序列重疊序列延伸引物篩選到的延伸克隆共二百五十四頁>20kb~300bpMolecularweightmarkerevery5thlaneBACclones在96深孔板中培養(yǎng)(péiyǎng)-HindIII完全酶切-1%瓊脂糖凝膠電泳
指紋圖譜法
(WalkingbyFingerprintingdatabase)
挑取靠近空洞的種子克隆,酶切構(gòu)建其指紋圖譜,在FPC數(shù)據(jù)庫中進行比對,搜索含有此克隆的重疊克隆群信息(xìnxī),從中確定覆蓋空洞區(qū)域的克隆,達到延伸目的。共二百五十四頁HindIII完全(wánquán)酶切HindIII完全(wánquán)酶切FPC數(shù)據(jù)庫中比對CloneACloneBCloneCCAB共二百五十四頁contig搭建(dājiàn)中克隆的錯位
共二百五十四頁末端序列步行法(WalkingbyEndSequence)
挑取靠近空洞的種子克隆進行末端測序,然后在基因組數(shù)據(jù)庫中進行比對,確定專一性的序列片段作為新的STS路標。最后設(shè)計新路標的PCR引物,按照STS—PCR“反應池”方案篩選(shāixuǎn)新的克隆,達到延伸的目的。克隆350A18序列輸入endsequencedatabase的查詢(cháxún)結(jié)果共二百五十四頁四、CloneIdentification
1、STS-PCR
2、BACendsequencing
3、Fingerprinting
4、FISH
共二百五十四頁CK2CK1CK2CK113f06267l16481o07250a15204c23340j13對15個克隆進行HindIII酶切后電泳(diànyǒnɡ)結(jié)果
共二百五十四頁共二百五十四頁“工作(gōngzuò)框架圖”繪制根據(jù)序列與STSdatabase進行blastn比較結(jié)果,將克隆定位末端序的比較,判定(pàndìng)延伸在contig外的一端序列。并可及時進行walking,篩選新的克隆
共二百五十四頁霰彈(xiàndàn)法測序組裝與Finishing共二百五十四頁工作(gōngzuò)流程圖
共二百五十四頁ShotgunSequencingI:RANDOMPHASEBacClone:100-200kbShearedDNA:1.0-2.0kbSequencingTemplates:RandomReads共二百五十四頁ShotgunSequencingII:ASSEMBLYConsensusSequenceGap
LowBaseQualitySingleStrandedRegionMis-Assembly(Inverted)共二百五十四頁ConsensusSequenceGap
LowBaseQualitySingleStrandedRegionMis-Assembly(Inverted)ShotgunSequencingIII:FINISHING共二百五十四頁ConsensusSequenceGap
SingleStrandedRegionMis-Assembly(Inverted)ShotgunSequencingIII:FINISHING共二百五十四頁ConsensusSequenceGap
Mis-Assembly(Inverted)ShotgunSequencingIII:FINISHING共二百五十四頁ConsensusMis-Assembly(Inverted)ShotgunSequencingIII:FINISHING共二百五十四頁ShotgunSequencingIII:FINISHINGHighAccuracySequence:<1error/10,000bases共二百五十四頁Consed軟件顯示(xiǎnshì)序列組裝結(jié)果界面
1、Filling“intraclonegaps”共二百五十四頁BAC-----453F3’sfinishing>>Sp6<<T7?First4primers1234Allthecontigswalkedhundreds’bpstowardthegaps.453F3’s2600reads12contigsOverlappingBAC-454F24’s200reads+>>Sp6<<T71324abcSecond3primers
1200bp’sAT-rich,(CATATATA)nrepeat.Finally,filledbyusingETsequencingKit.
1240bp’sGC-rich,GC-contentis69.03%;theBAC’sis39.98%.WeuseddGTPKitfillingit.>>Sp6<<T7Completedsequence共二百五十四頁
SequencedcloneBACselectedbyend-sequence113L10324K11173F11101A4167P17586C2116K5572B22544N5R-155E142006P232306M15R-149E1560K?Gapfillingbyendsequences2、Filling“interclonegaps”共二百五十四頁
TheactualandpredictedfingerprintofR-260J13digestedwithHindIII
Lane1:marker,Lane2:R-260J13digestedwithHindIII,3:thepredicted
共二百五十四頁克隆211B19組裝(zǔzhuānɡ)后的序列的錯誤率為零
共二百五十四頁WholeGenomeShotgun
共二百五十四頁Thisbacteriumhasacirculargenomestructurewith2,689,445basepairs,thesecondlargestoneofthermophilesdecodedcompletelytodate.CircularrepresentationofthegenomeofT.tengcongensis
共二百五十四頁Whatisunderheavenisforall.
SunYat-sen,thefatherofmodernChina
天下為公(tiānxiàwéigōng)
/riceDDBJ/EMBL/GenBank:AAAA01000000共二百五十四頁國際一流(yīliú)測序生產(chǎn)線7萬克隆,3000萬堿基/天高產(chǎn)出、低成本:$/bp
¥/bp美分/bp分/bp基因組學:數(shù)據(jù)導向(dǎoxiànɡ)的大科學有數(shù)據(jù)才是硬道理世上無難事只要肯登攀共二百五十四頁Contigs:127,550
(N50=6,688bp)Scaffolds:102,444(N50=11,764bp)Quality:546bpatQ20共二百五十四頁DeNovoSequencingtheGenomeinBIGHuSongnianBeijingInstituteofGenomics,ChineseAcademyofSciencesNextGenerationSequencing(NGS)Technology共二百五十四頁Secondgenerationsequencers4541Solexa3SOLiD5DenovosequencingRNA-seq,Re-sequencingChIP-seq,Meth-seqMetagenomicsDenovosequencingRNA-seqRe-sequencingChIP-seqRNA-seq“known”GenomeNovelgenome(s)Bothtypes共二百五十四頁1x4545xSOLiD4.02x5500xl3xSOLEXA2xHiseq20003x3730xl1xsequenom1000CPUcores800TBStorage數(shù)據(jù)中心完善的試驗與測序體系和流程強有力的計算、存儲及數(shù)據(jù)庫支持體系成熟的生物信息數(shù)據(jù)處理和分析流程2025/1/5共二百五十四頁基因(jīyīn)測序技術(shù)與基因(jīyīn)組測序第一代測序技術(shù)化學降解法雙脫氧鏈終止法熒光自動測序技術(shù)(雙脫氧鏈終止法)雜交(zájiāo)測序技術(shù)第二代DNA測序技術(shù)454測序技術(shù)Solexa測序技術(shù)SOLiD測序技術(shù)第三代DNA測序技術(shù)單分子測序共二百五十四頁基因組測序策略(cèlüè)有了高密度的基因組圖譜,就可以開始全基因組測序了測序的技術(shù)飛速發(fā)展,現(xiàn)在可以全自動化測序的策略(cèlüè)有兩個:鳥槍法克隆重疊群法共二百五十四頁鳥槍法(shotgunsequencing)共二百五十四頁鳥槍法的優(yōu)缺點優(yōu)點:不需要高密度的圖譜速度快、簡單、成本低缺點:拼接組裝困難,尤其在重復(chóngfù)序列多的區(qū)域主要用于重復序列少、相對簡單的原核生物基因組共二百五十四頁克隆(kèlónɡ)重疊群法(clonecontig)
將基因組DNA切割長度為0.1Mb-1Mb的大片段,克隆到Y(jié)AC或BAC載體(zàitǐ)上然后再進行亞克隆,分別測定單個亞克隆的序列再裝配、連接成連續(xù)的DNA分子。這是一種自上而下(uptodown)的測序策略
clone-by-clonemethod共二百五十四頁基因組測序
快速有效的DNA測序方法于20世紀70年代中期建立。兩種不同的序方法幾乎同時發(fā)表:
鏈終止法(chainterminationmethod)(Sangeretal,1977):單鏈DNA分子的序列由互補(hùbǔ)的多核苷酸的酶促合成來決定,互補(hùbǔ)鏈在特定的核苷酸位置終止。
化學降解法(chemicaldegradationmethod)(MaxamandGilbert,1977):雙鏈DNA分子用化學物質(zhì)處理后,在特定核苷酸位置被切開,從而確定DNA分子的序列。今年6月30日,基因組所新一代測序技術(shù)——SOLiDTM系統(tǒng)基因分析儀投入使用。共二百五十四頁鏈終止法測序(thechainterminationmethod)
基本原理:
通過合成與單鏈DNA互補的多核苷酸鏈,由于合成的互補鏈可在不同位置隨機終止反應,產(chǎn)生只差一個(yīɡè)核苷酸的DNA分子,從而來讀取待測DNA分子的順序。共二百五十四頁技術(shù)(jìshù)路線與要求制備(zhìbèi)單鏈模板
↓將單鏈模板與一小段引物退火
↓加入DNA多聚酶
4種脫氧核苷酸分別加入少量4種雙脫氧核苷酸↓將4種反應產(chǎn)物分別在4條泳道電泳
↓根據(jù)4個堿基在4條泳道的終止位置讀出基因序列
A克隆于質(zhì)粒中DNA→用堿或熱變性BM13克隆單鏈DNAC噬粒克隆DNADPCR產(chǎn)生單鏈DNAA高酶活性B無5’→3′外切酶活性C無3′→5′外切酶活性ddATP/ddCTP/ddGTP/ddTTP的3’碳原子連接的是氫原子,不是羥基共二百五十四頁共二百五十四頁共二百五十四頁化學降解法測序基本原理:
在選定的核苷酸堿基中引入化學集團,再用化合物處理,使DNA分子(fēnzǐ)在被修飾的位置降解.共二百五十四頁技術(shù)(jìshù)路線:
將雙鏈DNA樣品變?yōu)閱捂湣總€單鏈的同一方向末端都用放射性同位素標記,以便顯示DNA條帶↓分別用不同方法處理,獲得只差一個(yīɡè)核苷酸的降解DNA群體↓電泳,讀取DNA的核苷酸順序共二百五十四頁化學法測序?qū)嵗?shílì)哌啶共二百五十四頁第二代測序技術(shù)(jìshù)454測序技術(shù)(jìshù)Solexa測序技術(shù)SOLiDTM測序技術(shù)共二百五十四頁454測序技術(shù)(jìshù)
1文庫準備將基因組DNA打碎成300-800bp長的片段(若是snRNA或PCR產(chǎn)物可以直接進入下一步),在單鏈DNA的3′2端和5′2端分別連上不同的接頭。2連接帶有接頭的單鏈DNA被固定在DNA捕獲磁珠上。每一個磁珠攜帶一個單鏈DNA片段。隨后擴增試劑將磁珠乳化(rǔhuà),形成油包水的混合物,這樣就形成了許多只包含一個磁珠和一個獨特片段的微反應器。3擴增每個獨特的片段在自己的微反應器里進行獨立的擴增(乳液PCR,emulsionPCR),從而排除了其它序列的競爭。整個DNA片段文庫的擴增平行進行。對于每一個片段而言,擴增產(chǎn)生幾百萬個相同的拷貝。乳液PCR終止后,擴增的片段仍然結(jié)合在磁珠上。4測序攜帶DNA的捕獲磁珠被放入PTP板中進行測序。PTP孔的直徑(29μm)只能容納一個磁珠(20μm)。放置在4個單獨的試劑瓶里的4種堿基,依照T、A、C、G的順序依次循環(huán)進入PTP板,每次只進入一個堿基。如果發(fā)生堿基配對,就會釋放一個焦磷酸。這個焦磷酸在ATP硫酸化酶和熒光素酶的作用下,釋放出光信號,并實時地被儀器配置的高靈敏度CCD捕獲到。有一個堿基和測序模板進行配對,就會捕獲到一分子的光信號;由此一一對應,就可以準確、快速地確定待測模板的堿基序列[27]。共二百五十四頁Solexa測序技術(shù)(jìshù)
1GenomeAnalyzer技術(shù)的基本原理是將基因組DNA打碎成約100-200個堿基的小片段,在片段的兩個末端加上接頭(adapter)。2將DNA片段變成單鏈后通過接頭與芯片表面的引物堿基互補而使一端被固定在芯片上。另外一端隨機和附近的另外一個引物互補,也被固定住,形成橋狀結(jié)構(gòu)。3通過30輪擴增反應,每個單分子被擴增大約1000倍,成為單克隆的DNA簇,隨后將DNA簇線性化。在下一步合成反應中,加入改造過的DNA聚合酶和帶有4種熒光標記的dNTP。在DNA合成時,每一個核苷酸加到引物末端時都會釋放出焦磷酸鹽,激發(fā)生物發(fā)光蛋白發(fā)出熒光。4用激光掃描反應板表面,在讀取每條模板序列第一輪反應所聚合上去的核苷酸種類后,將這些熒光基團化學切割,恢復3′端黏性,隨后添加(tiānjiā)第二個核苷酸。如此重復,直到每條模板序列都完全被聚合為雙鏈。這樣,統(tǒng)計每輪收集到的熒光信號結(jié)果,就可以得知每個模板DNA片段的序列[28]。共二百五十四頁Solexa測序?qū)嶒?shíyàn)流程圖
共二百五十四頁--SOLiDTM系統(tǒng)(xìtǒng)基因分析儀
該技術(shù)以用四色熒光標記寡核苷酸進行連續(xù)的連接反應為基礎(chǔ),能夠?qū)慰截悢U增DNA片段進行大規(guī)模高通量并行測序。這項技術(shù)使用末端(mòduān)配對分析和雙堿基編碼,在對復雜基因組進行測序研究時其準確度將大大高于其它新一代測序技術(shù)。共二百五十四頁SOLiDTM測序技術(shù)(jìshù)1文庫準備SOLiD系統(tǒng)能支持兩種測序模板:片段文庫(fragmentlibrary)或配對末端文庫(mate2pairedlibrary)。片段文庫就是將基因組DNA打斷,兩頭加上接頭,制成文庫。該文庫適用于轉(zhuǎn)錄組測序、RNA定量、miRNA研究、重測序、3′,5′2RACE、甲基化分析及ChIP測序等。配對末端文庫是將基因組DNA打斷后,與中間接頭連接,環(huán)化,然后用EcoP15酶切,使中間接頭兩端各有27bp的堿基,最后加上兩端的接頭,形成文庫。2擴增SOLiD用的是與454技術(shù)類似的乳液PCR對要測序的片段進行擴增。在微反應器中加入測序模板、PCR反應元件、微珠和引物,進行乳液PCR(emulsionPCR)。PCR反應結(jié)束后,磁珠表面就固定有拷貝數(shù)目巨大的同一DNA模板的擴增產(chǎn)物。3微珠與玻片連接乳液PCR完成之后,變性模板,富集帶有延伸模板的微珠,微珠上的模板經(jīng)過3′修飾,可以與玻片共價結(jié)合。SOLiD系統(tǒng)最大的優(yōu)點就是每張玻片能容納更高密度的微珠,在同一系統(tǒng)中輕松實現(xiàn)更高的通量。含有DNA模板的磁珠共價結(jié)合在SOLiD玻片表面,SOLiD測序反應就在SOLiD玻片表面進行。每個磁珠經(jīng)SOLiD測序后得到一條序列。4連接測序SOLiD連接反應的底物是8堿基單鏈熒光探針混合物。探針的5′端用4種顏色的熒光標記,探針3′端第1、2位堿基是ATCG4種堿基中的任何兩種堿基組成的堿基對,共16種堿基對,因此每種顏色對應著4種堿基對。3-5位是隨機的3個堿基。6-8位是可以和任何堿基配對的特殊堿基。單向SOLiD測序包括5輪測序反應,每輪測序反應含有多次連接反應,得到原始顏色序列。SOLiD序列分析軟件根據(jù)“雙堿基編碼矩陣”把堿基序列轉(zhuǎn)換成顏色編碼序列,然后與SOLiD原始顏色序列進行比較。由于雙堿基編碼規(guī)則中一種顏色對應4種堿基對,前面堿基對的第二個堿基是后面堿基對的第一個堿基,所以一個錯誤顏色編碼就會引起連鎖(liánsuǒ)的解碼錯誤,改變錯誤顏色編碼之后的所有堿基。SOLiD序列分析軟件可以對測序錯誤進行自動校正,最后“解碼”成原始序列。因為SOLiD系統(tǒng)采用了雙堿基編碼技術(shù),在測序過程中對每個堿基判讀兩遍,從而減少原始數(shù)據(jù)錯誤,提供內(nèi)在的校對功能,得到的原始堿基數(shù)據(jù)的準確度大于99.94%,而在15X覆蓋率時的準確度可以達到99.999%,是目前新一代基因分析技術(shù)中準確度最高的[29,30]。超高通量是共二百五十四頁
基因組所引進SOLiDTM系統(tǒng),將大大推進基因組測序和分析的能力。該系統(tǒng)每輪運行可以產(chǎn)生超過30億堿基(相當于一個人類基因組全序列)的可定位數(shù)據(jù)??蓪Χ喾N菌株進行極高覆蓋度的測序分析;能夠?qū)Πㄌ厥饧膊』蛘咚幬锉硇偷仍趦?nèi)的完整基因進行精確的序列分析;也能用于高通量的基因表達研究,而其成本和時間消耗大大低于傳統(tǒng)測序技術(shù)。SOLiDTM系統(tǒng)還能夠為染色質(zhì)免疫共沉淀研究提供一種全新的高特異性和高準確度的方法;其高敏感度使SOLiDTM系統(tǒng)既能對常規(guī)基因芯片上可檢測的基因表達譜進行分析,又可以對以前必須通過實時PCR的方法才能看到的基因進行檢測。
基因組所引進SOLiDTM系統(tǒng),對于同中科院其它兄弟院所進行廣泛的交流與合作提供更加有力的支撐(zhīchēng)作用,特別是在開展靶基因重測序研究、基因表達分析、MicroRNA(非編碼小分子RNA)的發(fā)現(xiàn)、染色質(zhì)免疫共沉淀研究以及其它物種全基因組序列測定等相關(guān)研究方面給予強大的支持。共二百五十四頁共二百五十四頁第二代測序技術(shù)(jìshù)之比較共二百五十四頁第三代測序技術(shù)(jìshù)“采用了高密度DNA(玻璃板)納米芯片技術(shù),在芯片上嵌入DNA納米球,然后用非連續(xù)、非連鎖聯(lián)合探針錨定連接(cPAL)技術(shù)來讀取序列,兩項技術(shù)的應用減少了試劑的消耗和成像的時間”。該系統(tǒng)整合了文庫、陣列、測序分析、儀器以及軟件上的技術(shù)進步。與目前流行的第二代測序技術(shù)相比,新方法能在消耗更少試劑的前提下獲得更多的數(shù)據(jù)。每臺機器能獲得1000Gb的數(shù)據(jù),比目前的測序技術(shù)提高了一個(yīɡè)數(shù)量級,也降低了整體的成本。共二百五十四頁第三代測序方法(fāngfǎ)1核酸外切(wàiqiē)酶測序法2合成測序法3納米孔測序法4透射電鏡測序技術(shù)共二百五十四頁核酸(hésuān)外切酶測序法共二百五十四頁合成(héchéng)測序法真實單分子測序法(tSMS)能量(néngliàng)共振轉(zhuǎn)移測序法(FRET)SMRT測序法(SMRT)共二百五十四頁合成(héchéng)測序法-tSMS共二百五十四頁合成(héchéng)測序法-FRET能量共振(gòngzhèn)轉(zhuǎn)移共二百五十四頁合成(héchéng)測序法-SMRT共二百五十四頁納米(nàmǐ)孔測序技術(shù)雜交輔助(fǔzhù)的納米孔測序法(HANS)寡聚物輔助的納米孔測序法共二百五十四頁透射電鏡測序技術(shù)(jìshù)
以單鏈線性DNA為模板,以三種重元素標記(biāojì),一種不標記(biāojì)的脫氧核苷酸為原料,合成其互補鏈,經(jīng)透射電鏡(TEM)檢測,則可見重元素標記,其互補鏈則可由點的大小和強度被分辨出來共二百五十四頁第二三代測序技術(shù)(jìshù)比較共二百五十四頁測序平臺SOLiDSolexaGA454DNAFragment2-5ug2-5ug2-5ugPair-end2-5ug2-5ugMate-pair5-100ug5-100ug5-100ugRNA轉(zhuǎn)錄組10-20ug10ug10ugSmallRNA10-15ug10-15ugMicroRNA40-50ug40-50ug建庫時間1-2周1-2周1-2天上機時間單向6天雙向12天單向5天雙向10天10小時共二百五十四頁SequencingGlossaryReads.Acollectionofclonesthatover-samplethetargetgenome.Pair-endreads.Sequencereadsderivedfrombothendsofasequencing-libraryclone.Mate-pairreads.Sequencereadsderivedfrombothendsofamate-pairlibraryclonewhichinsertsizeisusually>1kb.Insertsize.Thesizeoftheclone-insertfromwhichaclone-endpairistaken.Contig.
Theresultofjoininganoverlappingcollectionofsequencereads.Scaffold.
Theresultofconnectingnon-overlappingcontigsbyusingpair-endreads.N50size.Asappliedtocontigsorscaffolds,thatsizeabovewhich50%oftheassembledsequencecanbefound.共二百五十四頁GenomeassemblystrategyContigassemblyScafffoldingInternalgapclosing/2010/11/4/R41共二百五十四頁RecentwholegenomesequencingprojectsTable.BasicinformationofRrecentlysequencedgenomes.OrganismGenomesizestrategyCoverageContigScafffolds#N50MaxTotal#N50MaxTotalHuman3.0GbSolexa45x2.76M1.5Kb18.8Kb2.18GbNRNRNRNRApple742.3MbSangr+4544.4x+12.5x122,14616,171NR603.9Mb1,629102KbNR598.3Castor320MbSanger4.59x54,00021.1kb190kb324Mb25,828496.5kb4.7Mb350.6MbGrapevine500MbSangr+4547x+4.2x58,61118.2Kb238kb531Mb2,0931.33Mb7.8Mb421MbPanda2.4GbSolexa74x200,60436,728434,6352.25Gb81,4961.22Mb6.05Mb2.30GbStraberry220Mb454+solexa+solid24.5x+6.4x+6.4x16,48728,072215,349202Mb3,2631.44Mb4.1Mb214MbCacoo430Mb454+sanger+solexa16.7x+44x25,91219.8kb190Kb291.44,792473.8Kb3415Kb326.9MbTomato900Mb454+sanger+solexa+solid31x+3.6x+82x+140x110,87255.7kbNR763Mb3,7614.45MbNR782MbPotato840Mb454+solexa+solid11x+106x+0.2x111,18731KbNR683Mb66,301387KbNR727Mb共二百五十四頁共二百五十四頁
FlowchartoftheWGSdenovoassemblyGenomicDNADNAfragmentation,constructfragmentedlibrariesGeneratesequencingreadsusing454technologySequencingerrorcorrectionOutputcontigsFillinintra-scaffoldgapsandgetthefinalscaffoldsGenomicDNADNAfragmentation,constructpaired-endlibrarieswithvariantinsertsizesGeneratesequencingreadsusingIlluminaGAtechnologySequencingpre-processOutputcontigsandminiscaffoldsSolexapart454partHybridassemblyandscffolding共二百五十四頁
454readsprocessRawreadsKmerevaluationQ20,removeadaptor,trimSequencingpre-processNewblerassemblyAssembledreadsUnassembledreadsUnigenecoverageKmerevaluationSolexamappingNr/NtblastContigstatusAssemblyHybridscaffolding共二百五十四頁
SolexareadsprocessRawreadsKmerevaluationSequencingpre-processSoapassemblyAssembledreadsUnassembledreadsUnigenecoverageKmerevaluationSolexamappingNr/NtblastContigstatusAssemblyMappingto454contigHybridscaffoldingCov/Comp共二百五十四頁longreadsassemblycontigsshortreadsA+C–B–scaffoldingA+B–C–scaffoldsFixgapHybridassembly共二百五十四頁ESTUnigeneScafAScafCScafBScafDNewScafABCDESTbasedAssemblyinshortreadsofNGS:ConstructeBIGerScaffording共二百五十四頁Rawsequencingreadspre-processingISignificanceandpurposeSequencinglibraryqualitycontrolSequencingbiasanalysisInheritedprosperitiesoncertainsecondgenerationsequencerGenomesequencingblackholeeffectTranscriptomesamplingandquantificationbiasReadyformappingReadyfordenovoassembly共二百五十四頁Rawsequencingreadspre-processingIISequencingreadsnumbersDuplicatesdetection,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二人聯(lián)營合同協(xié)議書范本
- 江川縣2025年數(shù)學五年級第二學期期末經(jīng)典試題含答案
- 漳州衛(wèi)生職業(yè)學院《合唱》2023-2024學年第一學期期末試卷
- 江西省吉安八中學2025屆初三下第二次測試(數(shù)學試題理)試題含解析
- 餐飲業(yè)工作合同
- 南京中醫(yī)藥大學翰林學院《論文寫作與學術(shù)規(guī)范》2023-2024學年第一學期期末試卷
- 西安交通大學城市學院《體育舞蹈I》2023-2024學年第一學期期末試卷
- 山東省濰坊市市級名校2025年中考英語試題命題比賽模擬試卷(24)含答案
- 潼關(guān)縣2025屆三年級數(shù)學第二學期期末質(zhì)量跟蹤監(jiān)視試題含解析
- 山東女子學院《醫(yī)護職業(yè)暴露及安全防護》2023-2024學年第二學期期末試卷
- 2024年甘肅白銀希望職業(yè)技術(shù)學院招聘筆試真題
- 中小學五一節(jié)前安全教育班會課件
- 電銷主管管理培訓
- 2024-2025學年人教版生物學八年級下冊期中復習練習題(含答案)
- 球機施工方案
- 2025年安全員之B證(項目負責人)通關(guān)題庫(附答案)
- 危險品駕駛員聘用合同二零二五年
- 貴州國企招聘2025遵義市公共交通(集團)有限責任公司招聘70人筆試參考題庫附帶答案詳解
- 企業(yè)文化調(diào)研方案
- GB/T 45440-2025電子商務家政家政服務人員能力信息描述
- 家庭教育:身教重于言傳
評論
0/150
提交評論