下一代測(cè)序技術(shù)_技術(shù)回顧與展望_第1頁(yè)
下一代測(cè)序技術(shù)_技術(shù)回顧與展望_第2頁(yè)
下一代測(cè)序技術(shù)_技術(shù)回顧與展望_第3頁(yè)
下一代測(cè)序技術(shù)_技術(shù)回顧與展望_第4頁(yè)
下一代測(cè)序技術(shù)_技術(shù)回顧與展望_第5頁(yè)
已閱讀5頁(yè),還剩34頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、中國(guó)科學(xué): 生命科學(xué)2010年 第40卷 第1期: 23 37 SCIENTIA SINICA Vitae 英文版見(jiàn): ZHOU X G, REN L F Ren, LI Y T, et al. The next-generation sequencing technology: A technology review and future perspective. Sci China Life Sci, 2010,53, doi: 10.1007/s11427-010-0023-6中國(guó)科學(xué)雜志社SCIENCE CHINA PRESS評(píng) 述下一代測(cè)序技術(shù): 技術(shù)回顧與展望周曉光*, 任魯風(fēng),

2、李運(yùn)濤, 張猛, 俞育德, 于軍*中國(guó)科學(xué)院科研裝備研制項(xiàng)目(批準(zhǔn)號(hào): YZ200823資助摘要 在過(guò)去的30年中, 作為最重要的生物醫(yī)學(xué)研究手段之一, DNA測(cè)序技術(shù)的數(shù)據(jù)產(chǎn)出能力呈指數(shù)增長(zhǎng), 而且這一技術(shù)本身也演變成為一個(gè)面向工程學(xué)和物理學(xué)的新技術(shù)領(lǐng)域. 本文分析了下一代測(cè)序儀的技術(shù)特點(diǎn), 并對(duì)其未來(lái)的發(fā)展以及應(yīng)用進(jìn)行了前瞻性的展望. 預(yù)期在剛剛出現(xiàn)的技術(shù)中, 有些技術(shù)假以時(shí)日能夠發(fā)展成熟, 實(shí)現(xiàn)1000美元基因組和100美元基因組的目標(biāo). 同時(shí)建議中國(guó)科學(xué)家在這場(chǎng)對(duì)科學(xué)研究以及社會(huì)醫(yī)療保健體系都將產(chǎn)生深遠(yuǎn)影響的運(yùn)動(dòng)中發(fā)揮積極的作用.關(guān)鍵詞 基因組學(xué) DNA 測(cè)序下一代測(cè)序技術(shù)測(cè)序儀DNA

3、 測(cè)序技術(shù)自發(fā)明以來(lái)就一直在推動(dòng)分子 生物學(xué)發(fā)展方面起著至關(guān)重要的作用1. 從早期Frederick Sanger的手工測(cè)序, 以及基于Sanger 法開(kāi)發(fā)的第1代自動(dòng)化測(cè)序儀, 到目前的下一代測(cè)序平臺(tái), 這一領(lǐng)域已經(jīng)發(fā)生了巨大的變化2. 有人甚至將基因組測(cè)序技術(shù)的發(fā)展與半導(dǎo)體技術(shù)的發(fā)展相提并論, 這也不無(wú)道理3在過(guò)去的數(shù)十年中, 每經(jīng)過(guò)幾年, 測(cè)序速度就呈指數(shù)增長(zhǎng), 與半導(dǎo)體工業(yè)發(fā)展的摩爾定律(Moores law非常相似4. 這種高速的發(fā)展, 如圖1所示, 從根本上改變了人們研究所有生命藍(lán)圖的方式. 并且推動(dòng)了基因組學(xué)及其分支乃至其他密切相關(guān)學(xué)科的創(chuàng)立與發(fā)展, 諸如比較基因組學(xué)、生物信息學(xué)

4、、系統(tǒng)生物學(xué)以及合成生物學(xué). 某種程度上, DNA 測(cè)序技術(shù)的進(jìn)展已經(jīng)使生命研究的基本元素發(fā)生了轉(zhuǎn)變從單一、局部的基因或基因的片段轉(zhuǎn)變成整個(gè)基因組. 反過(guò)來(lái), 這種轉(zhuǎn)變又需要更加強(qiáng)大的測(cè)序技術(shù)來(lái)支持. 測(cè)序技術(shù)與其應(yīng)用之間的協(xié)同關(guān)系使得兩者的發(fā)展在可預(yù)見(jiàn)的未來(lái)內(nèi)保持這種趨勢(shì), 并且由于其對(duì)個(gè)體化疾病診斷與治療具有確定性的推動(dòng)作用而加速. 本文回顧了測(cè)序技術(shù)的演進(jìn), 分析圖1 測(cè)序技術(shù)發(fā)展時(shí)間軸周曉光等: 下一代測(cè)序技術(shù): 技術(shù)回顧與展望24幾代測(cè)序技術(shù)的優(yōu)點(diǎn)與缺點(diǎn). 并對(duì)這一領(lǐng)域可能的發(fā)展方向做出了預(yù)測(cè). 為便于討論, 根據(jù)技術(shù)的進(jìn)展, 將測(cè)序技術(shù)分為具有不同亞代的3代(表1. 盡管根據(jù)技術(shù)進(jìn)

5、展將其劃為不同世代有些武斷, 但是這種方法還是能夠體現(xiàn)每個(gè)階段的關(guān)鍵技術(shù)進(jìn)展.1 技術(shù)回顧與近期發(fā)展1.1 第1代測(cè)序技術(shù)熒光標(biāo)記的Sanger 法在第一臺(tái)全自動(dòng)測(cè)序儀出現(xiàn)之前, 使用最為廣泛的測(cè)序方法就是Sanger 在20世紀(jì)70年代中期發(fā)明的末端終止法測(cè)序技術(shù). Sanger也因此獲得1980年的諾貝爾化學(xué)獎(jiǎng)5. 他的發(fā)明第一次為科研人員開(kāi)啟了深入研究生命遺傳密碼的大門.原來(lái)的方法主要依靠手工操作, 難以自動(dòng)化. 例如, 它利用放射性同位素標(biāo)記引物來(lái)進(jìn)行DNA 梯狀成像, 操作十分不方便. 要使用雙脫氧核苷酸分別做4個(gè)末端終止反應(yīng), 然后采用平板凝膠電泳技術(shù), 用4條電泳道來(lái)分離4個(gè)反應(yīng)

6、所得產(chǎn)物, 費(fèi)時(shí)費(fèi)力, 試劑消耗也大, 這些都嚴(yán)重限制了測(cè)序的通量. 因此, 對(duì)于開(kāi)發(fā)非放射性的第一代測(cè)序技術(shù)勢(shì)在必行.(1 G1.1. 最早版本的第1代測(cè)序儀是20世紀(jì)80 年代中期在Cal Tech的Leroy Hood實(shí)驗(yàn)室發(fā)明的6. 這一測(cè)序儀通過(guò)修改Sanger 法得以實(shí)現(xiàn). 最關(guān)鍵的改變是采用具有顏色的熒光染料代替同位素標(biāo)記. 4種雙脫氧核苷酸終止子被標(biāo)記上不同顏色的熒光基團(tuán). 另外, 與最初的Sanger 法不同, 熒光基團(tuán)是標(biāo)記在終止子上, 而不是在引物上. 這種不同顏色標(biāo)記的方案可以實(shí)現(xiàn)一個(gè)反應(yīng)管中同時(shí)進(jìn)行4個(gè)末端終止反應(yīng). 采用聚丙烯酰胺凝膠分離, 并通過(guò)計(jì)算機(jī)熒光檢測(cè)系統(tǒng)

7、分析梯狀反應(yīng)產(chǎn)物. 這些改進(jìn)極大地提高了測(cè)序速度, 減少了測(cè)序過(guò)程中的人為干擾.次年, 利用Leroy Hood實(shí)驗(yàn)室的技術(shù), ABI推出了第一款半自動(dòng)DNA 測(cè)序儀ABI 3707. 在隨后的20年中, 測(cè)序儀的性能得到了極大的提升. 但基本工作原理直到最近才有所改變.(2 G1.2. 第1代測(cè)序儀的第2個(gè)版本出現(xiàn)在20世紀(jì)末. 這一版本的測(cè)序儀, 其測(cè)序速度與質(zhì)量得到了進(jìn)一步的提高. 這主要?dú)w功于兩方面的工作: 第一, 平板電泳分離技術(shù)被毛細(xì)管電泳所取代; 第二, 通過(guò)更高程度的并行化使得同時(shí)進(jìn)行測(cè)序的樣本數(shù)量增加. 使用毛細(xì)管替代平板凝膠取消了手工上樣, 降低了試劑的消耗, 提升了分析的

8、速度. 另外, 緊湊的毛表1 測(cè)序技術(shù)發(fā)展路線a代次 第1代第2代第3代版本 1.1 1.2 2.1 2.2 2.3 3.1 3.2 平 臺(tái)Sanger 法ABIABI/GenoMEMSSBS Illumina SBL ABI/Polonator G.007CompleteGenomicsSBP RocheSM-SBSFDHelicos ?FEPacific Biosciences/ VisiGenSM-SBL SM-SBP納米孔PoC 刀 PoC 石墨烯PoCa SBS: 合成法測(cè)序(sequence-by-synthesis; SBL: 連接法測(cè)序(sequence-by-ligation

9、; SBP: 焦磷酸測(cè)序(sequence-by-pyrosequencing;SM: 單分子(single molecule; FD: DNA固定化(fixed DNA; FE: 酶固定化(fixed enzyme; PoC: 概念驗(yàn)證(proof-of-concept; ?: 預(yù)期可能出現(xiàn)的技術(shù)中國(guó)科學(xué): 生命科學(xué) 2010年 第40卷 第1期 25細(xì)管電泳設(shè)備的形式更易于實(shí)現(xiàn)并行化, 可以獲得更高的通量. ABI 3730測(cè)序儀和Amersham Mega- BACE 分別可以在一次運(yùn)行中分析96個(gè)或384個(gè)樣本. 這一代測(cè)序儀在人類基因組計(jì)劃DNA 測(cè)序的后期階段起到了關(guān)鍵的作用, 加

10、速了人類基因組計(jì)劃的完成. 而且由于其在原始數(shù)據(jù)質(zhì)量以及序列讀長(zhǎng)方面具有的優(yōu)勢(shì), 這些測(cè)序儀今天還在使用之中.通過(guò)幾十年的逐步改進(jìn), 第1代測(cè)序儀的讀長(zhǎng)可以超過(guò)1000 bp, 原始數(shù)據(jù)的準(zhǔn)確率可以高達(dá)99.999%, 測(cè)定每千堿基序列的成本是0.5美元, 每天的數(shù)據(jù)通量可以達(dá)到600000堿基. 不論這些數(shù)字如何令人印象深刻, 第1代測(cè)序技術(shù)在速度和成本方面都已達(dá)到了極限. 由于其對(duì)電泳分離技術(shù)的依賴, 使其難以進(jìn)一步提升分析的速度和提高并行化程度, 并且難以通過(guò)微型化降低測(cè)序成本. 因此, 需要開(kāi)發(fā)全新的技術(shù)來(lái)突破這些局限.盡管如此, 第1代技術(shù)是不會(huì)很快消失, 它將與新的若干代測(cè)序平臺(tái)并

11、存. 這些久經(jīng)考驗(yàn)的方法可靠、準(zhǔn)確, 且已形成規(guī)?;? 特別是在PCR 產(chǎn)物測(cè)序、質(zhì)粒和細(xì)菌人工染色體的末端測(cè)序、以及STR 基因分型方面, 將繼續(xù)發(fā)揮重要作用.1.2 第2代測(cè)序技術(shù)循環(huán)陣列合成測(cè)序法所謂下一代測(cè)序方法, 包括大量基于不同技術(shù)的方法. 盡管從模板文庫(kù)制備、片段擴(kuò)增到測(cè)序, 這些方法所采用的技術(shù)與生物化學(xué)相當(dāng)多樣, 但是都采用了大規(guī)模矩陣結(jié)構(gòu)的微陣列分析技術(shù)陣列上的DNA 樣本可以被同時(shí)并行分析. 此外, 測(cè)序是利用DNA 聚合酶8或連接酶9以及引物對(duì)模板進(jìn)行一系列的延伸, 通過(guò)顯微設(shè)備觀察并記錄連續(xù)測(cè)序循環(huán)中的光學(xué)信號(hào)實(shí)現(xiàn)的.在一般性描述中, 下一代測(cè)序技術(shù)的幾個(gè)關(guān)鍵特點(diǎn)是顯

12、而易見(jiàn)的: 第一, 通過(guò)有序或者無(wú)序的陣列配置可以實(shí)現(xiàn)大規(guī)模的并行化, 以提供高程度的信息密度. 理論上, 只有光的衍射極限會(huì)限制并行化的提高(即用來(lái)檢測(cè)獨(dú)立光學(xué)事件的半波長(zhǎng). 這極大地提高了總的測(cè)序數(shù)據(jù)產(chǎn)出通量; 第二, 不采用電泳, 設(shè)備易于微型化. 相對(duì)于第1代測(cè)序技術(shù), 樣本和試劑的消耗量得以降低.(1 G2.1下一代測(cè)序儀. 所有的下一代測(cè)序平臺(tái)遵循了類似的工作流程, 如圖2所示, 都要經(jīng)過(guò)克隆擴(kuò)增以加強(qiáng)測(cè)序過(guò)程中的光學(xué)檢測(cè)靈敏度. 3種廣泛使用的商業(yè)化平臺(tái)是Illumina 的Genome Analyzer, 羅氏454基因組測(cè)序儀以及AB Life Technologies的SO

13、LiD 系統(tǒng). 它們基本都是在20世紀(jì)90年代末被發(fā)明和開(kāi)發(fā)出來(lái), 在2005年前后商業(yè)化. Polonator G.007是最近剛剛實(shí)現(xiàn)商業(yè)化的新設(shè)備, 該儀器最初由哈佛大學(xué)George Church實(shí)驗(yàn)室開(kāi)發(fā), 現(xiàn)在由Dover Systems公司制造. Complete Genomics公司最近推出了基于其專利技術(shù)的測(cè)序服務(wù)平臺(tái), 但該公圖2 第2代測(cè)序技術(shù)工作流程周曉光等: 下一代測(cè)序技術(shù): 技術(shù)回顧與展望26司并沒(méi)有表示要在市場(chǎng)銷售這一設(shè)備. 這些儀器都采用了合成測(cè)序法, 只是在DNA 陣列的排布、DNA 簇?cái)U(kuò)增, 以及基于酶的測(cè)序生化反應(yīng)方面存在差異.首先, 構(gòu)建DNA 模板文庫(kù).

14、 通過(guò)隨機(jī)打斷基因組DNA 獲得DNA 文庫(kù)片段(長(zhǎng)度為數(shù)十到數(shù)百堿基, 或者構(gòu)建控制距離分布的配對(duì)末端片段. 在雙鏈片段的兩端連上接頭序列, 然后變性得到單鏈模板文庫(kù), 并固定在固體表面上. 固體表面可以是平面或是微球的表面. 克隆的擴(kuò)增通過(guò)以下幾種方式之一進(jìn)行, 如橋式PCR 10、微乳滴PCR 11或原位成簇12. 在芯片上形成DNA 簇陣列的DNA 簇或擴(kuò)增微球, 利用聚合酶或者連接酶進(jìn)行一系列循環(huán)的反應(yīng)操作, 通過(guò)顯微檢測(cè)系統(tǒng)監(jiān)控每個(gè)循環(huán)生化反應(yīng)中產(chǎn)生的光學(xué)事件, 用CCD 相機(jī)將圖像采集并記錄下來(lái). 對(duì)產(chǎn)生的陣列圖像進(jìn)行時(shí)序分析, 獲得DNA 片段的序列. 然后按照一定的計(jì)算機(jī)算法

15、將這些片段組裝成更長(zhǎng)的重疊群.(i Illumina Genome Analyzer. 單鏈文庫(kù)片段的擴(kuò)增是通過(guò)所謂“橋式擴(kuò)增”過(guò)程實(shí)現(xiàn)的13. 單鏈DNA 兩端加上非對(duì)稱的接頭, 并利用兩端的接頭將片段固定在芯片表面形成寡核苷酸橋. 芯片具有8個(gè)獨(dú)立的道, 每條道的表面均可固定寡核苷酸. 固定了寡核苷酸橋的芯片放置于流通池內(nèi). 經(jīng)過(guò)多個(gè)PCR 熱循環(huán), 成千上萬(wàn)的復(fù)制產(chǎn)物制備出來(lái), 每一簇都分別固定在芯片表面一個(gè)單一的物理位置上. 流通池中芯片表面的8個(gè)道中, 每條道上都可以獨(dú)立產(chǎn)生數(shù)百萬(wàn)這樣的簇(這樣, 可以在一個(gè)反應(yīng)中對(duì)8個(gè)不同的文庫(kù)并行測(cè)序. 然后, 測(cè)序引物雜交到擴(kuò)增產(chǎn)物中的通用序列

16、上, 開(kāi)始測(cè)序反應(yīng).Illumina 公司的測(cè)序儀采用合成測(cè)序法, 使用熒光標(biāo)記的核苷酸以及可逆的終止子. 在每一輪測(cè)序循環(huán)中, 標(biāo)記不同熒光基團(tuán)的4種核苷酸以及DNA 聚合酶同時(shí)加入流通池通道中, 按照堿基互補(bǔ)配對(duì)的原則進(jìn)行DNA 鏈的延伸. 每個(gè)核苷酸的3羥基是被封閉起來(lái), 以防止額外的延伸. 采集熒光圖像, 堿基特異的熒光標(biāo)記揭示了這一輪中新加入核苷酸是什么, 也就獲得模板中這一位置的DNA 序列. 然后, 打開(kāi)3端, 繼續(xù)進(jìn)行下一輪反應(yīng). 這一過(guò)程重復(fù)多次, 到50個(gè)循環(huán), 產(chǎn)生50個(gè)堿基的DNA 序列.該平臺(tái)的測(cè)序通量是傳統(tǒng)平臺(tái)(第1代測(cè)序儀 的數(shù)千倍. 其主要的缺點(diǎn)是由于光信號(hào)衰減

17、和移相的原因使得序列讀長(zhǎng)較短. 由于要記錄每個(gè)DNA 簇的光學(xué)信號(hào), 每一簇中所有DNA 鏈的延伸保持同步至關(guān)重要. 但是, 測(cè)序中每一步化學(xué)反應(yīng)都可能失敗, 例如不能將熒光標(biāo)記物切掉, 或者未能去除封閉基團(tuán). 這將導(dǎo)致一個(gè)簇中的一些DNA 鏈過(guò)長(zhǎng), 而另一些DNA 鏈可能沒(méi)有同步延伸, 進(jìn)而引起信號(hào)衰減或熒光信號(hào)相位移. 此外, 錯(cuò)誤率是累積的, 即DNA 鏈越長(zhǎng), 錯(cuò)誤率越高. 這些都限制了讀長(zhǎng)的增加.(ii Roche 454 Genome Sequencer. 454測(cè)序儀利用微乳滴PCR(emulsion PCR, emPCR來(lái)生成擴(kuò)增產(chǎn)物14. 將固化引物的微球與單鏈DNA 文庫(kù)模

18、板以及必要的PCR 反應(yīng)化合物一起混合, 微球與文庫(kù)片段的比例適當(dāng), 以確保大多數(shù)微球結(jié)合的單鏈DNA 分子不超過(guò)一個(gè). 水溶液與油混合形成油包水結(jié)構(gòu)乳滴. 每個(gè)乳滴都是一個(gè)進(jìn)行后續(xù)PCR 反應(yīng)的微型化學(xué)反應(yīng)器. 經(jīng)過(guò)多輪熱循環(huán), 每個(gè)微球表面都結(jié)合了數(shù)千個(gè)相同的DNA 拷貝. 然后富集微球, 轉(zhuǎn)移并放置到刻有規(guī)則微孔陣列的微孔板上. 每個(gè)微孔只能容納一個(gè)微球. 微孔板被安裝成為流通池的一部分. 其中一面可以通過(guò)測(cè)序反應(yīng)的化合物, 另一面則與CCD 光學(xué)檢測(cè)系統(tǒng)的光纖部件相接觸.堿基測(cè)定采用邊合成邊測(cè)序, 利用焦磷酸法產(chǎn)生的光學(xué)信號(hào)來(lái)進(jìn)行檢測(cè)15. 通常所說(shuō)的焦磷酸測(cè)序法是利用ATP 硫?;?/p>

19、和熒光素酶. 在三磷酸核苷結(jié)合到DNA 鏈上的時(shí)候釋放焦磷酸, 通過(guò)ATP 硫?;负蜔晒馑孛府a(chǎn)生一系列級(jí)聯(lián)反應(yīng), 導(dǎo)致生物化學(xué)發(fā)光放出光信號(hào). 測(cè)序是順次向流通池中加入4種dNTP 中的一種. 每個(gè)微孔之中有或是沒(méi)有光信號(hào)釋放出來(lái)分別表明dNTP 連接到片段上或者不是互補(bǔ)的核苷酸, 這樣也就確定了DNA 模板上的互補(bǔ)堿基.焦磷酸測(cè)序的主要優(yōu)勢(shì)是它的速度和讀長(zhǎng)將近500堿基. 與這里討論的其他下一代測(cè)序技術(shù)不同, 除了DNA 聚合酶反應(yīng)所需化合物, 焦磷酸測(cè)序法并不需要額外的化合物用于DNA 鏈的延長(zhǎng), 例如, 并不需要去掉標(biāo)記基團(tuán)或解除終止子的封閉, 這就降低了化學(xué)反應(yīng)出現(xiàn)意外的幾率. 導(dǎo)致

20、移相的主要原因如DNA 鏈提前終止或者延伸不同步出現(xiàn)的幾率較少. 但是這種非同步的處理方式也賦予焦磷酸測(cè)序技術(shù)一個(gè)局限, 由于沒(méi)有終止基團(tuán)可以停止DNA中國(guó)科學(xué): 生命科學(xué) 2010年 第40卷 第1期27鏈的延伸, 在測(cè)定同核苷酸聚合物區(qū)域時(shí), 如一連串的GGGGGG, 焦磷酸測(cè)序會(huì)遇到問(wèn)題, 不得不依靠光信號(hào)的強(qiáng)度來(lái)推斷同聚核苷酸的長(zhǎng)度, 這就容易產(chǎn)生錯(cuò)誤. 因此, 這一技術(shù)平臺(tái)主要的錯(cuò)誤類型就是插入-缺失, 而不是堿基的替換. 454的另一個(gè)缺點(diǎn)是由于它依賴于包含一系列酶的焦磷酸檢測(cè), 與其他下一代測(cè)序技術(shù)相比, 其試劑價(jià)格相對(duì)較高.(iii Life Technologies SOLi

21、D System. 與454的情況相同, SOLiD系統(tǒng)也采用了微乳滴PCR 與微球相結(jié)合的策略來(lái)擴(kuò)增DNA 模板. 打破微乳滴后, 擴(kuò)增微球被收集、富集并固定在一個(gè)平的玻璃基板上形成一個(gè)無(wú)規(guī)則的陣列.它的邊合成邊測(cè)序采用的是連接反應(yīng)而不是上述平臺(tái)所采用的聚合反應(yīng)16. 另外, 它采用了雙堿基編碼策略來(lái)協(xié)助檢測(cè)錯(cuò)誤. 一段與DNA 文庫(kù)模板連在微球上的接頭序列互補(bǔ)的通用引物雜交到接頭區(qū)域上, 然后進(jìn)行一系列連接反應(yīng). 每個(gè)連接反應(yīng)都發(fā)生在延伸鏈和有熒光標(biāo)記的變性八核苷酸探針池中的探針(熒光標(biāo)記在第8堿基上 間. 八核苷酸探針池設(shè)計(jì)成在核苷酸的堿基識(shí)別位點(diǎn), 其第1和2位的堿基與特定的熒光顏色有

22、明確的對(duì)應(yīng)關(guān)系. 連接反應(yīng)后, 獲取熒光圖象. 接下來(lái), 在第5和6位堿基之間切開(kāi)八核苷酸, 將最后3個(gè)堿基以及熒光基團(tuán)去除. 接下來(lái)每一輪連接反應(yīng)都可以獲得延伸鏈上第1和2位堿基的信息(即模板序列的第12, 67, 1112, 1617, 2122, 2627以及第3132位上的堿基. 7輪連接反應(yīng)后, 已經(jīng)擴(kuò)增的鏈變性脫落, 系統(tǒng)重置. 第2個(gè)引物結(jié)合到接頭區(qū)域. 第2個(gè)引物在DNA 模板上的起始位置與第1個(gè)引物相比提前一個(gè)堿基. 接下來(lái)有另外7輪上述連接循環(huán). 這樣就可以讀取一組新的位置01, 56,等的信息. 這一過(guò)程繼續(xù)進(jìn)行, 重置后所用的引物都比上一個(gè)引物提前一個(gè)堿基, 直到所有位

23、置上的序列信息均被讀取. 這種方法雖然聽(tīng)上去較復(fù)雜, 但實(shí)際上, 整個(gè)系統(tǒng)都是在計(jì)算機(jī)控制下自動(dòng)運(yùn)行. 由于每個(gè)堿基都被測(cè)定了兩遍, 即在兩個(gè)獨(dú)立的連接反應(yīng)中被測(cè)定, 這個(gè)方法使該測(cè)序技術(shù)具有可以確定錯(cuò)誤識(shí)別堿基的優(yōu)點(diǎn)16. 該技術(shù)主要的缺點(diǎn)是序列讀長(zhǎng)相對(duì)較短. 這也是由于同一簇?cái)U(kuò)增產(chǎn)物中存在移相造成的.(iv Polonator G.007. Polonator是另外一款使用連接測(cè)序技術(shù)的下一代測(cè)序儀. 它采用的是單堿基探針, 而不是上述雙堿基編碼的策略. 測(cè)序是通過(guò)在結(jié)合到經(jīng)微乳滴PCR 擴(kuò)增的DNA 簇上的通用引物與九堿基探針之間的一系列連接反應(yīng)進(jìn)行的9. 每次連接反應(yīng), 將一個(gè)九堿基探

24、針池與DNA 連接酶一起加入, 以進(jìn)行引物-探針連接. 九堿基探針池中包括很多熒光標(biāo)記的變性寡核苷酸探針. 熒光標(biāo)記與每個(gè)讀取位置對(duì)應(yīng)(即熒光顏色與讀取位置的堿基相對(duì)應(yīng). 每次連接之后獲取熒光圖像. 然后, 延伸的引物探針鏈經(jīng)變性進(jìn)行系統(tǒng)重置. 接下來(lái), 對(duì)下一個(gè)讀取位置進(jìn)行引物與第2個(gè)九堿基探針池之間的連接. 這一重置-連接-獲取圖像的過(guò)程重復(fù)進(jìn)行, 直到所有位置的信息被讀取.這一系統(tǒng)中, 系統(tǒng)重置后, 并不需要進(jìn)行連串的連接反應(yīng), 因此測(cè)序錯(cuò)誤也不累積, 這是該系統(tǒng)的一個(gè)優(yōu)點(diǎn). 但是, 這就使引物間可能的讀取位置受到限制, 讀長(zhǎng)更短. 這一缺陷在某種程度上可以通過(guò)在文庫(kù)序列中使用多重錨定位

25、置來(lái)擴(kuò)展讀取區(qū)間. 與其他商業(yè)化的下一代測(cè)序儀相比, Polonator的價(jià)格明顯低得多, 而且是一個(gè)開(kāi)源的技術(shù)平臺(tái), 就是說(shuō)它允許最終用戶變更并且改進(jìn)測(cè)序操作或化學(xué)試劑.(v Complete Genomics. Complete Genomics所采用的連接測(cè)序方法基本與Polonator 相同. 只不過(guò)它采用了獨(dú)特的設(shè)計(jì), 增加芯片表面DNA 簇的密度, 以降低試劑的消耗17. 為了增加讀長(zhǎng), 在基因組片段兩側(cè)加上了多個(gè)(4個(gè) 接頭以形成環(huán)狀DNA 模板18. 模板序列通過(guò)環(huán)形PCR 擴(kuò)增, 以獲得包含源于模板序列的兩百個(gè)拷貝的串聯(lián)體. 這種串聯(lián)體折疊成球狀結(jié)構(gòu), 被稱為DNA 納米球(

26、DNB. 每個(gè)球自動(dòng)聚集在水平基質(zhì)表面的黏性(活化 點(diǎn)上, 形成高密度的納米球陣列. 納米球不會(huì)黏在芯片上活化點(diǎn)中間的區(qū)域, 這樣就形成了一個(gè)規(guī)則排布的納米球矩陣. 因?yàn)榧{米球可以更加有效的利用三維空間, 與DNA 簇或者微球相比, 納米球可以形成密度更高的陣列. 這一技術(shù)還取消了在其他下一代測(cè)序儀中都使用的流 通池19.該測(cè)序技術(shù)采用的方法與Polonator 相近, 即連接測(cè)序, 使用單堿基讀取特定位置信息. Complete Genomics 創(chuàng)造了組合探針錨定連接(combinatorial probe-anchor ligation, cPAL的方法. cPAL的變性寡核周曉光等:

27、下一代測(cè)序技術(shù): 技術(shù)回顧與展望28苷酸探針庫(kù)中的探針用熒光標(biāo)記, 4種不同顏色的熒光分別與給定位置上4種不同的堿基相對(duì)應(yīng). 讀取每一個(gè)位置, 都有一個(gè)單獨(dú)的探針庫(kù). 根據(jù)堿基互補(bǔ)配對(duì)原則, 一個(gè)特定的探針庫(kù)與錨定序列在讀取位置處連接起來(lái), 通過(guò)熒光顏色對(duì)應(yīng)讀取出相應(yīng)的堿基信息. 每次讀取后, 探針與錨定序列復(fù)合體被洗去. 另一個(gè)錨定序列與模板雜交, 針對(duì)另外一個(gè)位置的探針庫(kù)加入循環(huán). 這一過(guò)程重復(fù)進(jìn)行直到讀取所有位置的信息. 最近Complete Genomics通過(guò)測(cè)定3個(gè)人類基因組, 展示了其測(cè)序的準(zhǔn)確度以及成本效益20.由于沒(méi)有使用AB SOLiD系統(tǒng)的連續(xù)性探針, 使得該技術(shù)具有一些

28、優(yōu)點(diǎn). 首先, 沒(méi)有記憶效應(yīng), 前面連接循環(huán)中產(chǎn)生的錯(cuò)誤不會(huì)帶到后面的循環(huán)中, 具有更高的容錯(cuò)能力; 另外, 每個(gè)循環(huán)中連接產(chǎn)量不高, 降低了如探針以及錨定序列等試劑的用量. 但是, 由于寡核苷酸探針的長(zhǎng)度限制(9個(gè)堿基, 從每個(gè)錨定序列位置獲得的讀長(zhǎng)依然很短. 對(duì)每個(gè)文庫(kù)片段, 使用4個(gè)錨定位置以獲取全部序列.與第1代測(cè)序儀相比, 以合成測(cè)序?yàn)榛A(chǔ)的下一代測(cè)序平臺(tái)速度顯著提高, 成本明顯降低. 每臺(tái)設(shè)備每天產(chǎn)出千兆堿基的序列不足為奇. 但是, 除了羅氏的454平臺(tái)之外, 讀長(zhǎng)短成了下一代測(cè)序平臺(tái)的致命傷. 這主要是由于DNA 簇中存在的光學(xué)信號(hào)移相造成的. 應(yīng)運(yùn)而生的單分子測(cè)序技術(shù)是解決這一

29、問(wèn)題的一種方案.(2 G2.2單分子測(cè)序(SMS. 為克服下一代測(cè)序平臺(tái)讀長(zhǎng)較短這一主要缺點(diǎn), 經(jīng)過(guò)努力, 開(kāi)發(fā)出了單分子測(cè)序平臺(tái), 通過(guò)在單一DNA 分子組成的陣列上進(jìn)行合成測(cè)序. 在一個(gè)限定的表面上, 使用單個(gè)分子可以增加獨(dú)立分析的DNA 片段的數(shù)量. 因此, 可以使數(shù)據(jù)產(chǎn)出量更高. 當(dāng)然, 這也意味著不再需要昂貴的DNA 簇?cái)U(kuò)增步驟了. 這將進(jìn)一步降低測(cè)序的成本. 但同時(shí)也帶來(lái)了一些新的挑戰(zhàn), 主要是集中在單分子水平光學(xué)信號(hào)的檢測(cè)方面. 主要的問(wèn)題是要降低非檢測(cè)特異性的背景干擾, 例如沒(méi)有參與到實(shí)際化學(xué)反應(yīng)中的游離熒光分子. 有幾種不同的辦法試圖解決這一問(wèn)題. 基本的原則都是將檢測(cè)局限在

30、測(cè)序反應(yīng)發(fā)生的實(shí)際位置附近, 例如使用消逝波. 下面介紹一些已經(jīng)開(kāi)發(fā)或正在開(kāi)發(fā)中的平臺(tái).(i Helicos HeliScope. Helicos Biosciences公司開(kāi)發(fā)的HeliScope 遺傳分析系統(tǒng)是近來(lái)市場(chǎng)上最早出現(xiàn)的單分子測(cè)序儀器. 它以Quake 集團(tuán)的工作為基礎(chǔ)21, 在單個(gè)分子上邊合成邊測(cè)序. 構(gòu)建的單鏈DNA 文庫(kù)未經(jīng)擴(kuò)增, 沒(méi)有規(guī)律地排列在平面基板上. 每個(gè)測(cè)序循環(huán)中, DNA聚合酶和4種熒光標(biāo)記的核苷酸中的一種流入, 按照模板序列延伸DNA 鏈, 陣列中發(fā)生了堿基延伸反應(yīng)的DNA 鏈就會(huì)發(fā)出熒光, 并通過(guò)CCD 記錄下來(lái). 經(jīng)過(guò)洗滌, 延伸了的DNA 鏈上的熒光物

31、質(zhì)被切除并被移走, 便可以進(jìn)行下一輪單個(gè)堿基的延伸, 熒光標(biāo)記的切除以及圖像的獲取. 在焦磷酸測(cè)序中, 每個(gè)重復(fù)的循環(huán)是不同步的, 陣列中的一些鏈可能延伸到前邊, 一些可能落在后面, 甚至根本沒(méi)有延伸. 而在這里, 每條鏈都是獨(dú)立操作的, 根本不用考慮移相的問(wèn)題. 但是這也意味著, 焦磷酸測(cè)序法所遇到的同核苷酸寡聚物對(duì)HeliScope 也是問(wèn)題. 與454不同, 單分子操作可以讓人們通過(guò)動(dòng)力學(xué)控制酶的反應(yīng), 降低DNA 鏈延伸的速度, 在dNTP 被洗掉前, 減少兩個(gè)連續(xù)堿基連接在鏈上的可能22.如前所述, 檢測(cè)是單分子測(cè)序技術(shù)所面臨的一個(gè)關(guān)鍵挑戰(zhàn). HeliScope利用了一項(xiàng)被稱為全內(nèi)反

32、射顯微鏡(total internal reflection microscopy, TIRM的技術(shù). 只有靠近流通池反應(yīng)表面很薄的一層空間內(nèi)的熒光集團(tuán)才能被消逝波所激發(fā)產(chǎn)生熒光23. 這有助于降低熒光背景. 盡管有精密的光學(xué)儀器, 捕捉單分子事件仍然是個(gè)挑戰(zhàn). 因此, 與成簇檢測(cè)為基礎(chǔ)的測(cè)序儀先行者相比, 該平臺(tái)的原始數(shù)據(jù)準(zhǔn)確度明顯較低, 主要的錯(cuò)誤類型是缺失. 但是, 雙向測(cè)序策略可以顯著提升準(zhǔn)確率. 單分子意味著可以在測(cè)序結(jié)束后, 去掉延伸鏈, 將模板重置為最初的狀態(tài). 從而可以利用遠(yuǎn)端的接頭, 從相反的方向進(jìn)行另一次測(cè)序, 生成同一模板的第2個(gè)序列信息. 重復(fù)的序列可以用于去除缺失錯(cuò)誤

33、, 因而, 相對(duì)于單向測(cè)序顯著提高了準(zhǔn)確率.(ii VisiGen. VisiGen生物技術(shù)公司, 目前是Life Technologies 的一部分. 該公司一直致力于研發(fā)一種單分子的合成測(cè)序儀24.概括地說(shuō), 他們加工了一種蛋白質(zhì)納米裝置來(lái)實(shí)時(shí)觀察和記錄DNA 聚合酶合成DNA 的過(guò)程. 這是通過(guò)熒光供體和受體之間的熒光共振能量轉(zhuǎn)移(fluorescence resonance energy transfer, FRET實(shí)現(xiàn)的.中國(guó)科學(xué): 生命科學(xué) 2010年 第40卷 第1期29在熒光共振能量轉(zhuǎn)移過(guò)程中, 只有在附近存在能量供體時(shí), 受體分子才會(huì)在激發(fā)狀態(tài)下發(fā)出熒光. 在他們的設(shè)計(jì)中,

34、每一個(gè)dNTP 分子的磷酸上攜帶一個(gè)具有特定顏色的熒光受體基團(tuán), 而DNA 聚合酶經(jīng)過(guò)修飾, 在其活性位點(diǎn)附近攜帶一個(gè)熒光供體基團(tuán). 在DNA 堿基延伸的時(shí)候, 一個(gè)與模板配對(duì)的堿基被DNA 聚合酶捕獲, 并使熒光受體基團(tuán)靠近供體基團(tuán). 熒光能量轉(zhuǎn)移發(fā)生, 發(fā)出相應(yīng)顏色的熒光. 一旦結(jié)束, 熒光基團(tuán)作為焦磷酸的一部分被DNA 聚合酶釋放. 這樣在本質(zhì)上當(dāng)核苷酸連接起來(lái)的同時(shí)協(xié)同地產(chǎn)生了一個(gè)熒光的爆發(fā). 通過(guò)記錄和分析時(shí)序的熒光爆發(fā)就構(gòu)建了DNA 序列信息. 值得注意的是在去除熒光標(biāo)記或是切除封閉基團(tuán)時(shí), 整個(gè)過(guò)程是沒(méi)有停頓的, 這確實(shí)是一個(gè)實(shí)時(shí)的過(guò)程, 意味著其工作速度極快, 要考慮到光學(xué)記錄

35、裝置能否跟上這一速度. 為了進(jìn)一步降低背景的干擾, 他們也采用全內(nèi)反射顯微鏡作為熒光檢測(cè)設(shè)備. 而且, 與Helicos 的平臺(tái)不同, 這套系統(tǒng)將DNA 聚合酶固化在基質(zhì)表面上, 而不是固定DNA. 這樣DNA 鏈的延長(zhǎng)就不受限制. 固定酶而不是DNA 的另一個(gè)好處是當(dāng)DNA 延長(zhǎng)時(shí), 可以將核苷酸連接控制在很小的檢測(cè)空間范圍內(nèi), 即DNA 鏈增長(zhǎng)時(shí)熒光不會(huì)超出檢測(cè)范圍. 盡管Life Technolo- gies 公司沒(méi)有公布儀器的性能, 但估計(jì)它的速度很 快, 且讀長(zhǎng)較長(zhǎng). 理論上, 讀長(zhǎng)只是由DNA 聚合酶的處理特性決定的. 實(shí)際上, 其他因素, 如DNA 聚合酶上攜帶的熒光供體的光漂白

36、作用也會(huì)限制讀長(zhǎng). 據(jù)報(bào)道, Life Technologies公司正在開(kāi)發(fā)一種量子點(diǎn)熒光標(biāo)記以解決這一問(wèn)題.(iii Pacific Biosciences. Pacific Biosciences公司致力于開(kāi)發(fā)一種新的測(cè)序技術(shù)單分子實(shí)時(shí)技術(shù)(single molecule real time, SMRT25. 這一單分子合成測(cè)序技術(shù)依賴于被稱為零級(jí)波導(dǎo)(zero mode waveguide, ZMW的納米結(jié)構(gòu)來(lái)實(shí)時(shí)觀察DNA 的聚合26. 該結(jié)構(gòu)在一片薄金屬膜上蝕刻出數(shù)以千計(jì)直徑數(shù)十納米的亞波長(zhǎng)小孔. 并將金屬膜附著在透明的支持基質(zhì)上. 由于每個(gè)小孔的尺寸低于光的波長(zhǎng), 所以當(dāng)光線從透明

37、一側(cè)照射時(shí)無(wú)法透射. 并且在每個(gè)小孔的底部形成指數(shù)衰減的消逝波, 這樣創(chuàng)造了一個(gè)很小體積的檢測(cè)空間. 每個(gè)小孔底部固定一個(gè)聚合酶分子. 在測(cè)序過(guò)程中, 由固定的酶根據(jù)單鏈DNA 模板合成雙鏈. 每次加入一個(gè)堿基, 聚合酶捕獲具有熒光標(biāo)記的dNTP(也是標(biāo)記在-磷酸上, 并將其帶到檢測(cè)區(qū)間, 產(chǎn)生熒光光曝. 光曝的熒光顏色就揭示了模板上的互補(bǔ)堿基. 通過(guò)連續(xù)實(shí)時(shí)的監(jiān)控每個(gè)波導(dǎo)孔的熒光光曝, 就快速測(cè)定了每一個(gè)孔內(nèi)DNA 模板的序列.PacificBio 的技術(shù)在高速測(cè)序、長(zhǎng)序列產(chǎn)出和低成本方面有著巨大的潛力. 但是, 與其他單分子測(cè)序平臺(tái)一樣, 實(shí)時(shí)檢測(cè)單個(gè)分子對(duì)于提高原始數(shù)據(jù)準(zhǔn)確率是一個(gè)挑戰(zhàn),

38、 并可能成為一個(gè)障礙. 如前所述, 可以通過(guò)對(duì)同一樣品進(jìn)行重置后進(jìn)行多次測(cè)序來(lái)減少誤讀. 另外, 當(dāng)前的CCD 技術(shù)也限制了同時(shí)觀察零級(jí)波導(dǎo)的最大面積. 聚合酶所占據(jù)的零級(jí)波導(dǎo)比例較低(約30%也限制了可用的波導(dǎo)數(shù)量27. 所有這些都成為提高SMRT 技術(shù)數(shù)據(jù)通量的限制. 盡管有這些限制, 預(yù)計(jì)在2010年推出的第一個(gè)版本的設(shè)備的序列讀長(zhǎng)將不低于1500個(gè)堿基, 一次測(cè)序只要15 min, 每次測(cè)序的實(shí)際成本不超過(guò)60美元. 當(dāng)這些技術(shù)問(wèn)題都被解決的時(shí)候, 預(yù)計(jì)未來(lái)版本的設(shè)備每天可能產(chǎn)出100G 的數(shù)據(jù), 而序列讀長(zhǎng)將達(dá)到10萬(wàn)堿基.(iv Mobious Nexus I. 除了宣布他們打算開(kāi)

39、發(fā)一款單分子測(cè)序儀之外, 到目前為止, Mobious Biosy- stems 公司并沒(méi)有透露關(guān)于其Polykinetic Sequencing技術(shù)的很多細(xì)節(jié)28. 該技術(shù)利用了聚合酶在DNA 合成時(shí)的天然化學(xué)方式. 當(dāng)聚合酶按照模板, 將堿基連接到DNA 鏈上時(shí), 它首先需要測(cè)試溶液中某一堿基以確定其是否與模板堿基相匹配. 如果不匹配, 則馬上將該堿基釋放. 如果匹配, 聚合酶將抓住它, 并繼續(xù)進(jìn)行耗時(shí)的步驟, 將核苷酸連接到DNA 鏈上. Mobious 的合成測(cè)序方法就是利用匹配與不匹配堿基在這一步驟所需時(shí)間的差異進(jìn)行檢測(cè). 按照順序, 每次在反應(yīng)體系中加入4種核苷酸中的一種, 通過(guò)測(cè)

40、定DNA 聚合酶(固定在基質(zhì)表面上 抓住核苷酸以及完成聚合的時(shí)間, 可以推斷出該核苷酸與模板是否匹配. 檢測(cè)聚合酶的構(gòu)象變化就可以來(lái)記錄這一過(guò)程中的時(shí)間差異. VisiGen所采用的使用配對(duì)的供體和受體的熒光共振能量轉(zhuǎn)移策略也可用于這一檢測(cè). 熒光的主要問(wèn)題是熒光基團(tuán)的光漂白. 為解決這一問(wèn)題, Mobious利用酶的構(gòu)象改變時(shí)電磁性質(zhì)發(fā)生變化的特性, 通過(guò)離子體共振光譜, 核磁共振等進(jìn)行檢周曉光等: 下一代測(cè)序技術(shù): 技術(shù)回顧與展望30測(cè)29. 除去單分子測(cè)序本身的原因, 這種方法所帶來(lái)的一個(gè)優(yōu)點(diǎn)是由于沒(méi)有使用熒光標(biāo)記核苷酸, 試劑成本降低的空間更大.1.3 第3代測(cè)序技術(shù)直接測(cè)序在所有上述

41、第2代測(cè)序技術(shù)中, 序列都是在熒光或者化學(xué)發(fā)光物質(zhì)的協(xié)助下, 通過(guò)讀取DNA 聚合酶或DNA 連接酶將堿基連接到DNA 鏈上過(guò)程中釋放出的光學(xué)信號(hào)而間接確定的. 除了需要昂貴的光學(xué)監(jiān)測(cè)系統(tǒng), 還要記錄、存儲(chǔ)并分析大量的光學(xué)圖像. 這都使儀器的復(fù)雜性和成本增加. 依賴生物化學(xué)反應(yīng)讀取堿基序列更增加了試劑、耗材的使用, 在目前測(cè)序成本中比例相當(dāng)大. 直接讀取序列信息, 不使用化學(xué)試劑, 對(duì)于進(jìn)一步降低測(cè)序成本是非??扇〉? 在一個(gè)正在發(fā)生突破瓶頸巨變的領(lǐng)域內(nèi), 很難準(zhǔn)確預(yù)測(cè)未來(lái)將發(fā)生什么. 但是, 最近幾個(gè)領(lǐng)域大量的研究工作表明未來(lái)新一代的測(cè)序平臺(tái)將在其中產(chǎn)生.(1 非光學(xué)顯微鏡成像. 常言道“百

42、聞不如一見(jiàn)”, 確定DNA 序列的最直接方法之一就是將核苷酸(主要是堿基 的空間線性排列方式可視化. 如果一個(gè)DNA 鏈的圖片具有足夠高的分辨率, 可以將DNA 鏈上的4種堿基區(qū)分開(kāi)來(lái), 那么序列將非常容易地被讀出. 這正是目前顯微鏡領(lǐng)域科研人員所努力實(shí)現(xiàn)的. 這一設(shè)想是借助具有原子水平分辨率的非光學(xué)顯微鏡, 如掃描隧道顯微鏡(STM、原子力顯微鏡(AFM等30,31. 盡管非常有限, 但還是有一定的進(jìn)展. 最近, 日本大阪大學(xué)的研究小組發(fā)現(xiàn), 在一條拉長(zhǎng)的DNA 鏈上, 利用掃描隧道顯微鏡的圖像, 根據(jù)獨(dú)特的電子指紋, 可以將鳥(niǎo)嘌呤與其他3種堿基區(qū)分開(kāi)來(lái)32. 另外一些團(tuán)隊(duì)一直積極地致力于使

43、用原子力顯微鏡來(lái)記錄將每個(gè)堿基緊密連接的環(huán)拉開(kāi)所需力的大小, 以區(qū)分不同的堿基33. 而ZS Genetics公司致力于使用電子顯微鏡直接測(cè)序. 為了解決天然DNA 分子在電子顯微鏡下對(duì)比度不足的問(wèn)題, 他們?cè)诰酆厦负铣尚翫NA 鏈時(shí)加入更重的元素34. 在電子顯微鏡下觀察就可以獲得的更重的DNA 并確定其序列.(2 納米孔. 本研究注意到另外一個(gè)非?;钴S的領(lǐng)域是利用納米孔結(jié)構(gòu)進(jìn)行測(cè)序. 顧名思義, 納米孔就是直徑在納米尺度的小孔(12 nm. 通常是利用固態(tài)物質(zhì)或者生物分子制成的小孔. 這種想法是在電場(chǎng)驅(qū)動(dòng)下, 當(dāng)線狀DNA 分子通過(guò)小孔時(shí), 通過(guò)一些物理手段來(lái)確定堿基的序列. 在全球, 許

44、多公司和組織, 如Agilent, DNA Electronics, IBM, NabSys, Oxford Nanopore Technologies, Sequenom等都在進(jìn)行納米孔測(cè)序的開(kāi)發(fā), 但采用的方法不同.所有以納米孔為基礎(chǔ)的測(cè)序技術(shù)都面臨兩個(gè)關(guān)鍵的挑戰(zhàn)35: ( 區(qū)分4種核苷酸的速度要與DNA 運(yùn)動(dòng)的速度相稱; ( 控制DNA 通過(guò)納米孔的速度. 初步嘗試測(cè)量離子電流的波動(dòng)單鏈DNA 分子通過(guò)納米孔時(shí), 堵塞納米孔從而造成電壓的波動(dòng). 但迄今為止, 成效甚微. 計(jì)算和實(shí)驗(yàn)表明, 僅僅測(cè)量通過(guò)納米孔離子電導(dǎo)率是不可能提供識(shí)別DNA 分子中每個(gè)核苷酸所需要的分辨率36. 納米孔通道

45、長(zhǎng)度通常為5 nm, 可以容納十多個(gè)堿基, 這一尺寸對(duì)于測(cè)序所需要的分辨單個(gè)堿基引起的電流變化過(guò)長(zhǎng).盡管離子電流測(cè)量還不能區(qū)分單個(gè)堿基, 但其可以很容易地辨別單鏈與雙鏈DNA 37. NABsys公司與Brown 大學(xué)的一個(gè)團(tuán)隊(duì)合作, 利用這一性能來(lái)開(kāi)發(fā)一種雜交測(cè)序法雜交輔助的納米孔測(cè)序方法(hybridization assisted nanopore sequencing, HANS38. 將基因組DNA 隨機(jī)切割成大約100 kb左右的片段, 制成單鏈并與六寡聚核苷酸探針雜交. 然后驅(qū)動(dòng)結(jié)合了探針的基因組文庫(kù)片段通過(guò)可尋址的納米孔陣列. 通過(guò)每個(gè)孔的離子電流均可獨(dú)立測(cè)量. 追蹤電流的變化

46、確定探針雜交在每個(gè)基因組片段上的精確位置. 利用基因組片段上雜交探針的重疊區(qū)域?qū)⒒蚪M片段文庫(kù)排列起來(lái), 建立一組完整的基因組探針圖. 利用計(jì)算機(jī)算法, 獲得完整的基因組序列. 但確定雜交位置的精確度和一致性還需要進(jìn)一步驗(yàn)證.為了提高納米孔的靈敏度以確定不同的堿基, 科研人員也在嘗試其他方法, 包括在納米孔內(nèi)嵌入電子探針39. 他們期望僅靠納米孔兩側(cè)的隧道電極在每個(gè)堿基被驅(qū)動(dòng)通過(guò)納米孔時(shí)能夠記錄特征性隧道電流. 計(jì)算機(jī)模擬以及成功用于揭示原子水平特性的掃描隧道顯微鏡的經(jīng)驗(yàn)都讓本研究組對(duì)這一工作持樂(lè)觀態(tài)度. 但制作這種納米尺度的裝置并不簡(jiǎn)單. 對(duì)這一問(wèn)題, 另一個(gè)創(chuàng)造性的解決方案是發(fā)展化學(xué)功能的

47、納米孔, 而不是嵌入固態(tài)電極. Lindsa及其同事提出了在核酸通過(guò)納米孔時(shí), 使用兩種化學(xué)探針?lè)謩e與磷酸基團(tuán)和堿基基團(tuán)形成氫鍵的設(shè)想. 與中國(guó)科學(xué): 生命科學(xué) 2010年 第40卷 第1期31磷酸基團(tuán)作用的探針起到捕獲核酸的作用, 而與堿基作用的探針起到識(shí)別的作用40. 針對(duì)4種不同的核苷酸, 需要4種不同的探針.另外一些研究團(tuán)隊(duì)正在開(kāi)發(fā)一種固體納米孔生物孔(Biopore. 其中一個(gè)團(tuán)隊(duì)利用改造了MspA 蛋白質(zhì)構(gòu)建了生物納米孔, 用以分析單鏈DNA 分 子41. 他們證實(shí)單鏈DNA 分子可以通過(guò)這個(gè)生物孔. Oxford Nanopore Technologies與牛津大學(xué)合作, 正設(shè)計(jì)

48、另外一種基因工程蛋白質(zhì)納米孔. 通過(guò)遺傳工程改造, 他們已經(jīng)可以構(gòu)建一種將氨基化環(huán)糊精(Am- inocyclodextrin 配體共價(jià)連接到位于脂雙層膜中的-溶血蛋白內(nèi)生物納米孔42. 最近, 他們證實(shí)驅(qū)動(dòng)4種核苷酸單磷酸(dNMPs通過(guò)生物孔, 通過(guò)納米孔的電流將分別減少到4種不同的狀態(tài), 每種狀態(tài)都與一種核苷酸單磷酸相對(duì)應(yīng)43. 將這一機(jī)制與外切酶將核苷酸從DNA 鏈上切除并釋放出來(lái)相結(jié)合, 提供了另外一種納米孔測(cè)序技術(shù). 為了做到這一點(diǎn), 至關(guān)重要的是外切酶的固定方式, 以確保切除下來(lái)的核苷酸單磷酸能被嚴(yán)格單一地運(yùn)送并通過(guò)納米孔.除了堿基的檢測(cè), 控制DNA 的運(yùn)動(dòng)以及通過(guò)納米孔的速度

49、也是非常重要和具有挑戰(zhàn)性的. DNA高速移動(dòng)通過(guò)納米孔具備了開(kāi)發(fā)超高速測(cè)序方法的可能. 但是, 如果DNA 鏈通過(guò)孔隙速度過(guò)快, 用來(lái)確定每個(gè)堿基的時(shí)間就非常短. 在DNA 隨機(jī)運(yùn)動(dòng)以及DNA 分子與納米孔表面非特異作用的情況下, 這種情況還可能更加嚴(yán)重44. 所有這些增加了DNA 分子轉(zhuǎn)位通過(guò)納米孔速度的不確定性. 盡管可以通過(guò)降低溫度、增加溶液黏度、降低納米孔的偏好性等降低DNA 通過(guò)的速度, 但速度的變化還是一個(gè)問(wèn)題. 對(duì)于克服這一困難有種種設(shè)想. 其中之一是想法是將某種類型的進(jìn)行性酶(Processive Enzyme加入與通過(guò)的DNA 鏈結(jié)合45. 這將顯著降低移動(dòng)的速度. 最近,

50、IBM 宣布了其納米孔裝置, 被稱為DNA 晶體管46, 將納米孔嵌入金屬層中, 形成可以通過(guò)調(diào)控將DNA 分子捕獲在納米孔內(nèi)的金屬介質(zhì)結(jié)構(gòu). 計(jì)算機(jī)模擬表明, 經(jīng)過(guò)周期性的門電位的開(kāi)關(guān), 每次將一個(gè)堿基通過(guò)納米孔是可行的, 這就給探測(cè)通過(guò)的核苷酸留出了充足的時(shí)間.(3 石墨烯和碳納米管. 石墨烯是由碳原子構(gòu)成的二維晶體, 碳原子排列與石墨的單原子層一樣. 非常穩(wěn)定并具有非常良好的導(dǎo)電性, 非常適合制作核酸測(cè)序用電極的材料. 有種設(shè)想是在石墨烯上打出一個(gè)大約1 nm寬的縫隙47. 引導(dǎo)DNA 分子垂直通過(guò)縫隙. 當(dāng)DNA 通過(guò)時(shí), 縫隙兩邊的石墨烯邊緣可以作為電極來(lái)確定核酸的序列. 除了在石墨

51、烯上打出這樣一個(gè)縫隙是一種挑戰(zhàn)之外, 控制DNA 的運(yùn)動(dòng)、移動(dòng)的方向以及通過(guò)縫隙的速度同樣是不小的障礙.由于其獨(dú)特的電物理特性及其納米尺度的結(jié)構(gòu), 雖然到目前為止還沒(méi)有開(kāi)發(fā)出任何裝置, 但是碳納米管(CNT在高速DNA 測(cè)序中已經(jīng)表現(xiàn)出了巨大的潛力. 已經(jīng)有工作表明, 碳納米管表面同DNA 分子之間可以高度的互相作用, 甚至是與序列特異性相關(guān)48. 長(zhǎng)的基因組單鏈DNA 可以纏繞在一條單壁碳納米管上, 形成一個(gè)穩(wěn)定的DNA-碳納米管復(fù)合物49. 計(jì)算機(jī)模擬表明, 引入的4種核苷酸表現(xiàn)出獨(dú)特的局部密度50. 這是碳納米管可以單獨(dú)或者與其他技術(shù)整合作為電測(cè)序的候選材料. 這些設(shè)想還停留在理論驗(yàn)證階

52、段.2 展望回顧了30多年來(lái)測(cè)序技術(shù)的進(jìn)展以及可能產(chǎn)生的突破, 難免會(huì)產(chǎn)生這樣的問(wèn)題未來(lái)幾年內(nèi)將發(fā)生什么?對(duì)于測(cè)序技術(shù)的參數(shù)有什么樣的展望?千美元人基因組(TDG和百美元人基因組(HDG技術(shù)將在何處產(chǎn)生?什么時(shí)候能產(chǎn)生?千美元人基因組以及百美元人基因組這兩個(gè)目標(biāo)是要實(shí)現(xiàn)以現(xiàn)有序列為參照, 將測(cè)定一個(gè)人基因組的全部成本控制在1000美元和100美元之內(nèi). 本節(jié)將討論這些問(wèn)題.2.1 技術(shù)融合現(xiàn)在不能確定哪種改變游戲規(guī)則的想法或革命性的技術(shù)最終能實(shí)現(xiàn)千美元人基因組甚至是百美元人基因組的目標(biāo), 并將人們帶到充滿希望的基因組研究新領(lǐng)域. 回顧3代測(cè)序平臺(tái)的技術(shù)進(jìn)展, 發(fā)現(xiàn)有一點(diǎn)是非常明確的, 即固態(tài)技

53、術(shù)與生物化學(xué)的聯(lián)姻. 另外, 技術(shù)的融合將從生物化學(xué)或化學(xué)手段向物理手段發(fā)展(表2. 相信這一趨勢(shì)將持續(xù)下去. 下一代測(cè)序儀將可能根本不使用生物化學(xué)方法, 而納米技術(shù)將可能發(fā)揮更大的作用.周曉光等: 下一代測(cè)序技術(shù): 技術(shù)回顧與展望 32表2 測(cè)序技術(shù)的發(fā)展依賴于學(xué)科含量交叉增加并向微納技術(shù)傾斜關(guān)鍵技術(shù) 第1代 2.12.2代 2.3代第3代DNA 雜交 DNA 聚合酶法測(cè)序 PCR 擴(kuò)增 電泳 光電子 微流體 微納米工藝 單分子檢測(cè)2.2 測(cè)序通量與序列讀長(zhǎng)測(cè)序通量和數(shù)據(jù)讀長(zhǎng)是測(cè)序技術(shù)相對(duì)立的兩個(gè)選擇. 從第一代到下一代測(cè)序技術(shù), 可以看到測(cè)序通量顯著改善, 但讀長(zhǎng)也顯著縮短. 正如前面章節(jié)

54、所述, 這主要是由于同一DNA 簇中, DNA鏈的化合物延伸不同步所致. 用戶只能在低通量且具有較長(zhǎng)的讀長(zhǎng)(如第一代測(cè)序儀 與高通量且具有較短的讀長(zhǎng)(如下一代測(cè)序儀 的測(cè)序平臺(tái)之間進(jìn)行取舍. 這種情況在單分子測(cè)序中將得到改變. 例如Pacific Biosciences的零基波導(dǎo)技術(shù), 能同時(shí)實(shí)現(xiàn)超高的通量與較長(zhǎng)的讀長(zhǎng). 假如沒(méi)有光學(xué)檢測(cè)能力的限制, 通量和讀長(zhǎng)將僅受到DNA 聚合酶的合成速度和連續(xù)性的限制. 未來(lái)一代的基于納米孔的測(cè)序技術(shù), 當(dāng)線性DNA 通過(guò)納米孔結(jié)構(gòu), 一個(gè)接一個(gè)的核苷酸被確定下來(lái)時(shí), 也可以同時(shí)實(shí)現(xiàn)高通量和較長(zhǎng)讀長(zhǎng). 原則上, 一個(gè)納米孔結(jié)構(gòu)單次測(cè)序讀長(zhǎng)僅僅受到可能通過(guò)

55、納米孔結(jié)構(gòu)未經(jīng)剪切的非常長(zhǎng)的線狀DNA 鏈的長(zhǎng)度限制. 已經(jīng)證實(shí)長(zhǎng)達(dá)5.4 kb的線狀DNA 可以通過(guò)固態(tài)的納米 孔37. 因此, 預(yù)計(jì)新一代的測(cè)序儀在具有超高通量的同時(shí), 其讀長(zhǎng)也將輕易超過(guò)Sanger 設(shè)備.2.3 測(cè)序成本與生產(chǎn)能力經(jīng)驗(yàn)曲線過(guò)去30年中, 在測(cè)序成本急劇下降的同時(shí), 測(cè)序通量(生產(chǎn)能力 呈指數(shù)提高. 前面提過(guò), 有人將這種巨變與IT 工業(yè)相提并論. 實(shí)際上在某些方面, DNA測(cè)序的改變速度已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)了半導(dǎo)體工業(yè)的摩爾定律的描述. 圖3以對(duì)數(shù)坐標(biāo)顯示了過(guò)去數(shù)年中測(cè)序成本(以美元每人類基因組為單位 以及生產(chǎn)能力(以每天每臺(tái)儀器核苷酸數(shù)目為單位 隨時(shí)間的變化. 觀察這些曲線可

56、以發(fā)現(xiàn), 正如預(yù)期, 在過(guò)去30多年, 測(cè)序成本的降低以及通量的提高均呈指數(shù)變化. 仔細(xì)觀察可見(jiàn), 另一個(gè)有趣的現(xiàn)象: 兩條曲線的圖3 測(cè)序費(fèi)用與產(chǎn)量的發(fā)展變化中國(guó)科學(xué): 生命科學(xué) 2010年 第40卷 第1期 33斜率都在2005年左右出現(xiàn)拐點(diǎn). 這意味著從那時(shí)開(kāi)始, 測(cè)序成本降低和通量提高的改變速度從那時(shí)開(kāi)始加快. 這正是下一代測(cè)序儀開(kāi)始進(jìn)入實(shí)驗(yàn)室的時(shí)間. 拐點(diǎn)兩側(cè)的斜率都接近線性, 表明兩個(gè)階段有兩種不同的因素驅(qū)動(dòng)測(cè)序生產(chǎn)能力的提高: 一種是世代內(nèi)的技術(shù)改進(jìn)提高了生產(chǎn)能力并降低了成本, 而另一種是通過(guò)技術(shù)突破.生產(chǎn)能力和成本的關(guān)系, 可以描述為經(jīng)驗(yàn)曲線(又名學(xué)習(xí)曲線 效應(yīng)的模型. 這種效

57、應(yīng)表明, 隨著更多得執(zhí)行某項(xiàng)任務(wù), 任務(wù)的成本也隨之降低. 這一模型在20世紀(jì)30年代中期, 由Theodore Wright最早量化, 并成功應(yīng)用于提高飛機(jī)產(chǎn)量和降低成本的項(xiàng)目中51. 從那時(shí)起, 該模型已在許多行業(yè)被用來(lái)研究生產(chǎn)能力和成本的關(guān)系. 本研究以測(cè)序成本與測(cè)序通量為坐標(biāo)(在對(duì)數(shù)坐標(biāo)中 繪制了從2005年以來(lái)兩者隨時(shí)間的變化, 獲得了第2代測(cè)序技術(shù)的經(jīng)驗(yàn)曲線(圖4. 近乎線性的曲線呈現(xiàn)了典型的經(jīng)驗(yàn)曲線效應(yīng), 當(dāng)生產(chǎn)能力增加一定倍數(shù)的同時(shí), 成本也按照一定的百分比降低. 線性的經(jīng)驗(yàn)曲線偶爾可能突然中斷. 這種中斷反映了技術(shù)過(guò)時(shí)或者已被更新的技術(shù)所取代的過(guò)程. 正如前面所討論, 從20

58、05年前后第2和第2代測(cè)序技術(shù)變化中所觀察到的現(xiàn)象. 自2005年以來(lái), 一個(gè)數(shù)量級(jí)的測(cè)序通量變化與1.8個(gè)數(shù)量級(jí)的測(cè)序成本降低相對(duì)應(yīng).2.4 千美元基因組(TDG和百美元基因組(HDG 由圖4的經(jīng)驗(yàn)曲線推測(cè)可得, 第2代測(cè)序技術(shù)(包括目前正在開(kāi)發(fā)的單分子測(cè)序技術(shù) 中, 千美元基因組與百美元基因組的目標(biāo)將分別在每天每臺(tái)測(cè)序儀測(cè)序通量達(dá)到20 G與70 G時(shí)實(shí)現(xiàn). 如果這一趨勢(shì)保持下去, 千美元基因組可能相當(dāng)快, 在12年內(nèi)實(shí)圖4 第2代測(cè)序技術(shù)費(fèi)用和產(chǎn)量發(fā)展經(jīng)驗(yàn)曲線現(xiàn). 基于相同的模型, 百美元基因組可能在23年內(nèi)實(shí)現(xiàn).當(dāng)然, 這些預(yù)測(cè)都是基于本研究的經(jīng)驗(yàn)曲線模型. 同時(shí)存在一些經(jīng)驗(yàn)曲線所無(wú)法預(yù)測(cè)的其他因素, 例如革命性技術(shù)突破或缺少突破. 如果現(xiàn)有的技術(shù)在達(dá)到目標(biāo)之前就宣告失敗, 那么所有的預(yù)測(cè)都將是錯(cuò)誤的. 必須建立新的替

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論