第二代測(cè)序簡(jiǎn)介_第1頁(yè)
第二代測(cè)序簡(jiǎn)介_第2頁(yè)
第二代測(cè)序簡(jiǎn)介_第3頁(yè)
第二代測(cè)序簡(jiǎn)介_第4頁(yè)
第二代測(cè)序簡(jiǎn)介_第5頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二代測(cè)序簡(jiǎn)介

劉云山第一代測(cè)序第一代技術(shù)主要采用1977年Sanger發(fā)明的末端終止測(cè)序法在每一輪的Sanger測(cè)序反應(yīng)中,在鏈延伸的同時(shí)加入熒光標(biāo)記過的ddNTP,被結(jié)合的鏈將終止合成反應(yīng),沒有被結(jié)合的將繼續(xù)根據(jù)模板鏈合成,一直重復(fù)這樣的過程直到所有的合成反應(yīng)都被終止。這樣將得到大量長(zhǎng)短—末端被同熒光標(biāo)記的序列,通過電泳對(duì)以將不同長(zhǎng)度的序列分離開,這樣就可以逐個(gè)堿基的讀出整個(gè)序列了。一個(gè)反應(yīng)所測(cè)的序列不可能太長(zhǎng),通常為1000個(gè)核苷酸左右,測(cè)序通量不大,且測(cè)序反應(yīng)費(fèi)時(shí)費(fèi)力;由于DNA聚合酶造成的堿基錯(cuò)配,因此測(cè)序的準(zhǔn)確度并不高;基于技術(shù)的基因組測(cè)序十分昂貴,從基因組中預(yù)測(cè)基因的方法也十分有限。測(cè)序技術(shù)的發(fā)展90年代:DNA芯片技術(shù)21世紀(jì):第二代高通量測(cè)序技術(shù)第二代測(cè)序第二代測(cè)序,即大規(guī)模平行測(cè)序平臺(tái),具有通量大,讀長(zhǎng)短的特點(diǎn)。代表技術(shù): Illumina公司遺傳分析儀

(Solexa)

:邊合成邊測(cè)序法; Roche公司的454平臺(tái):焦磷酸合成測(cè)序法; ABI公司推出的SOLiD系統(tǒng):邊連接邊測(cè)序法。Illumina-Solexa基本流程:1.構(gòu)建測(cè)序文庫(kù)。提取基因組DNA,隨機(jī)打斷成100~200bp片段,末端加上接頭;2.橋式擴(kuò)增。解鏈后的單鏈DNA片段兩端被分別固定于芯片上,形成橋狀結(jié)構(gòu),進(jìn)行橋式PCR擴(kuò)增。經(jīng)過PCR擴(kuò)增,產(chǎn)生數(shù)百萬(wàn)條待測(cè)的DNA片段,隨后被線性化;3.測(cè)序。將熒光標(biāo)記的dNTP、聚合酶、引物加入到測(cè)序通道啟動(dòng)測(cè)序循環(huán)。DNA合成時(shí),伴隨著堿基的加入會(huì)有焦磷酸被釋放,從而發(fā)出熒光,不同堿基用不同熒光標(biāo)記,讀取到核苷酸發(fā)出的熒光后,將3′羥基末端切割,隨后加入第2個(gè)核苷酸,重復(fù)第一個(gè)核苷酸的步驟,直到模板序列全部被合成雙鏈DNA。特點(diǎn):測(cè)序通量大、速度快、成本低;性價(jià)比最高。Illumina-SolexaFlow-cellRoche-454基本流程:1.構(gòu)建測(cè)序文庫(kù)。將基因組DNA打碎成300~800bp的片段后,在兩端加上錨定接頭;2.乳液PCR擴(kuò)增。每個(gè)含有接頭的DNA片段被固定在特定的磁珠上,進(jìn)行乳液PCR擴(kuò)增。多個(gè)循環(huán)后,磁珠表面被打破,擴(kuò)增產(chǎn)生的成千上萬(wàn)個(gè)拷貝仍然在磁珠表面;3.焦磷酸測(cè)序。將磁珠轉(zhuǎn)移到PTP板上,每個(gè)PTP板上的小孔只能容下1個(gè)磁珠。分別裝有A、T、C、G4種堿基的試劑瓶,依次進(jìn)入PTP板,每次只進(jìn)1個(gè)堿基,如果發(fā)生配對(duì),就會(huì)釋放1個(gè)焦磷酸,釋放出的熒光信號(hào)會(huì)被CCD捕獲到。每個(gè)堿基反應(yīng)都會(huì)捕獲到1個(gè)熒光信號(hào),由此一一對(duì)應(yīng),模板的堿基序列由此獲得。特點(diǎn):讀長(zhǎng)長(zhǎng),但是準(zhǔn)確率低、成本高。Roche-454乳化:形成油包水的混合物。ABI-SOLiD基本流程:

1.文庫(kù)制備。將基因組DNA打斷,在其兩頭加上接頭,構(gòu)建成文庫(kù);2.乳液PCR/磁珠富集。此過程與454測(cè)序技術(shù)類似,不過SOLiD的微珠只有1μm;3.連接測(cè)序?;旌系模笁A基單鏈熒光探針為連接反應(yīng)的底物,探針的5′端用4色熒光標(biāo)記,3′端第1、2位堿基對(duì)應(yīng)5′端熒光信號(hào)的顏色。因?yàn)橹挥兴纳珶晒猓矀€(gè)堿基卻有16個(gè)組合情況,故4種堿基對(duì)應(yīng)一種顏色的熒光。單次測(cè)序由5輪測(cè)序反應(yīng)組成,反應(yīng)后得到的為原始顏色序列。特點(diǎn):通量最大,最準(zhǔn)確(>99.94%);但讀長(zhǎng)最短,雙末端測(cè)序困難。ABI-SOLiDSingle-read,Paired-end,Mate-pair單末端測(cè)序(Single-read):,首先將DNA樣本進(jìn)行片段化處理形成200-500bp的片段,引物序列連接到DNA片段的一端,然后末端加上接頭,將片段固定在flowcell上生成DNA簇,上機(jī)測(cè)序單端讀取序列。這種方法較簡(jiǎn)單,但是它只有一端有拼接信息,不利于拼裝;Single-read,Paired-end,Mate-pair雙末端測(cè)序(Paired-end):構(gòu)建待測(cè)DNA文庫(kù)時(shí)在兩端的接頭上都加上測(cè)序引物結(jié)合位點(diǎn),在第一輪測(cè)序完成后,去除第一輪測(cè)序的模板鏈,用對(duì)讀測(cè)序模塊(Paired-End

Module)引導(dǎo)互補(bǔ)鏈在原位置再生和擴(kuò)增,以達(dá)到第二輪測(cè)序所用的模板量,進(jìn)行第二輪互補(bǔ)鏈的合成測(cè)序。Single-read,Paired-end,Mate-pairMate-pair文庫(kù)制備:旨在生成一些短的DNA片段,這些片段包含基因組中較大跨度(2-10kb)片段兩端的序列,更具體地說:首先將基因組DNA隨機(jī)打斷到特定大小(2-10kb范圍可選);然后經(jīng)末端修復(fù),生物素標(biāo)記和環(huán)化等實(shí)驗(yàn)步驟后,再把環(huán)化后的DNA分子打斷成400-600bp的片段并通過帶有鏈親和霉素的磁珠把那些帶有生物素標(biāo)記的片段捕獲。這些捕獲的片段再經(jīng)末端修飾和加上特定接頭后建成mate-pair文庫(kù),然后上機(jī)測(cè)序。第二代測(cè)序的應(yīng)用

——基因組學(xué)與轉(zhuǎn)錄組學(xué)基因組從頭測(cè)序及重測(cè)序從頭測(cè)序:

denovosequencing,主要應(yīng)用于基因組序列未知的物種,DNA片段測(cè)序后,用生物信息學(xué)軟件對(duì)序列進(jìn)行拼接、組裝,從而獲得該物種的基因組序列圖譜。重測(cè)序是指該物種基因組序列已被測(cè)序,有參考基因組序列的測(cè)序工作。由于第2代測(cè)序技術(shù)測(cè)序讀長(zhǎng)較短,完成基因組的從頭測(cè)序一般需要第一代測(cè)序技術(shù)的輔助,但是可以完成簡(jiǎn)單生物的基因組從頭測(cè)序及所有生物的基因組重測(cè)序。在第二代測(cè)序技術(shù)的推動(dòng)下,大量生物的全基因組被順利測(cè)序,大量物種的基因組計(jì)劃完成?;蚪M研究策略

主要分為基因組測(cè)序、基因組組裝、基因組完成、基因預(yù)測(cè)、基因注釋和基因組比較分析六大部分。

第一步:DNA的提取及測(cè)序。

常用平臺(tái)有:Solexa、454、SOLiD。第二步:基因組組裝。

常用的軟件有Newbler、AMOScmp、Phred/Phrap/Consed和Velvet等。第三步:基因組完成。即確定組裝獲得的Contigs之間的連接順序并修補(bǔ)Gaps。第四步:基因預(yù)測(cè)。常用的蛋白質(zhì)編碼基因預(yù)測(cè)軟件有Glimmer、GeneMarkS和Prodigal。第五步:基因注釋。通常要整合多個(gè)數(shù)據(jù)庫(kù),通過序列比對(duì)進(jìn)行預(yù)測(cè)基因的注釋。第六步:基因組比較分析。通常會(huì)進(jìn)行相近物種之間或同一物種不同個(gè)體之間的基因組比較分析。轉(zhuǎn)錄組研究?jī)?nèi)容

轉(zhuǎn)錄本結(jié)構(gòu)的研究(起始密碼子鑒定、內(nèi)含子邊界確定、UTR確定、可變剪切等),表達(dá)量研究,SNP(單核苷酸多態(tài)性)位點(diǎn)研究,新轉(zhuǎn)錄本檢測(cè),非編碼區(qū)功能研究(小RNA、非編碼RNA的研究)

轉(zhuǎn)錄組:是指在特定的發(fā)育階段和生理?xiàng)l件下細(xì)胞中轉(zhuǎn)錄產(chǎn)生的所有轉(zhuǎn)錄物,包括mRNA、rRNA、tRNA和其他的非編碼RNA,狹義上也可以指細(xì)胞所能轉(zhuǎn)錄出的所有mRNA,這個(gè)術(shù)語(yǔ)適用的范圍是一個(gè)給定的有機(jī)體、組織或者特定的細(xì)胞集合。轉(zhuǎn)錄組學(xué)(transcriptomics):是一門從整體水平上研究基因轉(zhuǎn)錄情況和轉(zhuǎn)錄調(diào)控規(guī)律的學(xué)科。轉(zhuǎn)錄組學(xué)研究分為序列水平與表達(dá)量水平兩個(gè)層面的內(nèi)容,這兩個(gè)層面綜合在一起完整的反映了生物體遺傳信息的表達(dá)方式。序列水平的研究:包括對(duì)未知轉(zhuǎn)錄本的探索以及對(duì)同一個(gè)基因在不同樣品中的序列差異分析。表達(dá)量水平的研究:可以加深了解生物體基因調(diào)節(jié)的過程和特殊性狀產(chǎn)生的分子機(jī)制。RNA-seq:基于第二代測(cè)序平臺(tái)的轉(zhuǎn)錄組測(cè)序技術(shù)。轉(zhuǎn)錄組研究策略第一步:RNA提取和測(cè)序。提取總RNA,進(jìn)行預(yù)處理;將預(yù)處理后的RNA打斷后反轉(zhuǎn)錄成cDNA,在兩端加上接頭后固定到測(cè)序芯片上;隨后對(duì)測(cè)序芯片上的每個(gè)cDNA進(jìn)行擴(kuò)增和測(cè)序,測(cè)到的每一段序列都是一個(gè)read。測(cè)得的所有reads就包含了樣品中的轉(zhuǎn)錄組信息。第二步,檢查reads質(zhì)量。當(dāng)二代測(cè)序的原始數(shù)據(jù)拿到手之后,第一步要做的就是看一看原始reads的質(zhì)量,常用的工具就是fastqc。轉(zhuǎn)錄組研究策略橫軸代表位置,縱軸quality。紅色表示中位數(shù),黃色是25%-75%區(qū)間,觸須是10%-90%區(qū)間,藍(lán)線是平均數(shù)。若任一位置的下四分位數(shù)低于10或中位數(shù)低于25,報(bào)"WARN";若任一位置的下四分位數(shù)低于5或中位數(shù)低于20,"FAIL".第三步,Readsmapping首先將Reads進(jìn)行Mapping,從而獲得Reads在基因組上的位置,常用的Mapping軟件有BWA、Bowtie、SOAP2等?;诤缶YTrie思想的Burrows-Wheeler轉(zhuǎn)換可以用“循環(huán)、排序”四個(gè)字來概括.將基因組序列按一定規(guī)則壓縮并建立索引,再通過查找和回溯來定位讀段,在查找時(shí)可通過堿基替代來實(shí)現(xiàn)允許的錯(cuò)配。轉(zhuǎn)錄組研究策略轉(zhuǎn)錄組研究策略第四步,根據(jù)Readsmapping結(jié)果,進(jìn)行后繼分析。TSS鑒定:根據(jù)基因組上的Readscoverage來鑒定轉(zhuǎn)錄起始位點(diǎn);5′UTR和3′UTR鑒定:鑒定編碼基因中轉(zhuǎn)錄但不翻譯的區(qū)域,即5′UTR和3′UTR;Operon鑒定:根據(jù)TSS、Readscoverage等鑒定;新基因鑒定:找出之前沒有注釋但是表達(dá)的區(qū)域,并根據(jù)是否存在ORF區(qū)分為蛋白質(zhì)編碼基因(Codinggene)和非蛋白質(zhì)編碼基因(SmallRNAgene);AntisenseRNA鑒定:根據(jù)SmallRNA與其他基因的位置關(guān)系確定是否是AntisenseRNA;Pseudogenes分析:

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論