RNA-seq技術(shù)原理及應(yīng)用_第1頁
RNA-seq技術(shù)原理及應(yīng)用_第2頁
RNA-seq技術(shù)原理及應(yīng)用_第3頁
RNA-seq技術(shù)原理及應(yīng)用_第4頁
RNA-seq技術(shù)原理及應(yīng)用_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、RNA-seq技術(shù)原理及應(yīng)用 主要內(nèi)容主要內(nèi)容 1、RNA-seq技術(shù)簡介技術(shù)簡介 2、RNA-seq技術(shù)原理技術(shù)原理 3、RNA-seq結(jié)果分析結(jié)果分析 4、RNA-seq技術(shù)應(yīng)用技術(shù)應(yīng)用 一、一、RNA-seqRNA-seq技術(shù)簡介技術(shù)簡介 1.誕生于誕生于 20 世紀(jì)世紀(jì) 70 年代的年代的 Sanger 法是最早被法是最早被 廣泛應(yīng)用的廣泛應(yīng)用的 DNA 測序技術(shù),也是完成人類基因組測序技術(shù),也是完成人類基因組 計(jì)劃的基礎(chǔ)。計(jì)劃的基礎(chǔ)。 2. 2005 年以來,以年以來,以 Roche 公司的公司的 454 技術(shù)、技術(shù)、 Illumina 公司的公司的 Solexa 技術(shù)和技術(shù)和 AB

2、I 公司公司的的 SOLiD 技術(shù)為標(biāo)志的新一代測序技術(shù)相繼誕生技術(shù)為標(biāo)志的新一代測序技術(shù)相繼誕生,又稱作深,又稱作深 度測序技術(shù)。度測序技術(shù)。 3.把高通量測序技術(shù)應(yīng)用到由把高通量測序技術(shù)應(yīng)用到由 RNA 逆轉(zhuǎn)錄生成逆轉(zhuǎn)錄生成 的的 cDNA 上,從而獲得來自不同基因的上,從而獲得來自不同基因的RNA 片段在片段在 特定樣本中的含量,這就是特定樣本中的含量,這就是 RNA測序或測序或 RNA-seq。 二、RNA-seq技術(shù)原理 Illumina/Solexa 測序技術(shù)的基本原理是邊合成邊測序技術(shù)的基本原理是邊合成邊 測序,即測序過程是以測序,即測序過程是以 DNA 單鏈為模板,在生成單鏈為

3、模板,在生成 互補(bǔ)鏈時(shí),利用帶熒光標(biāo)記的互補(bǔ)鏈時(shí),利用帶熒光標(biāo)記的 dNTP 發(fā)出不同顏色發(fā)出不同顏色 的熒光來確定不同的堿基。的熒光來確定不同的堿基。 新加入新加入 dNTP 的末端被可逆的保護(hù)基團(tuán)封閉,既的末端被可逆的保護(hù)基團(tuán)封閉,既 保證單次反應(yīng)只能加入一個(gè)堿基,又能在該堿基讀保證單次反應(yīng)只能加入一個(gè)堿基,又能在該堿基讀 取完畢后,將保護(hù)基團(tuán)除去,使得下一個(gè)反應(yīng)可繼取完畢后,將保護(hù)基團(tuán)除去,使得下一個(gè)反應(yīng)可繼 續(xù)進(jìn)行。為了增加熒光強(qiáng)度,使之更易被成像系統(tǒng)續(xù)進(jìn)行。為了增加熒光強(qiáng)度,使之更易被成像系統(tǒng) 所采集,該技術(shù)在測序之前還需要對(duì)待測片段做橋所采集,該技術(shù)在測序之前還需要對(duì)待測片段做橋

4、式擴(kuò)增。式擴(kuò)增。 Shot Gun Shot Gun文庫構(gòu)建文庫構(gòu)建DNADNA片段固定片段固定 簇序列讀取反應(yīng)簇序列讀取反應(yīng) 圖像獲得和處理圖像獲得和處理序列組裝和比較序列組裝和比較 單條模板擴(kuò)增單條模板擴(kuò)增 1234 T T T T T G C T 二、RNA-seq技術(shù)原理 二、RNA-seq技術(shù)原理 RNA-seqRNA-seq實(shí)驗(yàn)流程圖實(shí)驗(yàn)流程圖 為了便于測序數(shù)據(jù)的發(fā)布和共享,高通量測序數(shù)據(jù)以為了便于測序數(shù)據(jù)的發(fā)布和共享,高通量測序數(shù)據(jù)以 FASTQ 格式來記錄所測的堿基讀段和質(zhì)量分?jǐn)?shù)。格式來記錄所測的堿基讀段和質(zhì)量分?jǐn)?shù)。 NCBI、EBI、 DDBJ 等數(shù)據(jù)中心建立了大容量的數(shù)據(jù)庫

5、等數(shù)據(jù)中心建立了大容量的數(shù)據(jù)庫 SRA來存放共享的測來存放共享的測 序數(shù)據(jù)。序數(shù)據(jù)。 三、RNA-seqRNA-seq結(jié)果分析結(jié)果分析 三、RNA-seqRNA-seq結(jié)果分析結(jié)果分析 RNA-seq 數(shù)據(jù)的基本處理數(shù)據(jù)的基本處理 1. 序列定位算法序列定位算法 (1)空位種子索引法:首先將讀段切分,并選取其中一段)空位種子索引法:首先將讀段切分,并選取其中一段 或幾段作為種子建立搜索索引,再通過查找索引、延展匹配來或幾段作為種子建立搜索索引,再通過查找索引、延展匹配來 實(shí)現(xiàn)讀段定位實(shí)現(xiàn)讀段定位 ,通過輪換種子考慮允許出現(xiàn)錯(cuò)配的各種可能的,通過輪換種子考慮允許出現(xiàn)錯(cuò)配的各種可能的 位置組合(位

6、置組合(Maq)。 (2) Burrows-Wheeler 轉(zhuǎn)換技術(shù):通過轉(zhuǎn)換技術(shù):通過B-W 轉(zhuǎn)換將基因組轉(zhuǎn)換將基因組 序列按一定規(guī)則壓縮并建立索引,再通過查找和回溯來定位讀序列按一定規(guī)則壓縮并建立索引,再通過查找和回溯來定位讀 段,在查找時(shí)可通過堿基替代來實(shí)現(xiàn)允許的錯(cuò)配(段,在查找時(shí)可通過堿基替代來實(shí)現(xiàn)允許的錯(cuò)配(Bowtie)。 (3)改進(jìn)的改進(jìn)的 SmithWaterman 動(dòng)態(tài)規(guī)劃算法:隨著讀長的動(dòng)態(tài)規(guī)劃算法:隨著讀長的 增加,允許讀段序列中存在插入刪除增加,允許讀段序列中存在插入刪除(indel)的定位(的定位(BFAST、 SHRiMP、Mosaik)。)。 三、RNA-seqR

7、NA-seq結(jié)果分析結(jié)果分析 2. 基因表達(dá)水平估計(jì)基因表達(dá)水平估計(jì) RNA-seq 數(shù)據(jù)最基本的應(yīng)用是檢測基因的表達(dá)水?dāng)?shù)據(jù)最基本的應(yīng)用是檢測基因的表達(dá)水 平平 ,與基因芯片數(shù)據(jù)相比,與基因芯片數(shù)據(jù)相比 ,RNA 測序得到的是數(shù)字測序得到的是數(shù)字 化的表達(dá)信號(hào),具有靈敏度高、分辨率高、無飽和區(qū)化的表達(dá)信號(hào),具有靈敏度高、分辨率高、無飽和區(qū) 等優(yōu)勢等優(yōu)勢。 RNA 測序數(shù)據(jù)是對(duì)提取出的測序數(shù)據(jù)是對(duì)提取出的 RNA 轉(zhuǎn)錄本中隨機(jī)轉(zhuǎn)錄本中隨機(jī) 進(jìn)行的短片段測序,如果一個(gè)轉(zhuǎn)錄本的豐度高,則測進(jìn)行的短片段測序,如果一個(gè)轉(zhuǎn)錄本的豐度高,則測 序后定位到其對(duì)應(yīng)的基因組區(qū)域的讀段也就多,可以序后定位到其對(duì)應(yīng)的

8、基因組區(qū)域的讀段也就多,可以 通過對(duì)定位到基因外顯子區(qū)的讀段計(jì)數(shù)來估計(jì)基因表通過對(duì)定位到基因外顯子區(qū)的讀段計(jì)數(shù)來估計(jì)基因表 達(dá)水平達(dá)水平。 三、RNA-seqRNA-seq結(jié)果分析結(jié)果分析 3. 選擇性剪接事件識(shí)別和剪接異構(gòu)體表達(dá)水平推斷選擇性剪接事件識(shí)別和剪接異構(gòu)體表達(dá)水平推斷 只要測序深度足夠深,就能檢測到所有轉(zhuǎn)錄本的全只要測序深度足夠深,就能檢測到所有轉(zhuǎn)錄本的全 部序列,包括來自剪接接合區(qū)的序列部序列,包括來自剪接接合區(qū)的序列。Tophat 等軟件等軟件 定位剪接接合區(qū)讀段的策略能標(biāo)定出剪接事件中的兩定位剪接接合區(qū)讀段的策略能標(biāo)定出剪接事件中的兩 個(gè)剪接位點(diǎn):供體位點(diǎn)和受體位點(diǎn)個(gè)剪接位點(diǎn)

9、:供體位點(diǎn)和受體位點(diǎn)。通過比較供體位通過比較供體位 點(diǎn)和受體位點(diǎn)的組合,就能識(shí)別選擇性剪接事件點(diǎn)和受體位點(diǎn)的組合,就能識(shí)別選擇性剪接事件。 進(jìn)一步,通過對(duì)供體和受體位點(diǎn)的讀段計(jì)數(shù),結(jié)合進(jìn)一步,通過對(duì)供體和受體位點(diǎn)的讀段計(jì)數(shù),結(jié)合 外顯子其他區(qū)域的讀段數(shù)據(jù),還能定量地計(jì)算選擇性外顯子其他區(qū)域的讀段數(shù)據(jù),還能定量地計(jì)算選擇性 剪接事件之間的比例。剪接事件之間的比例。 三、RNA-seqRNA-seq結(jié)果分析結(jié)果分析 三、RNA-seqRNA-seq結(jié)果分析結(jié)果分析 兩類樣本兩類樣本 RNA-seq 數(shù)據(jù)比較分析的框架數(shù)據(jù)比較分析的框架 四、RNA-seq技術(shù)應(yīng)用 1、轉(zhuǎn)錄本結(jié)構(gòu)研究、轉(zhuǎn)錄本結(jié)構(gòu)研究

10、 利用單堿基分辨率的利用單堿基分辨率的RNA-Seq技術(shù)可極大地豐技術(shù)可極大地豐 富基因注釋的很多方面內(nèi)容富基因注釋的很多方面內(nèi)容, 包括包括 5/3邊界鑒定、邊界鑒定、 UTRs區(qū)域鑒定以及新的轉(zhuǎn)錄區(qū)域鑒定等。區(qū)域鑒定以及新的轉(zhuǎn)錄區(qū)域鑒定等。RNA-Seq 還可對(duì)可變剪接還可對(duì)可變剪接(Alternative splicing)進(jìn)行定量研究。進(jìn)行定量研究。 2、轉(zhuǎn)錄本變異研究、轉(zhuǎn)錄本變異研究 在發(fā)現(xiàn)序列差異方面,如融合基因鑒定、編碼在發(fā)現(xiàn)序列差異方面,如融合基因鑒定、編碼 序列多態(tài)性研究等,序列多態(tài)性研究等,RNA-seq也具有很大的潛力。也具有很大的潛力。 四、RNA-seq技術(shù)應(yīng)用 3、非編碼區(qū)域功能研究、非編碼區(qū)域功能研究 轉(zhuǎn)錄組學(xué)研究的一個(gè)重要方面就是發(fā)現(xiàn)和分轉(zhuǎn)錄組學(xué)研究的一個(gè)重要方面就是發(fā)現(xiàn)和分 析析 ncRNA,在表觀遺傳、轉(zhuǎn)錄及轉(zhuǎn)錄后等多個(gè)層面,在表觀遺傳、轉(zhuǎn)錄及轉(zhuǎn)錄后等多個(gè)層面 調(diào)控基因表達(dá)。調(diào)控基因表達(dá)。 4、基因表達(dá)水平研究、基因表達(dá)水平研究 RNA-Seq一個(gè)特別強(qiáng)大的優(yōu)勢是它可以捕捉不同一個(gè)特別強(qiáng)大的優(yōu)勢是它可以捕捉不同 組織或狀態(tài)下的轉(zhuǎn)錄組動(dòng)態(tài)變化而無需對(duì)數(shù)據(jù)集進(jìn)組織或狀態(tài)下的轉(zhuǎn)錄組動(dòng)態(tài)變化而無需對(duì)數(shù)據(jù)集進(jìn) 行復(fù)雜的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論