轉(zhuǎn)錄組實(shí)戰(zhàn)講解第三講之測序質(zhì)量評(píng)估和reads回貼_第1頁
轉(zhuǎn)錄組實(shí)戰(zhàn)講解第三講之測序質(zhì)量評(píng)估和reads回貼_第2頁
轉(zhuǎn)錄組實(shí)戰(zhàn)講解第三講之測序質(zhì)量評(píng)估和reads回貼_第3頁
轉(zhuǎn)錄組實(shí)戰(zhàn)講解第三講之測序質(zhì)量評(píng)估和reads回貼_第4頁
轉(zhuǎn)錄組實(shí)戰(zhàn)講解第三講之測序質(zhì)量評(píng)估和reads回貼_第5頁
已閱讀5頁,還剩30頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、長非編碼長非編碼RNA測序分析實(shí)戰(zhàn)講解測序分析實(shí)戰(zhàn)講解之之測序質(zhì)量評(píng)估和測序質(zhì)量評(píng)估和Reads回貼回貼卜德超卜德超中國科學(xué)院計(jì)算技術(shù)研究所中國科學(xué)院計(jì)算技術(shù)研究所2014-12-20概要 長非編碼長非編碼RNA測序介紹測序介紹 一個(gè)測序?qū)嵗粋€(gè)測序?qū)嵗?長非編碼長非編碼RNA分析流程分析流程 步驟一詳解:步驟一詳解:Reads質(zhì)量評(píng)估質(zhì)量評(píng)估 步驟二詳解:基因組比對(duì)步驟二詳解:基因組比對(duì) 附錄:運(yùn)行命令附錄:運(yùn)行命令 長非編碼長非編碼RNA測序介紹測序介紹 一個(gè)測序?qū)嵗粋€(gè)測序?qū)嵗?長非編碼長非編碼RNA分析流程分析流程 步驟一詳解:步驟一詳解:Reads質(zhì)量評(píng)估質(zhì)量評(píng)估 步驟二詳解:基因組

2、比對(duì)步驟二詳解:基因組比對(duì) 附錄:運(yùn)行命令附錄:運(yùn)行命令長非編碼長非編碼RNA測測序序 長非長非編碼編碼RNAs(long non-coding RNAs,lncRNAs)是一類長度大于)是一類長度大于200 nt且不編碼且不編碼蛋白質(zhì)的蛋白質(zhì)的RNAs 長長非編碼非編碼RNA測序:通過測序技術(shù),獲得測序:通過測序技術(shù),獲得某某個(gè)物種或特定細(xì)胞在某一生理?xiàng)l件下產(chǎn)生個(gè)物種或特定細(xì)胞在某一生理?xiàng)l件下產(chǎn)生的所有的所有的的長非編碼長非編碼RNA想測長非編碼RNA,提取RNA的步驟是怎樣的?轉(zhuǎn)錄組內(nèi)的轉(zhuǎn)錄組內(nèi)的RNA 轉(zhuǎn)錄組轉(zhuǎn)錄組RNA,按功能分類:,按功能分類: mRNA 非非編碼編碼RNA(即(即N

3、on-coding RNA,如,如 tRNA,rRNAs,microRNAs,piRNAs 和和lncRNAs等等) 轉(zhuǎn)錄組內(nèi)的轉(zhuǎn)錄組內(nèi)的RNA, 按按polyA形態(tài):形態(tài): 帶帶polyA的的RNA (mRNA和大部分的和大部分的lncRNA) 不帶不帶polyA的的RNA (小小RNA和小部分的和小部分的lncRNA)長非編碼長非編碼RNA測序測序總的總的RNA(200)去掉去掉rRNA后的后的RNA不帶不帶polyA的的RNA帶帶polyA的的RNApolyA富集富集總的總的RNA(200)去掉去掉rRNA后的后的RNA測序測序(mRNA+lncRNA)測序測序(lncRNA)mRNA測

4、序測序(mRNA+lncRNA)方案二方案二方案一方案一 長非編碼長非編碼RNA測序介紹測序介紹 一個(gè)測序?qū)嵗粋€(gè)測序?qū)嵗?長非編碼長非編碼RNA分析流程分析流程 步驟一詳解:步驟一詳解:Reads質(zhì)量評(píng)估質(zhì)量評(píng)估 步驟二詳解:基因組比對(duì)步驟二詳解:基因組比對(duì) 附錄:運(yùn)行命令附錄:運(yùn)行命令9一個(gè)測序?qū)嵗粋€(gè)測序?qū)嵗?取樣:晚期肝癌病人的肝組織取樣:晚期肝癌病人的肝組織( (共共4 4個(gè)個(gè)) ) 癌旁組織癌旁組織(N)(N) 原發(fā)灶原發(fā)灶(P)(P) 轉(zhuǎn)移灶轉(zhuǎn)移灶(M)(M) 門脈血栓轉(zhuǎn)移灶門脈血栓轉(zhuǎn)移灶(V)(V)一組時(shí)間序列上的一組時(shí)間序列上的4個(gè)點(diǎn)的取樣個(gè)點(diǎn)的取樣RNA提取和測序參數(shù)提取和

5、測序參數(shù) RNARNA提取提取 提取帶有提取帶有polyApolyA的所有的所有RNARNA 測序測序 IlluminaIllumina HiseqHiseq 2000 2000測序測序 文庫插入片段長文庫插入片段長300300 雙端測序雙端測序 readsreads長度為長度為100 100 D-UTPD-UTP鏈特異性文庫鏈特異性文庫 長非編碼長非編碼RNA測序介紹測序介紹 一個(gè)測序?qū)嵗粋€(gè)測序?qū)嵗?長非編碼長非編碼RNA分析流程分析流程 步驟一詳解:步驟一詳解:Reads質(zhì)量評(píng)估質(zhì)量評(píng)估 步驟二詳解:基因組比對(duì)步驟二詳解:基因組比對(duì) 附錄:運(yùn)行命令附錄:運(yùn)行命令12轉(zhuǎn)錄組分析的通用套路轉(zhuǎn)

6、錄組分析的通用套路定量定量鑒定鑒定差異差異功能功能有多少有多少RNARNA的表達(dá)量的表達(dá)量結(jié)構(gòu)、表達(dá)量、結(jié)構(gòu)、表達(dá)量、比例的變化比例的變化功能注釋功能注釋測序數(shù)據(jù)和參考基因組比對(duì)測序評(píng)估及低質(zhì)量過濾編碼基因表達(dá)注釋轉(zhuǎn)錄本重構(gòu)長非編碼鑒定長非編碼表達(dá)注釋編碼基因差異(特異)表達(dá)GO功能顯著性富集Pathway顯著性富集功能富集網(wǎng)絡(luò)圖長非編碼差異表達(dá)GO功能顯著性富集Pathway顯著性富集功能富集網(wǎng)絡(luò)圖FusionsJunctionsGenomeBrowser可視化這一堂課這一堂課關(guān)注內(nèi)容關(guān)注內(nèi)容 長非編碼長非編碼RNA測序介紹測序介紹 一個(gè)測序?qū)嵗粋€(gè)測序?qū)嵗?長非編碼長非編碼RNA分析流程分

7、析流程 步驟一詳解:步驟一詳解:Reads質(zhì)量評(píng)估質(zhì)量評(píng)估 步驟二詳解:基因組比對(duì)步驟二詳解:基因組比對(duì) 附錄:運(yùn)行命令附錄:運(yùn)行命令測序下機(jī)數(shù)測序下機(jī)數(shù)據(jù)據(jù)測序輸出的兩個(gè)文件測序輸出的兩個(gè)文件(雙端測序數(shù)據(jù)雙端測序數(shù)據(jù)):N_R1.fastqHWI-EAS724_0001:8:32:374:374#0/1GAGCTGTATATGAATAATAGTTCGTTTTTCATTATCCAAGATGGATCGGTATAAAGTCTGCTAAAATAAAGGTACAACG+HWI-EAS724_0001:8:32:374:374#0/1fcfcfggdfggggfggggcggggggggfgggggc

8、gggfWgggggggggfgcggdgcgcggggfacbbbbgcgggggdN_R2.fastqHWI-EAS724_0001:8:32:374:374#0/2TACCGTTAATAGCAGTAATATCATAATAGTAATAGCATCATAACGGTAGTCCCATAAAAGTGTGTCAGTAGTAGTAGTA+HWI-EAS724_0001:8:32:374:374#0/2ggggfgggggd_adcggggeggfggeggegfgeececdegggggfegcfegggegggfgacacedbd_cYb拿到拿到共共4對(duì)這樣的測序文件對(duì)這樣的測序文件Fastq文件質(zhì)量

9、值表示文件質(zhì)量值表示N_R1.fastqHWI-EAS724_0001:8:32:374:374#0/1GAGCTGTATATGAATAATAGTTCGTTTTTCATTATCCAAGATGGATCGGTATAAAGTCTGCTAAAATAAAGGTACAACG+HWI-EAS724_0001:8:32:374:374#0/1fcfcfggdfggggfggggcggggggggfgggggcgggfWgggggggggfgcggdgcgcggggfacbbbbgcgggggd用字符來表示每個(gè)堿基的質(zhì)量值用字符來表示每個(gè)堿基的質(zhì)量值字符值字符值-如何計(jì)算如何計(jì)算Q值值字符字符ASCII碼碼值值

10、QualityScore錯(cuò)誤率錯(cuò)誤率f102102-64=380.1%c9999-64=350.1%g103103-64=3980%50%比對(duì)結(jié)果好!比對(duì)結(jié)果好!80%10%DNA污染污染40%30% 測序質(zhì)量差、測序質(zhì)量差、10%10%reads接頭、接頭、barcode、ployA等等未去凈未去凈.若雙端中有一端比對(duì)率高,一端比若雙端中有一端比對(duì)率高,一端比對(duì)率很低,則類同第四種情況對(duì)率很低,則類同第四種情況?27TophatTophat回貼原理回貼原理ReadsMappedtothegenomeUnmappedSplitandMappedSearchingthesplicingsiteJ

11、unctions和和Fusions鑒定鑒定 Tophat比對(duì)后的輸出目錄: Junctions.bed Insertions.bed Deletions.bed Tophat-fusion:Fusions鑒定工具Tophat直接報(bào)出直接報(bào)出junctions結(jié)結(jié)果果Tophatfusion:從從tophat的的輸出輸出挖掘挖掘fusions 長非編碼長非編碼RNA測序介紹測序介紹 一個(gè)測序?qū)嵗粋€(gè)測序?qū)嵗?長非編碼長非編碼RNA分析流程分析流程 步驟一詳解:步驟一詳解:Reads質(zhì)量評(píng)估質(zhì)量評(píng)估 步驟二詳解:基因組比對(duì)步驟二詳解:基因組比對(duì) 附錄:運(yùn)行命令附錄:運(yùn)行命令運(yùn)行命令匯總運(yùn)行命令匯總

12、(一一)fastqcoQC_outdir_NN_R1.fastqN_R2.fastq1, 質(zhì)量評(píng)估:質(zhì)量評(píng)估:fastqcoQC_outdir_PP_R1.fastqP_R2.fastqfastqcoQC_outdir_MM_R1.fastqM_R2.fastqfastqcoQC_outdir_VV_R1.fastqV_R2.fastq運(yùn)行命令匯總運(yùn)行命令匯總(二二)tophatotophat_outdir_N-library-typefr-firststrand-fusion-searchhg19N_R1.fastqN_R2.fastq2, 比對(duì)基因組:比對(duì)基因組:tophatotophat

13、outdir_P-library-typefr-firststrand-fusion-searchhg19P_R1.fastqP_R2.fastqtophatotophat_outdir_M-library-typefr-firststrand-fusion-searchhg19M_R1.fastqM_R2.fastqtophatotophat_outdir_V-library-typefr-firststrand-fusion-searchhg19V_R1.fastqV_R2.fastqhg19為基因組的為基因組的bowtie2的的index文件文件運(yùn)行命令匯總運(yùn)行命令匯總(三三)bowti

14、eobwt_outdir_Nrefgene-1N_R1.fastq-2N_R2.fastq-SN.sam3, 比對(duì)轉(zhuǎn)錄組:比對(duì)轉(zhuǎn)錄組:bowtieobwt_outdir_Prefgene-1P_R1.fastq-2P_R2.fastq-SP.sambowtieobwt_outdir_Mrefgene-1M_R1.fastq-2M_R2.fastq-SM.sambowtieobwt_outdir_Vrefgene-1V_R1.fastq-2V_R2.fastq-VP.samrefgene為為bowtie產(chǎn)生的產(chǎn)生的index文件文件運(yùn)行命令匯總運(yùn)行命令匯總(三三)tophat-fusion-posthg194, Fusions鑒定

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論