外顯子組測序_第1頁
外顯子組測序_第2頁
外顯子組測序_第3頁
外顯子組測序_第4頁
外顯子組測序_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、外顯子外顯子組測序組測序目 錄一、外顯子測序簡介一、外顯子測序簡介二、測序深度二、測序深度三、測序平臺三、測序平臺四、數(shù)據(jù)分析流程四、數(shù)據(jù)分析流程五、數(shù)據(jù)分析內(nèi)容五、數(shù)據(jù)分析內(nèi)容六、后期驗證六、后期驗證 外顯子測序(也稱目標外顯子組捕獲)是指利用序列捕獲技術將全基因組外顯子區(qū)域DNA捕捉并富集后進行高通量測序的基因組分析方法。是一種選擇基因組的編碼序列的高效策略,外顯子測序相對于基因組重測序成本較低,對研究已知基因的SNP、Indel等具有較大的優(yōu)勢。 在人類基因中大約有180,000外顯子,占人類基因組的1%,約30MB。-Ng S B, Turner E H, Robertson P D,

2、 et al. Targeted capture and massively parallel sequencing of 12 human exomesJ. Nature, 2009, 461(7261): 272-276. 人類基因組的蛋白編碼區(qū)域大約包含85%的致病突變。- Choi M, Scholl U I, Ji W, et al. Genetic diagnosis by whole exome capture and massively parallel DNA sequencingJ. Proceedings of the National Academy of Scienc

3、es, 2009, 106(45): 19096-19101.一、外顯子測序簡介一、外顯子測序簡介 The sensitivity to detect heterozygous variants with 10 reads is 78.6%, but increases to 95.2% at 20 x and approximately 100% at 30 x and greater.1 The average cover-age of each base in the targeted regions was 100-fold, and 95.3% of these bases were

4、 covered sufficiently deeply for variant calling (10 cover-age) 2 Exome sequencing produced a higher level of coverage for the targeted sequences (mean, 167.50), slightly increasing our ability to detect mutations with VAFs of less than 10%. 31.Choi M, Scholl U I, Ji W, et al. Genetic diagnosis by w

5、hole exome capture and massively parallel DNA sequencingJ. Proceedings of the National Academy of Sciences, 2009, 106(45): 19096-19101.2.Yan X J, Xu J, Gu Z H, et al. Exome sequencing identifies somatic mutations of DNA methyltransferase gene DNMT3A in acute monocytic leukemiaJ. Nature genetics, 201

6、1, 43(4): 309-315.3.Platforms A. Genomic and Epigenomic Landscapes of Adult De Novo Acute Myeloid LeukemiaJ. N Engl J Med, 2013, 2013(368): 2059-2074.二、測序深度二、測序深度Coverage rateSequencing depth and coverage of the nine paired initial sequencing samples.三、測序平臺三、測序平臺Ion ProtonIllumina HiSeq基于Ion Proton的

7、外顯子測序流程 The bound DNA is isolated using streptavidin-coated Dynabeads paramagnetic beads, and then amplified and purified. The purified, target-enriched sample is then returned to the Ion Torrent system workflow for emulsion PCR, enrichment, and sequencing. Exome sequencing results on the Ion Proton

8、 System using the Ion PI Chip and the Ion TargetSeq Exome KitRaw reads Reads mapped Percent reads mapped Reads on target Percent reads on target89,782,719 87,156,364 97.1% 68,899,957 79.1%Mean depth of coverage Target bases at 1x Target bases at 10 x Target bases at 20 x119x98.5% 95.3%92.5%Type Numb

9、er of variants Concordance with dbSNP135SNVs 30,095 98.0%Heterozygous SNVs 18,031 97.1%Homozygous SNVs 12,046 99.4%基于Ion Proton的外顯子測序結果基于Illumina HiSeq的外顯子測序流程DNA樣本要求(單次):總量: 6 g DNA;濃度: 37.5 ng/L;純度:OD260/280=1.8-2.0。(來自華大基因)DNA樣本要求(單次):總量:200-300bp小片段PE文庫5 g ;濃度:50ng/L ;純度:OD260/280=1.8-2.0。(來自美吉生

10、物)DNA樣本要求(單次):總量:50g ;濃度:100ng/L ;純度:OD260/280=1.8-2.0。(來自派森諾生物)基因組DNA樣本要求外顯子捕獲平臺 Highly uniform coverage across 62 Mb of exomic sequence, including 5UTR, 3 UTR, microRNA, and other non-coding RNA. Streamlined protocol for pre-enrichment pooling of up to six samples dramatically reduces hands-on tim

11、e and cost. Optimized for use with the TruSeq DNA Sample Preparation Kit, providing a gel-free protocol that requires the lowest DNA input. Automation-friendly with master-mixed reagents and plate-based processing for up to 96 reactions.TruSeq Exome Enrichment KitTruSeq Exome Enrichment Workflow烈冰生物

12、外顯子測序數(shù)據(jù)分析思路四四、數(shù)據(jù)分析流程、數(shù)據(jù)分析流程1.數(shù)據(jù)下機文件:*.fastq2.序列QC去除低質量reads,和連續(xù)的低質量片段,去掉接頭序列。QC統(tǒng)計reads數(shù)量及測序質量。3.Mapping由于bwa能準確、快速的將短序列比對到基因組上,而且軟件持續(xù)更新和說明文檔完備,是外顯子捕獲測序的首選。4.Sam到bam轉換:Samtools的多種工具可以將sam文件轉換為bam文件,rmdup工具能去除PCR擴增產(chǎn)生的冗余reads,消除由于文庫擴增而導入的突變,降低假陽性。Flagstat統(tǒng)計reads的mapping情況以及比較去除duplicate前后reads數(shù)目的反映樣品建庫

13、的冗余情況。Picard提供的多個工具,修改bam文件,使之適合于后續(xù)的GATK軟件包中的工具的處理。5.Indel區(qū)域的reads重新做局部多序列比對:在indel的邊緣,一些錯配看起來很像是SNP,通過對dbSNP庫及bam文件檢測到的indel附近的reads進行局部的重新比對,可以消除indel周邊的假陽性SNP。6.堿基質量重新打分:測序儀給reads中的堿基的qual值存在一定的偏差,通過經(jīng)驗的錯誤模型來重新計算的堿基的qual值,重新給reads的各個堿基的qual打分。7.Call snv和indel:對處理好的多樣品bam文件同時運行UnifiedGenotyper,大大提高

14、call SNP的靈敏度和準確性,多樣品同時比較的結果,方便了后續(xù)的樣品間差異的篩選。8.突變位點的重新打分:通過hapmap,omni,dbsnp數(shù)據(jù)庫中已知的突變位點建模優(yōu)化,對各個突變位點重新打分,篩選。大大降低了假陽性率。9.注釋:通過ANNOVAR軟件對vcf結果注釋,關聯(lián)到多個數(shù)據(jù)庫。1. Mapping1. Mapping統(tǒng)計:統(tǒng)計:統(tǒng)計總reads數(shù),mapped reads及unique mapped reads數(shù)目及百分比。2. 2. 捕獲效率統(tǒng)計:捕獲效率統(tǒng)計:統(tǒng)計來自捕獲區(qū)域的統(tǒng)計來自捕獲區(qū)域的FragmentFragment比例:比例:五五、數(shù)據(jù)分析內(nèi)容、數(shù)據(jù)分析內(nèi)容

15、統(tǒng)計統(tǒng)計target區(qū)域所有的堿基覆蓋次數(shù)分布:區(qū)域所有的堿基覆蓋次數(shù)分布:對每個對每個target區(qū)域的覆蓋和深度統(tǒng)計:區(qū)域的覆蓋和深度統(tǒng)計: 如果客戶對某些基因特別感興趣,想要看看來自這些基因的外顯子區(qū)域的覆蓋情況,可以提供每個target或者特定target區(qū)域的覆蓋情況和測序深度統(tǒng)計。3. 3. SnvSnv和和indelindel關聯(lián)數(shù)據(jù)庫:關聯(lián)數(shù)據(jù)庫:Snv和indel結果按照突變的位點是否在捕獲的區(qū)域之內(nèi)分成兩部分:*_target.snv:突變處于捕獲的靶區(qū)域(target region)內(nèi)。*_off_target.snv或者*_target.indel: 突變在捕獲的靶區(qū)域

16、之外。Snv和indel結果與以下的數(shù)據(jù)庫關聯(lián),為突變的篩選提供大量的信息。1 1)基因注釋:)基因注釋:通過基因注釋可以達到以下的目的:a. 突變的功能定位(在外顯子,內(nèi)含子,剪接位點還是基因間區(qū));b. 突變所在的基因名稱或者臨近的基因;c. 突變?nèi)绻诰幋a區(qū)域,是否引起氨基酸的改變(同義突變,非同義突變的呢過);d. 如果引起氨基酸的改變,按照HGVS命名規(guī)則表示-改變的基因ID,轉錄本ID,外顯子編號,以及氨基酸改變,如OD2:NM_022162:exon8:c.G2722C:p.G908R。 默認使用refSeq完成基因注釋,如果有特殊的要求,可以使用UCSC known gene,

17、Ensembl,GENCODE,CCDS等基因注釋系統(tǒng)。2 2) 1000G 1000G注釋:注釋:檢測突變位點是否在1000 Genomes Projects(2012 release)數(shù)據(jù)庫中檢測到,如果檢測到,顯示等位基因頻率(allele frequency)。默認是使用所有人種的數(shù)據(jù)庫,如果有特定要求,可以按照要求展示不同人種(比如AMR, AFR, ASN,EUR,中國人,日本人)等位基因頻率。3 3) dbSNPdbSNP注釋:注釋:檢測突變是否在dbSNP數(shù)據(jù)庫中,如果在,顯示rsID。默認使用db SNP135數(shù)據(jù)庫,如果有特定的要求,可以使用dbSNP129,dbSNP13

18、0,dbSNP131,dbSNP132數(shù)據(jù)庫。4 4) AVSIFT AVSIFT:SIFT是一款很受歡迎的檢測非同義突變位點重要性的軟件,對應非同義突變位點,會給定一個打分,若打分低于0.05,則表明突變很可能會影響到蛋白質的功能。5 5) 與與UCSCUCSC的數(shù)據(jù)庫的關聯(lián):的數(shù)據(jù)庫的關聯(lián):/goldenPath/hg19/database/.txt.gz,提供了大量的基因組注釋信息,目前關聯(lián)的數(shù)據(jù)庫有:tfbsConsSites:在人/小鼠/大鼠中保守的轉錄因子結合位點,以transfac Matrix Database (v7.0)為基礎。wgRna:snoRNA and miRNA注釋。targetScanS:TargetScan預測的miRNA把區(qū)域。gwasCatalog:已經(jīng)發(fā)表的各種疾病的GW

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論