從零學測序癌癥基因組重測序分析第六講之circos圖的繪制_第1頁
從零學測序癌癥基因組重測序分析第六講之circos圖的繪制_第2頁
從零學測序癌癥基因組重測序分析第六講之circos圖的繪制_第3頁
從零學測序癌癥基因組重測序分析第六講之circos圖的繪制_第4頁
從零學測序癌癥基因組重測序分析第六講之circos圖的繪制_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、【測序中國測序中國-從零學測序從零學測序】癌癥基因組癌癥基因組重測序分析第六講之重測序分析第六講之circos圖的繪制圖的繪制卜德超卜德超微信微信/QQ: 530242830郵箱郵箱: 中國科學院計算技術研究所中國科學院計算技術研究所2015-01-07 Circos 是一個Perl語言開發(fā)的自由可視化軟件,使用GPL協(xié)議分發(fā),以繪制輸出圈圖繪制輸出圈圖(原型 Circos 是由加拿大的一位生物信息科學家 Martin Krzywinski 所開發(fā),他同時是一位專業(yè)攝影師,最初他主要從事Linux系統(tǒng)管理等工作風格的圖)為最大特色Circos介紹Circos案例基因組基因組數(shù)據(jù)數(shù)據(jù)的可視化的可

2、視化Linux內(nèi)核內(nèi)核發(fā)展的可發(fā)展的可視化視化影視作品影視作品人物關系人物關系的可視化的可視化Circos繪圖流程Perl 安裝Circos 安裝LinksHighlightHeatmapHistogramCircos.confPatterns.confColors.confImage.confFonts.confHousekeeping.conf安裝配置文件配置文件導入圖形類型。Scatter plot Circos產(chǎn)生靜態(tài)圖片。這些圖片的產(chǎn)生過程是通過一個配置文件來實現(xiàn)的。這個配置文件通常會導入其他配置文件,形成一個個分級結(jié)構(gòu)。設置好這個配置文件,基本上就掌握了circos。Windows

3、上安裝Circos安裝安裝Strawberry Perl或者ActiveState Perl (不低于5.8)DOS命令行下perl v檢測perl是否安裝成功及查看版本下載Circos包,解壓DOS命令行下即可運行Circos,例如在circos/example下執(zhí)行perl .bincircos conf etccircos.conf如果運行失敗,用perl自帶的安裝包管理程序(PPM)繼續(xù)安裝完成即可Unix上安裝Circos安裝Unix系統(tǒng)一般都安裝有perl,perl版本不應低于5.8下載Circos包,解壓,根據(jù)circos包自帶的README安裝circos如果運行失敗,繼續(xù)將為

4、安裝的perl模塊安裝完成即可在circos/example下執(zhí)行perl /path/to/circos/bin/circos conf etccircos.conf配置語法:變量名=變量值配置塊:配置文件 thickness = 30p fill_color = white fill_color = grey 形成一個配置塊,一些重要的配置塊單獨寫在一個配置文件中,便于其他配置文件的導入。例如ideogram.conf只有ideogram一個配置塊??梢跃哂卸鄠€實例,如此有了全局變量和局部變量,左邊f(xié)ill_color = white對中所有實例都有效,除非實例內(nèi)部自己用局部變量進行定義,

5、如左邊的fill_color = grey。如果實例比較多,全局變量變得格外的事半功倍。 在circos/etc目錄下有些現(xiàn)成的設置會經(jīng)常用到,從不或很少改變,學會運用這些配置文件對學習circos有很大幫助,也省去了很多麻煩,如colors.conf、fonts.conf等。寫配置文件的時候可以直接導入使用。配置文件colors.conffonts.confpatterns.confHousekeeping.conf顏色配置顏色配置文件,導入了colors.brewer.conf、 colors.hsv.conf和colors.ucsc.conf。在circos中,顏色除了絕對路徑,還有很多

6、表達方式,如hs1,red, reds-9-seq-1等,是因為這些字符在colors配置文件中已經(jīng)賦予了特定的絕對路徑。 字體配置字體配置文件,其中,代表字體的標簽與circos/fonts文件夾下的otf或ttf文件一一對應。模式配置模式配置文件,其中,標簽與circos/tites文件夾下的png文件一一對應,然后根據(jù)patterns.svg.conf生成相應的svg文件?;究蚣芘渲没究蚣芘渲茫琧ircos必不可少的配置文件,一般直接導入即可。 還有一些設置是也是經(jīng)常用到,但會根據(jù)個人喜好或繪圖要求不同而有細微差別,如ideogram.conf、 ticks.conf等。除此之外,也

7、可以把經(jīng)常用到的設置寫成配置文件,便于其它配置文件反復導入,提高效率。配置文件ideogram.confticks.confimage.conf染色體展示染色體展示的配置文件,包括是否展示bands,染色體展示位置、染色體間距離、染色體標簽位置等。染色體數(shù)據(jù)在哪?畫哪一些?后面實例中有說明,這里是簡單介紹配置文件的作用??潭葮撕灴潭葮撕炁渲梦募梢詫氲絠deogram.conf中,也可以直接導入到主配置文件中。對image大小、背景顏色、輸出目錄、輸出文件形式以及染色體在圓周上的起始位置等進行設置。 對于上述提到的那些配置文件,主配置文件可以用來導入,這樣在主配置文件中就不必再對xxx.c

8、onf文件中的變量進行定義了。如此一來,既可以使這些重要配置文件得以重復利用,也大大簡化了主配置文件。除此之外,被導入的配置文件它自己也可以導入其它的配置文件。配置文件導入karyotype = data/karyotype/karyotype.mouse.mm9.txtchromosomes_units = 1000000chromosomes_display_default = yes colors_fonts_patterns.confcircos.conf嵌套配置文件導入white = 255,255,255 colors.confcolors.brewer.confblues-3-s

9、eq = blues-3-seq-(d+)blues-3-seq-rev = rev(blues-3-seq-(d+)blues-3-seq-1 = 222,235,247blues-3-seq-2 = 158,202,225blues-3-seq-3 = 49,130,189 colors_fonts_patterns.confcolors.confcolors.brewer.conf實例繪制初級:核型圖繪制 上面學習了配置文件和配置文件導入的相關知識,現(xiàn)在我們一起來完成一個沒有data的circos,即只有染色體的只有染色體的circos圖圖。 首先準備好需要被導入的配置文件:circos

10、/etc目錄下的文件直接可以用,一般不需要改動。 etc/background.black.conf etc/background.white.conf etc/colors.brewer.conf etc/colors.conf etc/colors.hsv.conf etc/colors.ucsc.conf etc/colors_fonts_patterns.conf etc/fonts.conf etc/housekeeping.conf etc/image.black.conf etc/image.conf etc/image.generic.conf etc/patterns.con

11、f etc/patterns.svg.conf 除此之外,再創(chuàng)建ideogram.conf和ticks.conf配置文件,與后面創(chuàng)建的主配置文件circos.conf放在同一個目錄下,下面是ideogram.conf 和ticks.conf 模板。default = 0.005rradius = 0.9rthickness = 40pfill = yesfill_color = blackstroke_thickness = 2stroke_color = blackshow_label = yeslabel_font = default label_radius = 1r + 75plabe

12、l_size = 30label_parallel = yeslabel_case = upper label_format = eval(sprintf(chr%s,var(label)show_bands = yesfill_bands = yesband_stroke_thickness = 2band_stroke_color = whiteband_transparency = 4show_ticks = yesshow_tick_labels = yesradius = 1rcolor = blackthickness = 2pmultiplier = 1e-6format = %

13、dspacing = 5usize = 10pspacing = 25usize = 15pshow_label = yeslabel_size = 20plabel_offset = 10pformat = %dideogram.confticks.conf染色體間的空隙染色體所在位置、厚度、邊框厚度及顏色染色體標簽位置、字體等Bands顯示與否、bands邊框厚度、顏色、透明度等主刻度次刻度(小刻度)刻度所在位置、顏色、厚度等是否顯示刻度實例繪制初級:核型圖繪制 然后,創(chuàng)建一個主配置文件,導入核型文件和其它配置文件:karyotype = data/karyotype/karyotype.

14、mouse.mm9.txtchromosomes_units = 1000000chromosomes_display_default = yesCircos.conf核型文件是必須的。它定義了需要展示的染色體的名稱、大小和顏色等,可以根據(jù)自己的要求創(chuàng)建自己想要的核型,不僅僅是染色體,也可以是contigs、genesi等其他可以量化的基于坐標系統(tǒng)的東西。Circos常用的核型數(shù)據(jù)文件在circos/data/karyotype目錄下。定義距離單位u是否顯示默認染色體實例繪制初級:核型圖繪制 最后,運行circos:perl bin/circos -conf circos.conf次刻度,5u

15、,不顯示刻度標簽主刻度,25u,顯示刻度標簽default = 0.005rshow_label = yeslabel_font = default label_radius = 1r + 75plabel_size = 30label_parallel = yeslabel_case = upper label_format = eval(sprintf(chr%s,var(label)實例繪制初級:核型圖繪制 畫出基本的核型圖之后,就要開始往圖里面添加需要顯示的數(shù)據(jù)了。circos圖形典型的有Scatter Plots、Line Plots、Histograms、Heatmaps 、Con

16、nectors 、Highlights、Links。 Scatter Plots、Line Plots、Histograms、Heatmaps數(shù)據(jù)數(shù)據(jù)格式: chr start end value options,options是在數(shù)據(jù)內(nèi)部,單單對它所在行的數(shù)據(jù)進行設置,多項設置用逗號隔開, options可有可無。 hs1 0 99999 0.01044hs1 100000 199999 0.00512hs1 200000 299999 0.00214 fill_color=red,z=68hs1 300000 399999 0.00902hs1 400000 499999 0.00448h

17、s1 500000 599999 0.00879 實例繪制中級:數(shù)據(jù)圖繪制Scatter Plotstype=scatterfile=data/6/snp.density.txtfill_color=greystroke_color=blackglyph=circleglyph_size=10max=0.013min=0r1=0.95rr0=0.65rtype=scatterfile=indata/6/snp.density.txtfill_color=greenstroke_color=dgreenglyph=rectangleglyph_size=8max=0.013min=0.007r1

18、=1.175rr0=1.075rtype=scatterfile=data/6/snp.density.txtfill_color=greystroke_color=blackglyph=circleglyph_size=10max=0.013min=0r1=0.95rr0=0.65rfile=indata/6/snp.density.txtfill_color=greenstroke_color=dgreenglyph=rectangleglyph_size=8max=0.013min=0.007r1=1.175rr0=1.075r設置plot類型,可以是scatter、line、 hist

19、ogram, heatmap 等。指定數(shù)據(jù)文件設置圖形填充顏色及邊框顏色設置點的形狀及大小設置value數(shù)據(jù)范圍,出界將被忽視掉設置繪畫區(qū)域,r0是內(nèi)半徑,r1是外半徑,value中的“r”代表circos半徑不同的實例一般不設置重復區(qū)域核心配置塊: 形成主配置文件:將核心配置塊插入到前面實例circos.conf中即可,其它2D數(shù)據(jù)同樣的方法。karyotype=data/karyotype/karyotype.human.txtchromosomes_units=1000000chromosomes_display_default=nochromosomes=hs1;hs4;hs5不顯示默

20、認染色體設置展示的染色體,人染色體符號是hs,小鼠是mm,這是在核型文件中設置好的。type=scatterfile=data/6/snp.density.txtfill_color=greystroke_color=blackglyph=circleglyph_size=10max=0.013min=0r1=0.95rr0=0.65rfile=indata/6/snp.density.txtfill_color=greenstroke_color=dgreenglyph=rectangleglyph_size=8max=0.013min=0.007r1=1.175rr0=1.075r第一個實

21、例,灰色第二個實例,綠色Scatter Plotstype = linethickness = 2max_gap = 1ufile = data/6/snp.density.250kb.txtcolor = redmin = 0max = 0.015r0 = 0.5rr1 = 0.8rfill_color = vdredmax_gap = 1ufile = data/6/snp.density.txtcolor = yellowmin = 0max = 0.015r0 = 0.25rr1 = 0.45rthickness = 1fill_color = vdyellowLine Plots核心

22、配置塊Histograms核心配置塊type = histogramfile = data/C_fpkm.txtcolor = redmin = 0max = 500r0 = 0.75rr1 = 0.95rthickness = 10pfill_under = yesfill_color = redorientation = outtype = histogramfile = data/D_fpkm.txtcolor = greenmin = 0max = 500r0 = 0.40rr1 = 0.60rthickness = 10pfill_under = yesfill_color = gr

23、eenorientation = in控制方向,向外控制方向,向內(nèi)Heatmaps核心配置塊type = heatmapfile = indata/6/variation.heatmap.txtcolor = spectral-9-divstroke_thickness = 1stroke_color = blackmin = 2000max = 25000r0 = 0.80rr1 = 0.90rfile = indata/6/variation.heatmap.txtcolor = spectral-9-divstroke_thickness = 1stroke_color = blackm

24、in = 10000max = 500000r0 = 0.60rr1 = 0.70rfile = indata/6/variation.heatmap.txtcolor = orrd-9-seqstroke_thickness = 1stroke_color = blackmin = 10000max = 500000r0 = 0.40rr1 = 0.50r顏色是一組顏色(多個),根據(jù)min到max,賦予從左至右的顏色三個實例用的是同一組數(shù)據(jù),第一個實例min-max設置偏小,圖形顏色偏深第二個實例顏色設置與第一個相同,min-max設置加大,圖形顏色適中第三個實例min-max設置與第二個相

25、同,顏色設置為另一組顏色。type = connectorfile = indata/6/connectors.txtr0 = 0.70rr1 = 0.90rconnector_dims = 0,0.3,0.4,0.3,0thickness = 2color = blacktype = connectorfile = indata/6/connectors.txtr0 = 0.40rr1 = 0.60rconnector_dims = 0,0,0.8,0.2,0thickness = 2color = greenConnectors 數(shù)據(jù)格式:chr firstLocal secondLoca

26、l 這兩個locals需要在同一染色體上,沒有要求一個必須大于另一個。 hs22 14743362 14737115hs22 20339724 20339258hs22 14758082 14790652 核心設置快:connector_dims = 0,0.3,0.4,0.3,0color = blackconnector_dims = 0,0,0.8,0.2,0color = greenHighlights 數(shù)據(jù)格式:chr start end fill_color=color, hs1 1298972 1300443 fill_color=blue hs1 1311738 1324571

27、 fill_color=red,r0=0.6r,r1=0.6r+50p hs1 1397026 1421444 fill_color=green,r0=1.1r,r1=1.15r hs1 1437417 1459927 fill_color=green,r0=1.1r,r1=1.15r hs1 1540746 1555847 fill_color=yellow hs1 1560962 1645635 hs1 1624179 1645623 核心配置塊:有兩種設置方式,一種是以是方式,用變量設置type=highlight,實例是;另外一種是以配置塊來設置,實例是。一下是兩種核心配置塊。file

28、 = indata/3/chr.highlights.txtr0 = 0.80rr1 = 0.90rfile = indata/3/h.variation.txtr0 = 0.40rr1 = 0.70rHighlightstype = highlightfile = indata/3/chr.highlights.txtr0 = 0.80rr1 = 0.90rtype = highlightfile = indata/3/h.variation.txtr0 = 0.40rr1 = 0.70r默認的顏色是grey默認顏色是black對于有fill_color的數(shù)據(jù),和畫出的圖案是一樣的。file

29、 = huan_chr1_links.txtradius = 0.95rcolor = redbezier_radius = 0.1rthickness = 1file = human_chr1_links.txtradius = 0.95rcolor = greenbezier_radius = 0.4rthickness = 1Links 數(shù)據(jù)格式:firstChr start end secondChr start end,染色體1和染色體2可以相同,也可以不同。 hs11475914759hs11499914999hs1564465564465hs1564652564652hs1564

30、483564483hs2566317566317 核心配置塊:數(shù)據(jù)綜合繪制 所有類型circos圖可以穿插在一起,下邊的circos是上述圖形所用到的數(shù)據(jù),綜合在一起畫的一個circos。Scatter PlotsLine PlotsHighlightsLinksHeatmapsConnectorsHistograms數(shù)據(jù)綜合繪制karyotype = data/karyotype/karyotype.human.txtchromosomes_units = 1000000chromosomes_display_default = nochromosomes = hs1;hs2;hs3;hs4;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論