轉(zhuǎn)錄組軟件安裝linux瑞客_第1頁
轉(zhuǎn)錄組軟件安裝linux瑞客_第2頁
轉(zhuǎn)錄組軟件安裝linux瑞客_第3頁
轉(zhuǎn)錄組軟件安裝linux瑞客_第4頁
轉(zhuǎn)錄組軟件安裝linux瑞客_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

轉(zhuǎn)錄組軟件安裝易生信()——最懂你的生信培訓(xùn),學(xué)習(xí)生信更容易易生信學(xué)習(xí)方式提前預(yù)習(xí)仔細(xì)聽講先運(yùn)行再理解緊跟步伐,跟不上的及時(shí)在課堂提出或?qū)ふ抑汤蠋熃鉀Q課后復(fù)習(xí),基礎(chǔ)知識學(xué)習(xí)靠背和反復(fù)練書讀百變,其義自見碼敲十遍,不會也難2易生信,畢生緣;培訓(xùn)。易生信四種常規(guī)的轉(zhuǎn)錄組分析策略StringtieTrinotateTrinotate(d)

不基于比對,直接定量流程ReferencetranscriptHISAT2ReadsSailfish/kallisto/Salmon-SMEM/Salmon-QuasiAlignment-freeisoformquantification

&counting易生信,畢生緣;培訓(xùn)。易生信易生信,畢生緣;培訓(xùn)。4有參不比對轉(zhuǎn)錄組分析流程SequencingRNA-seqreads(2

x

150

bp)Gene

quantificationSalmon(cDNA)DifferentialexpressionDESeq2ImageGPVisualizationGeneannotation(.gtf

file)

(可選)Raw

sequencedata(.fastq

files)CDNA

file(.fafile)InputsEnrichmentanalysisGO/GSEAWGCNACytoscapeNetworkanalysis易生信易生信,畢生緣;培訓(xùn)。5有參比對轉(zhuǎn)錄組分析流程SequencingRNA-seqreads(2

x

150

bp)Read

alignmentSTAR/HISAT2(genome)GeneidentificationStringTieDifferentialexpressionDESeq2ImageGPVisualizationGeneannotation(.gtf

file)Raw

sequencedata(.fastq

files)Referencegenome(.fafile)InputsrMATSAlternativesplicingEnrichmentanalysisGO/GSEAWGCNACytoscapeNetworkanalysisLinux服務(wù)器軟件安裝只用于內(nèi)部培訓(xùn)學(xué)習(xí)使用,請勿傳播。易生信Linux服務(wù)器軟件列表7Fastq-dump

(SRA

toolkit):

公共數(shù)據(jù)下載Fastqc:質(zhì)量評估MultiQC:結(jié)果整合Trimmomatic:reads預(yù)處理Salmon:快速準(zhǔn)確不比對定量工具Conda:包管理器Samtools:sam文件處理工具UCSC

toolkit:

文件格式轉(zhuǎn)換工具集合STAR:轉(zhuǎn)錄組比對工具RSeQC:轉(zhuǎn)錄組比對質(zhì)量評估工具Stringtie:轉(zhuǎn)錄本拼裝工具rMATS:可變剪接分析工具Rmats2sashimiplot:可變剪接可視化工具易生信Linux下的軟件軟件類型腳本二進(jìn)制程序Java包可執(zhí)行屬性軟件或腳本需要有執(zhí)行權(quán)限chmoda+x

soft_name環(huán)境變量告訴系統(tǒng)軟件可能在的位置或使用完整路徑8

易生信,畢生緣;培訓(xùn)

。

易生信易生信,畢生緣;培訓(xùn)。9什么樣的軟件?腳本型解釋型語言寫作,如Bash,R,Python,Perl等,源代碼可直接查看二進(jìn)制型源代碼編譯成機(jī)器語言,直接打開查看亂碼,如bwa,

salmon等Java程序java

-jar

trimmomatic-0.36.jar易生信易生信,畢生緣;培訓(xùn)。10可執(zhí)行屬性–軟件的必須屬性ls

–l

查看文件的屬性(文件夾的可執(zhí)行屬性是可讀屬性)一般在終端不同顏色對應(yīng)不同屬性chmod修改屬性chmod

a+x

file#所有人增加可執(zhí)行屬性chmod

755

file#所有人可執(zhí)行,自己可寫易生信易生信,畢生緣;培訓(xùn)。11環(huán)境變量-軟件在哪?環(huán)境變量PATH是一堆目錄,一堆存放有軟件的目錄。在系統(tǒng)接到命令輸入比如”cd”后,會去環(huán)境變量PATH存儲的目錄中從前向后查找,在哪個目錄發(fā)現(xiàn)存在輸入的命令同名”cd”的文件視為找到程序,然后判斷是否有可執(zhí)行屬性,如果有則執(zhí)行。echo

$PATHexport

PATH=$PATH:~/soft易生信易生信,畢生緣;培訓(xùn)。12環(huán)境變量–永久設(shè)置服務(wù)器自己用戶的家目錄下一般有2個隱藏文件:.bashrc和.bash_profile。.bashrc本地登錄時(shí)讀取。.bash_profile遠(yuǎn)程登錄時(shí)讀取。.bashrc和.bash_profile是bash腳本,可以寫任何bash命令。需要把環(huán)境變量設(shè)置命令寫入.bash_profile中。易生信易生信,畢生緣;培訓(xùn)。13系統(tǒng)包管理器安裝最簡單方便,但一般更新慢,需要根用戶權(quán)限。yum

update#Centos更新yum

search

soft_name

orsoft_descriptionyum

install

soft_official_nameapt-get

update#Ubuntu更新apt-cache

search

soft_name

orsoft_descriptionapt-get

install

soft-name易生信易生信,畢生緣;培訓(xùn)。14編譯好的二進(jìn)制文件編譯好的多平臺通用二進(jìn)制文件或特定平臺可用二進(jìn)制文件,下載,解壓,增加可執(zhí)行屬性,放入環(huán)境變量,直接調(diào)用。認(rèn)真看軟件說明手冊,如果提供了二進(jìn)制版本,盡量使用二進(jìn)制版本,簡單方便,把時(shí)間多放在數(shù)據(jù)上,而不是軟件安裝上。一般可執(zhí)行程序放置在bin

目錄下。易生信易生信,畢生緣;培訓(xùn)。15經(jīng)典的源碼安裝./configure

&&

make

&&

make

install./configure是檢測系統(tǒng)的庫文件、頭文件、依賴的軟件是否存在及版本是否

兼容,并根據(jù)檢測結(jié)果生成Makefile文件。這一步是軟件安裝是否能成功的關(guān)鍵,檢測通過安裝一般沒問題。檢測不通過,缺什么補(bǔ)什么。如果非根

,

--prefix=/home/ct/soft/specific_name。make具體的編譯過程,根據(jù)Makefile中的規(guī)則把程序語言轉(zhuǎn)換為機(jī)器語言。make install拷貝make編譯出的可執(zhí)行文件或依賴的動態(tài)庫到prefix指定的目錄。置入環(huán)境變量即可使用。易生信易生信,畢生緣;培訓(xùn)。16Python包的安裝Python包管理器安裝

easy_install

package_namepip

install

package_name

-i

Python包手動源碼安裝

python

setup.py

buildpython

setup.py

installConda安裝conda

install

package_name易生信易生信,畢生緣;培訓(xùn)。17Conda軟件包管理神器conda:任意語言的軟件包、環(huán)境、依賴關(guān)系的開源管理系統(tǒng)。Anaconda:集合了常用Python包的數(shù)據(jù)科學(xué)平臺Minoconda:精簡版Anaconda,只包含conda和Pythonbioconda:conda的一個通道,含8744個生信分析軟件和版本收錄,剛剛發(fā)表于

Nature

Method易生信易生信,畢生緣;培訓(xùn)。18Anaconda下載硬盤空間允許的情況下建議Anaconda,帶的軟件包、頭文件、庫文件多,一致性好,后續(xù)安裝發(fā)生沖突的可能性低。易生信易生信,畢生緣;培訓(xùn)。19Anaconda安裝wget

-cx86_64.sh#-p

指定安裝路徑#-b-f

不做提示,直接安裝bash

Anaconda2-5.1.0-Linux-x86_64.sh

-b

-f

-p

~/conda易生信易生信,畢生緣;培訓(xùn)。20Anaconda增加通道conda

config

--add

channels

conda-forge

#

Lowest

priorityconda

config

--add

channelsconda

config

--add

channels

r

#

Optionalconda

config

--add

channels

defaultsconda

config--add

channels

bioconda#增加軟件支持conda

config--add

channels

Anocanda清華鏡像,國內(nèi)鏡像,加速下載conda

config

--add

channelsconda

config--add

channels

#清華通道,最高優(yōu)先級conda

config

--add

channelsconda

config

--set

show_channel_urls

yes易生信易生信,畢生緣;培訓(xùn)。21創(chuàng)建新的運(yùn)行環(huán)境創(chuàng)建transcriptome環(huán)境,指定使用的R和python版本conda

create

-y

-n

transcriptome

r-base=3.5.2

python=2.7在新環(huán)境transcriptome中安裝軟件conda

install

-n

transcriptome

-yfastqc激活新環(huán)境transcriptomesource

activate

transcriptome退出transcriptome環(huán)境source

deactivate

transcriptome易生信易生信,畢生緣;培訓(xùn)。22判斷可執(zhí)行文件的位置和當(dāng)前所在環(huán)境which

python返回python的位置

激活conda的環(huán)境在終端會有標(biāo)識易生信易生信,畢生緣;培訓(xùn)。23軟件和數(shù)據(jù)庫下載wget-c

soft_url/database_url#-c斷點(diǎn)續(xù)傳wget-c

ftp:///blast/db/nt.*.tar.gz

支持通配符

wget-cr-np-nd

ftp:///blast/db/遞歸下載同類工具還有curl和axel,都可以用易生信易生信,畢生緣;培訓(xùn)。24環(huán)境變量設(shè)置#

把soft目錄加大環(huán)境變量中,新安裝的軟件都軟鏈到soft目錄,省去了重復(fù)source的過程cat

<<END

>>~/.bash_profileexport

PATH=~/transcriptome/soft:~/anaconda2/bin:\$PATHENDsource

~/.bash_profile易生信易生信,畢生緣;培訓(xùn)。25SRA

toolkit安裝wget -ccentos_linux64.tar.gztar

xvzf

sratoolkit.2.9.0-centos_linux64.tar.gzln-s

`pwd`/sratoolkit.2.9.0-centos_linux64/bin/fastq-dump

~/transcriptome/soft#若運(yùn)行成功,則輸出為~/transcriptome/soft/fastq-dumpwhich

fastq-dump易生信Fastqc軟件安裝cd

~/transcriptome/soft-c26wgetunzip

fastqc_v0.11.5.zipchmod

755

FastQC/fastqc#假設(shè)~/transcriptome/soft目錄在環(huán)境變量中l(wèi)n

-s

`pwd`/FastQC/fastqc

~/transcriptome/soft/易生信Trimmomatic安裝cd~/transcriptome/softwget

-cunzip

Trimmomatic-0.36.zip\$(readlink

-f

\$0))/trimmomatic-0.36.jar

\$*"cd

Trimmomatic-0.36echo

"java -jar

\$(dirname>trimmomatic.shchmod

755

trimmomatic.sh27易生信,畢生緣;培訓(xùn)。#假設(shè)~/transcriptome/soft目錄在環(huán)境變量中易生信易生信,畢生緣;培訓(xùn)。28Salmon安裝wget -calpha/salmon-latest_linux_x86_64.tar.gztar

xvzf

salmon-latest_linux_x86_64.tar.gzln-s`pwd`/salmon-latest-linux_x86_64/bin/salmon

~/transcriptome/soft易生信易生信,畢生緣;培訓(xùn)。29UCSC

toolkitcd

~/transcriptome/softUcsc=“/admin/exe/linux.x86_64/”wget

-c

${Ucsc}bedSortwget

-c${Ucsc}bedGraphToBigWigwget

-c${Ucsc}gtfToGenePredwget

-c${Ucsc}genePredToBedChmod

755

bed*

gtf*

gene*易生信易生信,畢生緣;培訓(xùn)。30STAR安裝cd~/transcriptome/softwget -O

STAR.2.6.0c.zipunzip

STAR.2.6.0c.zipln

-s

`pwd`/STAR-2.6.0c/bin/Linux_x86_64_static/*

~/transcriptome/soft易生信易生信,畢生緣;培訓(xùn)。31StringTie安裝wget -c1.3.4d.Linux_x86_64.tar.gztar

xvzfstringtie-1.3.4d.Linux_x86_64.tar.gzchmod

755

stringtie-1.3.4d.Linux_x86_64/stringtie#假設(shè)~/transcriptome/soft在環(huán)境變量中l(wèi)n

-sf

`pwd`/stringtie-1.3.4d.Linux_x86_64/stringtie

~/transcriptome/soft易生信Gff工具安裝#安裝paremkdir-pcdgit

clonegit

clonecd

paremake

releaseln

-sf

`pwd`

pare

~/transcriptome/softcdgit

clonecd

gffreadmake32易生信,畢生緣;培訓(xùn)。易生信易生信,畢生緣;培訓(xùn)。33rMATS安裝pip

install

-i

pysam#yum

install

gsl-devel.x86_64

lapack-devel

blas-develcd

~/transcriptome/softwget

-ctar

xvzf

rMATS.4.0.2.tgzpython

-c

"import

sys;

print

sys.maxunicode"#輸出為1114111,使用rMATS-turbo-Linux-UCS4cd

rMATS.4.0.2/rMATS-turbo-Linux-UCS4chmod

755

rmats.py#默認(rèn)使用全路徑調(diào)用,如果想簡化些,需要修改rmats.py源文件#第246行修改如下:#

root_dir

=

os.path.dirname(os.path.realpath(

file

))ln

-s

`pwd`/rmats.py

~/transcriptome/soft易生信易生信,畢生緣;培訓(xùn)。34Conda安裝samtools,multiqcconda

install

-y

-q

samtools

multiqcpip

install -i

RSeQC

htseqrmats2sashimiplot易生信35易生信,畢生緣;培訓(xùn)。Conda安裝大部分軟件conda

install

-y

-q

samtools

multiqc

rseqc

fastqc

salmon

starstringtie

sra-tools

trimmomatic

rmats

rmats2sashimiplot易生信易生信,畢生緣;培訓(xùn)。36數(shù)據(jù)備份rsyncrsync則是一個增量備份工具,只針對修改過的文件的修改過的部分進(jìn)行同步備份,大大縮短了傳輸?shù)奈募臄?shù)量和傳輸時(shí)間。#把本地project目錄下的東西備份到遠(yuǎn)程服務(wù)器的/backup/project目錄下#注意第一個project后面的反斜線,表示拷貝目錄內(nèi)的內(nèi)容,不在目標(biāo)目錄新建project文件夾。#

-a:

archive

mode,

quals

-rlptgoD#-r:

遞歸同步-p:

同步時(shí)保留原文件的權(quán)限設(shè)置#-u:

若文件在遠(yuǎn)端做過更新,則不同步,避免覆蓋遠(yuǎn)端的修改#-L:

同步符號鏈接鏈接的文件,防止在遠(yuǎn)程服務(wù)器出現(xiàn)文件路徑等不匹配導(dǎo)致的軟連接失效#-t:保留修改時(shí)間-v:

顯示更新信息-z:

傳輸過程中壓縮文件,對于傳輸速度慢時(shí)適用rsync

-aruLptvz

--delete

project/

us

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論