




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
轉(zhuǎn)錄組軟件安裝易生信()——最懂你的生信培訓(xùn),學(xué)習(xí)生信更容易易生信學(xué)習(xí)方式提前預(yù)習(xí)仔細(xì)聽講先運(yùn)行再理解緊跟步伐,跟不上的及時(shí)在課堂提出或?qū)ふ抑汤蠋熃鉀Q課后復(fù)習(xí),基礎(chǔ)知識學(xué)習(xí)靠背和反復(fù)練書讀百變,其義自見碼敲十遍,不會也難2易生信,畢生緣;培訓(xùn)。易生信四種常規(guī)的轉(zhuǎn)錄組分析策略StringtieTrinotateTrinotate(d)
不基于比對,直接定量流程ReferencetranscriptHISAT2ReadsSailfish/kallisto/Salmon-SMEM/Salmon-QuasiAlignment-freeisoformquantification
&counting易生信,畢生緣;培訓(xùn)。易生信易生信,畢生緣;培訓(xùn)。4有參不比對轉(zhuǎn)錄組分析流程SequencingRNA-seqreads(2
x
150
bp)Gene
quantificationSalmon(cDNA)DifferentialexpressionDESeq2ImageGPVisualizationGeneannotation(.gtf
file)
(可選)Raw
sequencedata(.fastq
files)CDNA
file(.fafile)InputsEnrichmentanalysisGO/GSEAWGCNACytoscapeNetworkanalysis易生信易生信,畢生緣;培訓(xùn)。5有參比對轉(zhuǎn)錄組分析流程SequencingRNA-seqreads(2
x
150
bp)Read
alignmentSTAR/HISAT2(genome)GeneidentificationStringTieDifferentialexpressionDESeq2ImageGPVisualizationGeneannotation(.gtf
file)Raw
sequencedata(.fastq
files)Referencegenome(.fafile)InputsrMATSAlternativesplicingEnrichmentanalysisGO/GSEAWGCNACytoscapeNetworkanalysisLinux服務(wù)器軟件安裝只用于內(nèi)部培訓(xùn)學(xué)習(xí)使用,請勿傳播。易生信Linux服務(wù)器軟件列表7Fastq-dump
(SRA
toolkit):
公共數(shù)據(jù)下載Fastqc:質(zhì)量評估MultiQC:結(jié)果整合Trimmomatic:reads預(yù)處理Salmon:快速準(zhǔn)確不比對定量工具Conda:包管理器Samtools:sam文件處理工具UCSC
toolkit:
文件格式轉(zhuǎn)換工具集合STAR:轉(zhuǎn)錄組比對工具RSeQC:轉(zhuǎn)錄組比對質(zhì)量評估工具Stringtie:轉(zhuǎn)錄本拼裝工具rMATS:可變剪接分析工具Rmats2sashimiplot:可變剪接可視化工具易生信Linux下的軟件軟件類型腳本二進(jìn)制程序Java包可執(zhí)行屬性軟件或腳本需要有執(zhí)行權(quán)限chmoda+x
soft_name環(huán)境變量告訴系統(tǒng)軟件可能在的位置或使用完整路徑8
易生信,畢生緣;培訓(xùn)
。
易生信易生信,畢生緣;培訓(xùn)。9什么樣的軟件?腳本型解釋型語言寫作,如Bash,R,Python,Perl等,源代碼可直接查看二進(jìn)制型源代碼編譯成機(jī)器語言,直接打開查看亂碼,如bwa,
salmon等Java程序java
-jar
trimmomatic-0.36.jar易生信易生信,畢生緣;培訓(xùn)。10可執(zhí)行屬性–軟件的必須屬性ls
–l
查看文件的屬性(文件夾的可執(zhí)行屬性是可讀屬性)一般在終端不同顏色對應(yīng)不同屬性chmod修改屬性chmod
a+x
file#所有人增加可執(zhí)行屬性chmod
755
file#所有人可執(zhí)行,自己可寫易生信易生信,畢生緣;培訓(xùn)。11環(huán)境變量-軟件在哪?環(huán)境變量PATH是一堆目錄,一堆存放有軟件的目錄。在系統(tǒng)接到命令輸入比如”cd”后,會去環(huán)境變量PATH存儲的目錄中從前向后查找,在哪個目錄發(fā)現(xiàn)存在輸入的命令同名”cd”的文件視為找到程序,然后判斷是否有可執(zhí)行屬性,如果有則執(zhí)行。echo
$PATHexport
PATH=$PATH:~/soft易生信易生信,畢生緣;培訓(xùn)。12環(huán)境變量–永久設(shè)置服務(wù)器自己用戶的家目錄下一般有2個隱藏文件:.bashrc和.bash_profile。.bashrc本地登錄時(shí)讀取。.bash_profile遠(yuǎn)程登錄時(shí)讀取。.bashrc和.bash_profile是bash腳本,可以寫任何bash命令。需要把環(huán)境變量設(shè)置命令寫入.bash_profile中。易生信易生信,畢生緣;培訓(xùn)。13系統(tǒng)包管理器安裝最簡單方便,但一般更新慢,需要根用戶權(quán)限。yum
update#Centos更新yum
search
soft_name
orsoft_descriptionyum
install
soft_official_nameapt-get
update#Ubuntu更新apt-cache
search
soft_name
orsoft_descriptionapt-get
install
soft-name易生信易生信,畢生緣;培訓(xùn)。14編譯好的二進(jìn)制文件編譯好的多平臺通用二進(jìn)制文件或特定平臺可用二進(jìn)制文件,下載,解壓,增加可執(zhí)行屬性,放入環(huán)境變量,直接調(diào)用。認(rèn)真看軟件說明手冊,如果提供了二進(jìn)制版本,盡量使用二進(jìn)制版本,簡單方便,把時(shí)間多放在數(shù)據(jù)上,而不是軟件安裝上。一般可執(zhí)行程序放置在bin
目錄下。易生信易生信,畢生緣;培訓(xùn)。15經(jīng)典的源碼安裝./configure
&&
make
&&
make
install./configure是檢測系統(tǒng)的庫文件、頭文件、依賴的軟件是否存在及版本是否
兼容,并根據(jù)檢測結(jié)果生成Makefile文件。這一步是軟件安裝是否能成功的關(guān)鍵,檢測通過安裝一般沒問題。檢測不通過,缺什么補(bǔ)什么。如果非根
用
戶
,
這
一
步
通
常
也
會
配
置
下
軟
件
安
裝
的
路
徑
--prefix=/home/ct/soft/specific_name。make具體的編譯過程,根據(jù)Makefile中的規(guī)則把程序語言轉(zhuǎn)換為機(jī)器語言。make install拷貝make編譯出的可執(zhí)行文件或依賴的動態(tài)庫到prefix指定的目錄。置入環(huán)境變量即可使用。易生信易生信,畢生緣;培訓(xùn)。16Python包的安裝Python包管理器安裝
easy_install
package_namepip
install
package_name
-i
Python包手動源碼安裝
python
setup.py
buildpython
setup.py
installConda安裝conda
install
package_name易生信易生信,畢生緣;培訓(xùn)。17Conda軟件包管理神器conda:任意語言的軟件包、環(huán)境、依賴關(guān)系的開源管理系統(tǒng)。Anaconda:集合了常用Python包的數(shù)據(jù)科學(xué)平臺Minoconda:精簡版Anaconda,只包含conda和Pythonbioconda:conda的一個通道,含8744個生信分析軟件和版本收錄,剛剛發(fā)表于
Nature
Method易生信易生信,畢生緣;培訓(xùn)。18Anaconda下載硬盤空間允許的情況下建議Anaconda,帶的軟件包、頭文件、庫文件多,一致性好,后續(xù)安裝發(fā)生沖突的可能性低。易生信易生信,畢生緣;培訓(xùn)。19Anaconda安裝wget
-cx86_64.sh#-p
指定安裝路徑#-b-f
不做提示,直接安裝bash
Anaconda2-5.1.0-Linux-x86_64.sh
-b
-f
-p
~/conda易生信易生信,畢生緣;培訓(xùn)。20Anaconda增加通道conda
config
--add
channels
conda-forge
#
Lowest
priorityconda
config
--add
channelsconda
config
--add
channels
r
#
Optionalconda
config
--add
channels
defaultsconda
config--add
channels
bioconda#增加軟件支持conda
config--add
channels
Anocanda清華鏡像,國內(nèi)鏡像,加速下載conda
config
--add
channelsconda
config--add
channels
#清華通道,最高優(yōu)先級conda
config
--add
channelsconda
config
--set
show_channel_urls
yes易生信易生信,畢生緣;培訓(xùn)。21創(chuàng)建新的運(yùn)行環(huán)境創(chuàng)建transcriptome環(huán)境,指定使用的R和python版本conda
create
-y
-n
transcriptome
r-base=3.5.2
python=2.7在新環(huán)境transcriptome中安裝軟件conda
install
-n
transcriptome
-yfastqc激活新環(huán)境transcriptomesource
activate
transcriptome退出transcriptome環(huán)境source
deactivate
transcriptome易生信易生信,畢生緣;培訓(xùn)。22判斷可執(zhí)行文件的位置和當(dāng)前所在環(huán)境which
python返回python的位置
激活conda的環(huán)境在終端會有標(biāo)識易生信易生信,畢生緣;培訓(xùn)。23軟件和數(shù)據(jù)庫下載wget-c
soft_url/database_url#-c斷點(diǎn)續(xù)傳wget-c
ftp:///blast/db/nt.*.tar.gz
支持通配符
wget-cr-np-nd
ftp:///blast/db/遞歸下載同類工具還有curl和axel,都可以用易生信易生信,畢生緣;培訓(xùn)。24環(huán)境變量設(shè)置#
把soft目錄加大環(huán)境變量中,新安裝的軟件都軟鏈到soft目錄,省去了重復(fù)source的過程cat
<<END
>>~/.bash_profileexport
PATH=~/transcriptome/soft:~/anaconda2/bin:\$PATHENDsource
~/.bash_profile易生信易生信,畢生緣;培訓(xùn)。25SRA
toolkit安裝wget -ccentos_linux64.tar.gztar
xvzf
sratoolkit.2.9.0-centos_linux64.tar.gzln-s
`pwd`/sratoolkit.2.9.0-centos_linux64/bin/fastq-dump
~/transcriptome/soft#若運(yùn)行成功,則輸出為~/transcriptome/soft/fastq-dumpwhich
fastq-dump易生信Fastqc軟件安裝cd
~/transcriptome/soft-c26wgetunzip
fastqc_v0.11.5.zipchmod
755
FastQC/fastqc#假設(shè)~/transcriptome/soft目錄在環(huán)境變量中l(wèi)n
-s
`pwd`/FastQC/fastqc
~/transcriptome/soft/易生信Trimmomatic安裝cd~/transcriptome/softwget
-cunzip
Trimmomatic-0.36.zip\$(readlink
-f
\$0))/trimmomatic-0.36.jar
\$*"cd
Trimmomatic-0.36echo
"java -jar
\$(dirname>trimmomatic.shchmod
755
trimmomatic.sh27易生信,畢生緣;培訓(xùn)。#假設(shè)~/transcriptome/soft目錄在環(huán)境變量中易生信易生信,畢生緣;培訓(xùn)。28Salmon安裝wget -calpha/salmon-latest_linux_x86_64.tar.gztar
xvzf
salmon-latest_linux_x86_64.tar.gzln-s`pwd`/salmon-latest-linux_x86_64/bin/salmon
~/transcriptome/soft易生信易生信,畢生緣;培訓(xùn)。29UCSC
toolkitcd
~/transcriptome/softUcsc=“/admin/exe/linux.x86_64/”wget
-c
${Ucsc}bedSortwget
-c${Ucsc}bedGraphToBigWigwget
-c${Ucsc}gtfToGenePredwget
-c${Ucsc}genePredToBedChmod
755
bed*
gtf*
gene*易生信易生信,畢生緣;培訓(xùn)。30STAR安裝cd~/transcriptome/softwget -O
STAR.2.6.0c.zipunzip
STAR.2.6.0c.zipln
-s
`pwd`/STAR-2.6.0c/bin/Linux_x86_64_static/*
~/transcriptome/soft易生信易生信,畢生緣;培訓(xùn)。31StringTie安裝wget -c1.3.4d.Linux_x86_64.tar.gztar
xvzfstringtie-1.3.4d.Linux_x86_64.tar.gzchmod
755
stringtie-1.3.4d.Linux_x86_64/stringtie#假設(shè)~/transcriptome/soft在環(huán)境變量中l(wèi)n
-sf
`pwd`/stringtie-1.3.4d.Linux_x86_64/stringtie
~/transcriptome/soft易生信Gff工具安裝#安裝paremkdir-pcdgit
clonegit
clonecd
paremake
releaseln
-sf
`pwd`
pare
~/transcriptome/softcdgit
clonecd
gffreadmake32易生信,畢生緣;培訓(xùn)。易生信易生信,畢生緣;培訓(xùn)。33rMATS安裝pip
install
-i
pysam#yum
install
gsl-devel.x86_64
lapack-devel
blas-develcd
~/transcriptome/softwget
-ctar
xvzf
rMATS.4.0.2.tgzpython
-c
"import
sys;
sys.maxunicode"#輸出為1114111,使用rMATS-turbo-Linux-UCS4cd
rMATS.4.0.2/rMATS-turbo-Linux-UCS4chmod
755
rmats.py#默認(rèn)使用全路徑調(diào)用,如果想簡化些,需要修改rmats.py源文件#第246行修改如下:#
root_dir
=
os.path.dirname(os.path.realpath(
file
))ln
-s
`pwd`/rmats.py
~/transcriptome/soft易生信易生信,畢生緣;培訓(xùn)。34Conda安裝samtools,multiqcconda
install
-y
-q
samtools
multiqcpip
install -i
RSeQC
htseqrmats2sashimiplot易生信35易生信,畢生緣;培訓(xùn)。Conda安裝大部分軟件conda
install
-y
-q
samtools
multiqc
rseqc
fastqc
salmon
starstringtie
sra-tools
trimmomatic
rmats
rmats2sashimiplot易生信易生信,畢生緣;培訓(xùn)。36數(shù)據(jù)備份rsyncrsync則是一個增量備份工具,只針對修改過的文件的修改過的部分進(jìn)行同步備份,大大縮短了傳輸?shù)奈募臄?shù)量和傳輸時(shí)間。#把本地project目錄下的東西備份到遠(yuǎn)程服務(wù)器的/backup/project目錄下#注意第一個project后面的反斜線,表示拷貝目錄內(nèi)的內(nèi)容,不在目標(biāo)目錄新建project文件夾。#
-a:
archive
mode,
quals
-rlptgoD#-r:
遞歸同步-p:
同步時(shí)保留原文件的權(quán)限設(shè)置#-u:
若文件在遠(yuǎn)端做過更新,則不同步,避免覆蓋遠(yuǎn)端的修改#-L:
同步符號鏈接鏈接的文件,防止在遠(yuǎn)程服務(wù)器出現(xiàn)文件路徑等不匹配導(dǎo)致的軟連接失效#-t:保留修改時(shí)間-v:
顯示更新信息-z:
傳輸過程中壓縮文件,對于傳輸速度慢時(shí)適用rsync
-aruLptvz
--delete
project/
us
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T-ZSM 0060-2024“領(lǐng)跑者”評價(jià)技術(shù)要求 微型往復(fù)活塞空氣壓縮機(jī)
- 二零二五年度競業(yè)禁止期限及競業(yè)限制解除后的競業(yè)禁止責(zé)任及賠償執(zhí)行及監(jiān)督合同
- 二零二五年度金融衍生品合同印花稅稅率變動與市場創(chuàng)新
- 二零二五年度手房過戶二手房交易中介服務(wù)合同協(xié)議
- 二零二五年度智慧能源合伙經(jīng)營股權(quán)協(xié)議書
- 二零二五年度文藝演出宣傳推廣合作協(xié)議
- 2025年度智能債權(quán)轉(zhuǎn)讓服務(wù)合同不可適用借款合同解析
- 2025年度生態(tài)魚塘資源租賃管理合同
- 二零二五年度商鋪?zhàn)赓U糾紛解決機(jī)制合同
- 二零二五年度跨區(qū)域集體合同-XX行業(yè)職工勞動條件提升協(xié)議
- 近三年投標(biāo)沒有發(fā)生過重大質(zhì)量安全事故的書面聲明范文
- 《工程熱力學(xué)》(第四版)全冊配套完整課件
- 2024時(shí)事政治考試題庫(100題)
- 2024年司法考試真題及答案
- 膽總管切開取石T管引流術(shù)護(hù)理查房參考課件
- YYT 1814-2022 外科植入物 合成不可吸收補(bǔ)片 疝修補(bǔ)補(bǔ)片
- 工程機(jī)械設(shè)備綜合保險(xiǎn)
- 中圖版高中地理選擇性必修1第3章第1節(jié)常見天氣現(xiàn)象及成因課件
- 2024年時(shí)政必考試題庫(名師系列)
- 獸醫(yī)檢驗(yàn)題庫與答案
- 第三章 環(huán)境污染物在體內(nèi)的生物轉(zhuǎn)運(yùn)和生物轉(zhuǎn)化課件
評論
0/150
提交評論