版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、LSF作業(yè)治理系統(tǒng)使用方法這份文檔將指導(dǎo)您通過 LSF提交和治理作業(yè).文檔包含了使用LSF提交、查看、刪除作業(yè)的相關(guān)內(nèi)容.遵循文檔的操作標(biāo)準(zhǔn)和反應(yīng)方法,將幫助您順利完成工作.也歡送大家對文檔內(nèi)容提出建議,謝謝!Contentshide 1通過LSF查看集群運(yùn)行狀態(tài)o1.1查看LSF計(jì)算節(jié)點(diǎn)列表bhostso1.2查看 LSF 隊(duì)歹U bqueueso1.3查看計(jì)算節(jié)點(diǎn)負(fù)載 Isload2 使用LSF提交作業(yè)bsubo2.1手動(dòng)提交作業(yè)o2.2交互式批量提交o2.3編寫LSF作業(yè)限制腳本o2.4一個(gè)功能更完整的 LSF作業(yè)限制腳本3其他作業(yè)治理操作o3.1查看作業(yè)狀態(tài) bjobso3.2終止作業(yè)
2、 bkillo3.3監(jiān)視作業(yè)輸出bpeek0 3.4作業(yè)歷史信息bhist4 參考資料通過LSF查看集群運(yùn)行狀態(tài)查看LSF計(jì)算節(jié)點(diǎn)列表bhosts# bhostsHOST_NAMESTATUSJL/UMAX NJOBSRUN SSUSP USUSPRSVfat01ok-1600000fat02ok-1600000fat03ok-1600000fat04ok-1600000fat05ok-1600000fat06ok-1600000fat07ok-1600000fat08ok-1600000fat09ok-1600000fat10ok-1600000查看LSF隊(duì)歹U bqueues查看所有隊(duì)列的
3、整體信息:# bqueuesQUEUE_NAME PRIO STATUS MAX JL/U JL/P JL/H NJOBS PEND RUN SUSPcpu40 Open:Active- 20720 20720fat 40 Open:Active - - - -0000gpu40 Open:Active- - - - 288 0 288 0mic40 Open:Active-0000cpu-fat40 Open:Active- - - - 16 0 16 0查看某個(gè)隊(duì)列的信息:# bqueues fatQUEUENAME PRIO STATUS MAX JL/U JL/P JL/H NJOBS
4、 PEND RUN SUSPfat 40 Open:Active - - - -0000查看計(jì)算節(jié)點(diǎn)負(fù)載lsload查看整體負(fù)載:# lsloadHOST_NAMEstatus r15sr1m r15m utpg lsit tmp swp memnode011ok 0.0 0.30.4 0% 0.0049024193G 62G 61Gnode039ok 0.0 0.60.5 0% 0.0049024194G 62G 61Gnode041ok 0.0 0.00.0 0% 0.0049024194G 62G 61Gnode050ok 0.0 0.00.0 0% 0.0049024194G 62G
5、60Gnode064ok 0.0 0.70.6 0% 0.0049024194G 62G 61Gnode077ok 0.0 0.70.5 0% 0.0049024194G 62G 61G查看某個(gè)節(jié)點(diǎn)的負(fù)載:# Isload node001HOST_NAME status r15s rim r15m ut pg Is it tmp swp memnode001 ok 0.3 0.1 0.1 1% 0.0 0 332 152G 62G 61G使用LSF提交作業(yè)bsub手動(dòng)提交作業(yè)LSF使用bsub提交作業(yè).bsub命令的格式是:bsub -n Z -q QUEUENAME -i INPUTFILE
6、 -o OUTPUTFILE COMMAND其中:Z提交作業(yè)需要的線程數(shù),-q指定作業(yè)提交的隊(duì)列.如果不添加 -q選項(xiàng),系統(tǒng)將把作業(yè)提交到默認(rèn)的作業(yè)隊(duì)列.INPUTFILE表示程序需要讀入的文件名,OUTPUTFILES示輸出文件名,作業(yè)提交后的輸出到標(biāo)準(zhǔn)輸出信息將會(huì)保存在這個(gè)文件中.對于串行作業(yè),COMMAND以直接使用您的程序名.例如,將串行程序 mytest的通過LSF提交:bsub -n 1 -q q_default -o mytest.out ./mytest對于MPI并行作業(yè),COMMAN隔式為-a mpich_gm mpirun.lsf PROG_NAME. 例如,將并行程序my
7、test ,通過LSF提交,使用16個(gè)線程運(yùn)行這個(gè)作業(yè):bsub -n 16 -q q_default -o mytest.out -a mpich_gm mpirun.lsf ./mytest嘔心瀝血整理word4交互式批量提交使用bsub還可以啟動(dòng)一個(gè)交互式的 shell環(huán)境,一次提交多個(gè)運(yùn)行參數(shù)相同的并行作業(yè).例如下面的操作:# bsubbsub> -n 16bsub> -q q_defaultbsub> -o output.txtbsub> COMMAND1bsub> COMMAND2bsub> COMMAND3等價(jià)于:bsub -n 16 -q q
8、_default -o output.txt COMMAND1bsub -n 16 -q q_default -o output.txt COMMAND2bsub -n 16 -q q_default -o output.txt COMMAND3編寫LSF作業(yè)限制腳本# BSUB -n 16# BSUB -q q_default# BSUB -o output.txt-a mpich_gm mpirun.lsf ./mytestbsub還接受來自標(biāo)準(zhǔn)輸入的作業(yè)說明.因此,我們可以編寫 LSF腳本提交作業(yè).bsub腳本簡單易寫,上面一段代碼是名為bsub.script的完整例子,將bsub.sc
9、ript通過輸入重定向,提交給LSF:bsub < bsub.script這等價(jià)于:bsub -n 16 -q q_default -o output.txt -a mpich_gm mpirun.lsf ./mytest一個(gè)功能更完整的LSF作業(yè)限制腳本#BSUB -J HELLO_MPI#BSUB -o job.out#BSUB -e job.err#BSUB -n 256source /lustre/utility/intel/composer_xe_2021.3.163/bin/compilervars.sh intel64source /lustre/utility/intel
10、/mkl/bin/intel64/mklvars_intel64.shsource /lustre/utility/intel/impi/4.1.1.036/bin64/mpivars.shMPIRUN='which mpirun'EXE="./mpihello"CURDIR=$PWDcd $CURDIRrm -f nodelist nodes >& /dev/null touch nodelisttouch nodesNP=0for host in 'echo $LSB_MCPU_HOSTS |sed -e 's/ /:/g&
11、#39;| sed 's/:n/nn/g doecho $host >> nodelistecho $host | cut -d ":" -f1 >> nodesnn='echo $host | cut -d ":" -f2'NP='echo $NP+$nn | bc'done其他作業(yè)治理操作查看作業(yè)狀態(tài)bjobs檢查已提交的作業(yè)的運(yùn)行狀態(tài):bjobs以寬格式來顯示作業(yè)運(yùn)行狀態(tài):bjobs -w顯示所有作業(yè):bjobs -a顯示正在運(yùn)行的作業(yè):bjobs -r顯示等待運(yùn)行(pending)的作業(yè)和等待的原因:bjobs -p顯示已經(jīng)掛起(suspending)的作業(yè)和掛起的原因:bjobs -s顯示JOBID這個(gè)作業(yè)的所有信息:bjobs -l JOBID終止作業(yè) bkill終止不需要的作業(yè):bkill終止JOBID這個(gè)作業(yè)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度水產(chǎn)養(yǎng)殖業(yè)務(wù)協(xié)作協(xié)議樣本
- 2024年乳膠漆交易協(xié)議規(guī)范
- 2024年度定制機(jī)器購買協(xié)議模板
- 2024年圍擋工程協(xié)議模板
- 2024年專業(yè)貼磚工人勞動(dòng)協(xié)議模板
- 城市日常用車租賃協(xié)議2024
- 文書模板-《勞務(wù)試用期合同》
- 2024年度信息系統(tǒng)運(yùn)維服務(wù)協(xié)議樣本
- 2024年度鋁錠買賣協(xié)議格式
- 2024年租房補(bǔ)充協(xié)議規(guī)范樣本
- 熱分析(DSC)匯總課件
- 博物館管理制度講解員管理制度版
- 非煤礦山培訓(xùn)課件
- 醫(yī)院智能化弱電設(shè)計(jì)方案
- “雙減”背景下家校社協(xié)同育人的內(nèi)涵、機(jī)制與實(shí)踐路徑
- (完整版)辦理《出生醫(yī)學(xué)證明》委托書
- 高考專題復(fù)習(xí):散句與整句變換(課件32張)
- 施工安全用電檢查表(標(biāo)準(zhǔn)范本)
- 論動(dòng)體的電動(dòng)力學(xué)(雙語)
- GB∕T 4623-2014 環(huán)形混凝土電桿
- 化學(xué)崗位應(yīng)急處置卡
評論
0/150
提交評論