付録B.コマンド比較表(SLURMとLSF)

■ユーザーコマンド SLURM LSF
ジョブ実行 sbatch [script_file] bsub [script_file]
ジョブキャンセル scancel [job_id] bkill [job_id]
ジョブ実行状況(ジョブ毎) squeue -j [job_id] bjobs [job_id]
ジョブ実行状況(ユーザー毎) squeue -u [user_name] bjobs -u [user_name]
ジョブのホールド scontrol hold [job_id] bstop [job_id]
ジョブのリリース scontrol release [job_id] bresume [job_id]
キューリストの表示 squeue bqueues
ノードリストの表示 sinfo -N または
scontrol show node
bhosts
クラスタ全体のステータス sinfo bqueues
■環境変数など SLURM LSF
ジョブID $SLURM_JOBID $LSB_JOBID
実行ディレクトリ指定 $SLURM_SUBMIT_DIR $LSB_SUBCWD
実行ホストの指定 $SLURM_SUBMIT_HOST $LSB_SUB_HOST
ノードリストの表示 $SLURM_JOB_NODELIST $LSB_HOSTS/LSB_MCPU_HOST
アレイジョブのインデックス表示 $SLURM_ARRAY_TASK_ID $LSB_JOBINDEX
依存ジョブのインデックス表示 $SLURM_JOB_DEPENDENCY
■ジョブの詳細 SLURM LSF
バッチスクリプトのディレクティブ #SBATCH #BSUB
キュー(パーティション)指定 -p [queue] -q [queue]
実行ノード数 -N [min[-max]] -n [count]
プロセス数の指定 -n [count] -n [count]
実行時間の上限指定(wall time) -t [min] または
-t [days-hh:mm:ss]
-W [hh:mm:ss]
出力ファイル指定 -o [file_name] -o [file_name]
エラー出力指定 -e [file_name] -e [file_name]
出力・エラー出力の総合出力 -e指定無しで-oを使用) -e指定無しで-oを使用)
イベント通知 --mail-type=[events] -B または
-N
イベント通知先メールアドレス指定 --mail-user=[address[,address]] -u [address]
ジョブ再投入 --requeue または
--no-requeue
(未指定時は--no-requeue)
-r
実行ディレクトリ指定 --workdir=[dir_name] (submission directory)
メモリサイズ指定 --mem=[mem][M|G|T] または
--mem-per-cpu=[mem][M|G|T]
-M [MB]
アカウント名の変更 --account=[account] -P [account]
ノード当たりのタスク数指定 --ntasks-per-node=[count]
タスク当たりのCPU数指定 --cpus-per-task=[count]
依存ジョブ --dependency=[type:job_id]
ジョブのプロジェクト化 --wckey=[name] -P [name]
ジョブ実行ホストの詳細 --nodelist=[nodes] または
--exclude=[nodes]
-m [nodes]
アレイジョブ --array=[array_spec] -J "name[array_spec]"
ライセンスの指定 --licenses=[license_spec] -R "rusage[license_spec]"
開始時間指定 --begin=YYYY-MM-DD[THH:MM[:SS]] -b[[year:][month:]daty:]hour:minute