目次 (4.1.キュー)
4.1. キュー
4.1.1. キューの一覧
4.1.2. キュー情報の確認方法
4.1.3. 利用可能なノード数の確認方法
4.1.キュー
4.1.1.キューの一覧
フロントエンドサーバから演算ノードに対して、ジョブを投入できるキューの一覧を示します。
表4.1.1 キューの一覧
システム | キュー名 | 最長実行時間 | 最大同時ジョブ投入数 | 最大ノード数 (※1) | ジョブあたり 最大ノード数 (※1) | ノードあたり コア数 | キュー種別 | 備考 |
---|---|---|---|---|---|---|---|---|
Aシステム | a024h | 24時間 | 400/ユーザ | 64 | 64 | 12 | 従量 | |
Aシステム | a168h | 168時間 | 400/ユーザ | 32 | 32 | 12 | 従量 | |
Bシステム | b024h | 24時間 | 400/ユーザ | 2 | 2 | 16 | 従量 | |
Bシステム | b168h | 168時間 | 400/ユーザ | 1 | 1 | 16 | 従量 | |
Fシステム | f024h | 24時間 | 400/ユーザ | 60 | 60 | 40 | 従量 | |
Fシステム | f168h | 168時間 | 400/ユーザ | 16 | 16 | 40 | 従量 | |
Fシステム | f024h_p100 | 24時間 | 400/ユーザ | 2 | 2 | 40 | 従量 | GPU搭載 |
Fシステム | f168h_p100 | 168時間 | 400/ユーザ | 2 | 2 | 40 | 従量 | GPU搭載 |
Hシステム | h024h | 24時間 | 400/ユーザ | 136 | 136 | 8 | 従量 | |
Hシステム | h168h | 168時間 | 400/ユーザ | 55 | 55 | 8 | 従量 | |
Qシステム | q024h | 24時間 | 400/ユーザ | 1 | 1 | 64 | 従量 | AMD(64core) |
Qシステム | q024h_a100 | 24時間 | 400/ユーザ | 1 | 1 | 64 | 従量 | AMD(64core) + GPU搭載 |
Rシステム | r024h | 24時間 | 400/ユーザ | 10 | 10 | 32 | 従量 | AMD(32core) |
Rシステム | r168h | 168時間 | 400/ユーザ | 5 | 5 | 32 | 従量 | AMD(32core) |
Sシステム32コアVM | s024h_032c | 24時間 | 400/ユーザ | 78 | 78 | 32 | 従量 | AMD(32core) |
Sシステム32コアVM | s168h_032c | 168時間 | 400/ユーザ | 54 | 54 | 32 | 従量 | AMD(32core) |
Sシステム92コアVM | s024h_092c | 24時間 | 400/ユーザ | 28 | 28 | 92 | 従量 | AMD(92core) |
Sシステム92コアVM | s168h_092c | 168時間 | 400/ユーザ | 18 | 18 | 92 | 従量 | AMD(92core) |
Sシステム192コア | s024h_192c | 24時間 | 400/ユーザ | 4 | 4 | 192 | 従量 | AMD(192core) |
Sシステム192コア | s168h_192c | 168時間 | 400/ユーザ | 2 | 2 | 192 | 従量 | AMD(192core) |
Vシステム | v024h | 24時間 | 400/ユーザ | 2 | 2 | 20 | 従量 | VPU搭載 |
Vシステム | v168h | 168時間 | 400/ユーザ | 2 | 2 | 20 | 従量 | VPU搭載 |
Wシステム | w024h | 24時間 | 400/ユーザ | 2 | 2 | 40 | 従量 | VPU 8基搭載 |
Xシステム | x024h | 24時間 | 400/ユーザ | 6 | 6 | 48 | 従量 | Arm(A64FX)機 |
Zシステム | z024h | 24時間 | 400/ユーザ | 20 | 20 | 40 | 従量 | |
Zシステム | z168h | 168時間 | 400/ユーザ | 8 | 8 | 40 | 従量 | |
HPCIプリポスト | p168h | 168時間 | 3/ユーザ | 1 | 1 | 8 | 無償 | 無償 |
Aシステム | a006m | 6分 | 5/ユーザ | 2 | 2 | 12 | 無償(デバッグ) | ※2 |
Bシステム | b006m | 6分 | 5/ユーザ | 2 | 2 | 16 | 無償(デバッグ) | ※2 |
Fシステム | f006m | 6分 | 5/ユーザ | 2 | 2 | 40 | 無償(デバッグ) | ※2 |
Fシステム | f006m_p100 | 6分 | 5/ユーザ | 2 | 2 | 40 | 無償(デバッグ) | ※2, GPU搭載 |
Hシステム | h006m | 6分 | 5/ユーザ | 4 | 4 | 8 | 無償(デバッグ) | ※2 |
Sシステム32コアVM | s006m_032c | 6分 | 5/ユーザ | 3 | 3 | 32 | 無償(デバッグ) | ※2 |
Sシステム32コアVM | s001h_032c_RL | 1時間 | 5/ユーザ | 3 | 3 | 32 | 無償(デバッグ) | RockyLinux検証キュー 2024年4月~6月末 |
Sシステム92コアVM | s006m_092c | 6分 | 5/ユーザ | 2 | 2 | 92 | 無償(デバッグ) | ※2 |
Zシステム | z006m | 6分 | 5/ユーザ | 2 | 2 | 40 | 無償(デバッグ) | ※2, デフォルトキュー |
- 予約状況や混雑状況等により、変更する場合があります。
特にSシステムについては利用状況を鑑みてノード数、VM数を変更する場合があります。 - デバッグキューです。計算資源利用料金は発生しません。デバッグ(ソフトウェアの動作検証等)にご利用ください。なお、FOCUSスパコン従量利用ソフトウェア(Gaussian等)を実行した場合、計算資源利用料金は発生しませんが、ソフトウェア利用料金は発生します。
- 実際に本システムを利用する際には、
sinfo -s
コマンドで利用できるキュー名を確認して下さい。 - キューのノード実行状況を確認する際には、
squeues
コマンドで確認して下さい。 - デフォルトキューは「z006m」となります。ジョブ実行時にキュー名が省略された場合「z006m」で実行されます。
- ISVアカウントではデバッグキュー(※2)のみ利用可能です。6分以上の実行が必要となる場合は、ヘルプデスクからご相談ください。
4.1.2.キュー情報の確認方法
ジョブ投入先のキュー名を確認するには、sinfo
コマンドを実行します。
$ sinfo -s
【実行例】
$ sinfo -s PARTITION AVAIL TIMELIMIT NODES(A/I/O/T) NODELIST a024h up 1-00:00:00 0/194/11/205 a[001-095,097-204,207-208] a168h up 7-00:00:00 0/31/1/32 a[001-032] b024h up 1-00:00:00 0/2/0/2 b[001-002] b168h up 7-00:00:00 0/1/0/1 b001 d024h up 1-00:00:00 17/63/0/80 d[001-080] d168h up 7-00:00:00 17/23/0/40 d[001-040] e168h inact 7-00:00:00 0/0/0/0 f024h up 1-00:00:00 13/40/5/58 f[201-254,257-260] f072h up 3-00:00:00 13/18/1/32 f[201-232] f072h_p100 up 3-00:00:00 0/2/0/2 f[601-602] h024h up 1-00:00:00 45/91/0/136 h[001-136] h072h up 3-00:00:00 45/57/0/102 h[001-102] v024h up 1-00:00:00 0/2/0/2 v[001-002] v072h up 3-00:00:00 0/2/0/2 v[001-002] p072h up 3-00:00:00 0/1/0/1 hpcipps1 g006m* up 6:00 0/4/0/4 g[001-004] a006m up 6:00 0/2/0/2 a[207-208] b006m up 6:00 0/2/0/2 b[001-002] d006m up 6:00 0/2/0/2 d[079-080] f006m up 6:00 0/2/0/2 f[601-602] h006m up 6:00 0/4/0/4 h[068,102,131,136] v006m up 6:00 0/2/0/2 v[001-002]
<出力説明>
カラム名 | 意味 |
---|---|
PARTITION | キュー名(パーティション名) |
AVAIL | キューの状態(up or inact) |
TIMELIMIT | 最大実行時間 |
NODES(A/I/O/T) | ノードの状態(allocated/idle/other/total) |
NODELIST | キュー(パーティション)に割り当てられたノード |
キューのノード実行状況を確認するには、squeues
コマンドを実行します。
注意:SLURMの標準コマンドのsqueue
とは別コマンドです。
$ squeues
【実行例】
$ squeues QUEUE_NAME TIMELIMIT STATUS MAXNODES NNODES DEPEND PEND RUN FREE a006m 6:00 up 2 0 0 0 0 2 a024h 1-00:00:00 up 194 0 0 0 0 194 a168h 7-00:00:00 up 31 0 0 0 0 31 b006m 6:00 up 2 0 0 0 0 2 b024h 1-00:00:00 up 2 0 0 0 0 2 b168h 7-00:00:00 up 1 0 0 0 0 1 d006m 6:00 up 2 0 0 0 0 2 d024h 1-00:00:00 up 80 17 0 0 17 63 d168h 7-00:00:00 up 40 17 0 0 17 23 e168h 7-00:00:00 inactive 0 0 0 0 0 0 f006m 6:00 up 2 0 0 0 0 2 f024h 1-00:00:00 up 53 13 0 0 13 40 f072h 3-00:00:00 up 31 13 0 0 13 18 f072h_p100 3-00:00:00 up 2 0 0 0 0 2 g006m 6:00 up 4 0 0 0 0 4 h006m 6:00 up 4 0 0 0 0 4 h024h 1-00:00:00 up 136 45 0 0 45 91 h072h 3-00:00:00 up 102 45 0 0 45 57 p072h 3-00:00:00 up 1 0 0 0 0 1 v006m 6:00 up 2 0 0 0 0 2 v024h 1-00:00:00 up 2 0 0 0 0 2 v072h 3-00:00:00 up 2 0 0 0 0 2
<出力説明>
カラム名 | 意味 |
---|---|
QUEUE_NAME | キュー名(パーティション名) |
TIMELIMIT | 最大実行時間 |
STATUS | キューの状態(up or inact) |
MAXNODES | 最大ノード数 |
NNODES | 実行中及び実行待ちのジョブが要求しているノード数 |
DEPEND | 実行待ち(Dependency)のジョブが要求しているノード数 |
PEND | 実行待ちのジョブが要求しているノード数 |
RUN | 実行中のノード数 |
FREE | 空きノード数 |
4.1.3.利用可能なノード数の確認方法
空きノード数を確認するfreenodesというコマンドを用意しています。ジョブ投入のための空きノード数の確認の目安にご利用ください。
$ freenodes
【出力形式】
Number of free nodes in A sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数. Number of free nodes in B sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数. Number of free nodes in D sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数. Number of free nodes in E sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数. Number of free nodes in F sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数. Number of free nodes in G sys. with 10GbE connected is 空きノード数 / 提供最大ノード数. Number of free nodes in H sys. with 10GbE connected is 空きノード数 / 提供最大ノード数. Number of free nodes in V sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数. Number of free nodes in HPCIPPS with FDR-IB connected is 空きノード数 / 提供最大ノード数.
【実行例】
$ freenodes Number of free nodes in A sys. with QDR-IB connected is 195/ 195. Number of free nodes in B sys. with QDR-IB connected is 2/ 2. Number of free nodes in D sys. with FDR-IB connected is 63/ 80. Number of free nodes in E sys. with FDR-IB connected is 0/ 0. Number of free nodes in F sys. with FDR-IB connected is 42/ 55. Number of free nodes in G sys. with 10GbE connected is 4/ 4. Number of free nodes in H sys. with 10GbE connected is 92/ 136. Number of free nodes in V sys. with FDR-IB connected is 2/ 2. Number of free nodes in HPCIPPS with FDR-IB connected is 1/ 1.