4.1.キュー

目次 (4.1.キュー)

4.1.   キュー
4.1.1.  キューの一覧
4.1.2.  キュー情報の確認方法
4.1.3.  利用可能なノード数の確認方法

▲このページの先頭へ

4.1.キュー

4.1.1.キューの一覧

フロントエンドサーバから演算ノードに対して、ジョブを投入できるキューの一覧を示します。
表4.1.1 キューの一覧

システムキュー名最長実行時間最大同時ジョブ投入数最大ノード数
(※1)
ジョブあたり
最大ノード数
(※1)
ノードあたり
コア数
キュー種別備考
Aシステムa024h24時間400/ユーザ646412従量
Aシステムa168h168時間400/ユーザ323212従量
Bシステムb024h24時間400/ユーザ2216従量
Bシステムb168h168時間400/ユーザ1116従量
Fシステムf024h24時間400/ユーザ606040従量
Fシステムf168h168時間400/ユーザ161640従量
Fシステムf024h_p10024時間400/ユーザ2240従量GPU搭載
Fシステムf168h_p100168時間400/ユーザ2240従量GPU搭載
Hシステムh024h24時間400/ユーザ1361368従量
Hシステムh168h168時間400/ユーザ55558従量
Qシステムq024h24時間400/ユーザ1164従量AMD(64core)
Qシステムq024h_a10024時間400/ユーザ1164従量AMD(64core) + GPU搭載
Rシステムr024h24時間400/ユーザ101032従量AMD(32core)
Rシステムr168h168時間400/ユーザ5532従量AMD(32core)
Sシステム32コアVMs024h_032c24時間400/ユーザ969632従量AMD(32core)
Sシステム32コアVMs168h_032c168時間400/ユーザ727232従量AMD(32core)
Sシステム92コアVMs024h_092c24時間400/ユーザ323292従量AMD(92core)
Sシステム92コアVMs168h_092c168時間400/ユーザ242492従量AMD(92core)
Vシステムv024h24時間400/ユーザ2220従量VPU搭載
Vシステムv168h168時間400/ユーザ2220従量VPU搭載
Wシステムw024h24時間400/ユーザ2240従量VPU 8基搭載
Xシステムx024h24時間400/ユーザ6648従量Arm(A64fx)機
Zシステムz024h24時間400/ユーザ202040従量
Zシステムz168h168時間400/ユーザ8840従量
HPCIプリポストp168h168時間3/ユーザ118無償無償
Aシステムa006m6分5/ユーザ2212無償(デバッグ)※2
Bシステムb006m6分5/ユーザ2216無償(デバッグ)※2
Fシステムf006m6分5/ユーザ2240無償(デバッグ)※2
Fシステムf006m_p1006分5/ユーザ2240無償(デバッグ)※2, GPU搭載
Hシステムh006m6分5/ユーザ448無償(デバッグ)※2
Sシステム32コアVMs006m_032c6分5/ユーザ2232無償(デバッグ)※2
Sシステム92コアVMs006m_092c6分5/ユーザ2292無償(デバッグ)※2
Zシステムz006m6分5/ユーザ4440無償(デバッグ)※2, デフォルトキュー
  1.  予約状況や混雑状況等により、変更する場合があります。
  2.  デバッグキューです。計算資源利用料金は発生しません。デバッグ(ソフトウェアの動作検証等)にご利用ください。なお、FOCUSスパコン従量利用ソフトウェア(Gaussian等)を実行した場合、計算資源利用料金は発生しませんが、ソフトウェア利用料金は発生します。
  1. 実際に本システムを利用する際には、sinfo -s コマンドで利用できるキュー名を確認して下さい。
  2. キューのノード実行状況を確認する際には、squeuesコマンドで確認して下さい。
  3. デフォルトキューは「z006m」となります。ジョブ実行時にキュー名が省略された場合「z006m」で実行されます。
  4. ISVアカウントではデバッグキュー(※2)のみ利用可能です。6分以上の実行が必要となる場合は、ヘルプデスクからご相談ください。

▲このページの先頭へ

4.1.2.キュー情報の確認方法

ジョブ投入先のキュー名を確認するには、sinfoコマンドを実行します。

$ sinfo -s

【実行例】

$ sinfo -s
PARTITION AVAIL  TIMELIMIT   NODES(A/I/O/T)  NODELIST
a024h             up 1-00:00:00     0/194/11/205  a[001-095,097-204,207-208]
a168h             up 7-00:00:00        0/31/1/32  a[001-032]
b024h             up 1-00:00:00          0/2/0/2  b[001-002]
b168h             up 7-00:00:00          0/1/0/1  b001
d024h             up 1-00:00:00       17/63/0/80  d[001-080]
d168h             up 7-00:00:00       17/23/0/40  d[001-040]
e168h          inact 7-00:00:00          0/0/0/0
f024h             up 1-00:00:00       13/40/5/58  f[201-254,257-260]
f072h             up 3-00:00:00       13/18/1/32  f[201-232]
f072h_p100        up 3-00:00:00          0/2/0/2  f[601-602]
h024h             up 1-00:00:00      45/91/0/136  h[001-136]
h072h             up 3-00:00:00      45/57/0/102  h[001-102]
v024h             up 1-00:00:00          0/2/0/2  v[001-002]
v072h             up 3-00:00:00          0/2/0/2  v[001-002]
p072h             up 3-00:00:00          0/1/0/1  hpcipps1
g006m*            up       6:00          0/4/0/4  g[001-004]
a006m             up       6:00          0/2/0/2  a[207-208]
b006m             up       6:00          0/2/0/2  b[001-002]
d006m             up       6:00          0/2/0/2  d[079-080]
f006m             up       6:00          0/2/0/2  f[601-602]
h006m             up       6:00          0/4/0/4  h[068,102,131,136]
v006m             up       6:00          0/2/0/2  v[001-002]

<出力説明>

カラム名 意味
PARTITION キュー名(パーティション名)
AVAIL キューの状態(up or inact)
TIMELIMIT 最大実行時間
NODES(A/I/O/T) ノードの状態(allocated/idle/other/total)
NODELIST キュー(パーティション)に割り当てられたノード

キューのノード実行状況を確認するには、squeuesコマンドを実行します。
注意:SLURMの標準コマンドのsqueueとは別コマンドです。

$ squeues

【実行例】

$ squeues
QUEUE_NAME       TIMELIMIT   STATUS MAXNODES NNODES DEPEND PEND RUN FREE
a006m                 6:00       up        2      0      0    0   0    2
a024h           1-00:00:00       up      194      0      0    0   0  194
a168h           7-00:00:00       up       31      0      0    0   0   31
b006m                 6:00       up        2      0      0    0   0    2
b024h           1-00:00:00       up        2      0      0    0   0    2
b168h           7-00:00:00       up        1      0      0    0   0    1
d006m                 6:00       up        2      0      0    0   0    2
d024h           1-00:00:00       up       80     17      0    0  17   63
d168h           7-00:00:00       up       40     17      0    0  17   23
e168h           7-00:00:00 inactive        0      0      0    0   0    0
f006m                 6:00       up        2      0      0    0   0    2
f024h           1-00:00:00       up       53     13      0    0  13   40
f072h           3-00:00:00       up       31     13      0    0  13   18
f072h_p100      3-00:00:00       up        2      0      0    0   0    2
g006m                 6:00       up        4      0      0    0   0    4
h006m                 6:00       up        4      0      0    0   0    4
h024h           1-00:00:00       up      136     45      0    0  45   91
h072h           3-00:00:00       up      102     45      0    0  45   57
p072h           3-00:00:00       up        1      0      0    0   0    1
v006m                 6:00       up        2      0      0    0   0    2
v024h           1-00:00:00       up        2      0      0    0   0    2
v072h           3-00:00:00       up        2      0      0    0   0    2

<出力説明>

カラム名 意味
QUEUE_NAME キュー名(パーティション名)
TIMELIMIT 最大実行時間
STATUS キューの状態(up or inact)
MAXNODES 最大ノード数
NNODES 実行中及び実行待ちのジョブが要求しているノード数
DEPEND 実行待ち(Dependency)のジョブが要求しているノード数
PEND 実行待ちのジョブが要求しているノード数
RUN 実行中のノード数
FREE 空きノード数

▲このページの先頭へ

4.1.3.利用可能なノード数の確認方法

空きノード数を確認するfreenodesというコマンドを用意しています。ジョブ投入のための空きノード数の確認の目安にご利用ください。

$ freenodes

【出力形式】

Number of free nodes in A sys.  with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in B sys.  with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in D sys.  with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in E sys.  with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in F sys.  with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in G sys.  with 10GbE  connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in H sys.  with 10GbE  connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in V sys.  with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in HPCIPPS with FDR-IB connected is 空きノード数 / 提供最大ノード数.

【実行例】

$ freenodes
Number of free nodes in A sys.  with QDR-IB connected is 195/ 195.
Number of free nodes in B sys.  with QDR-IB connected is   2/   2.
Number of free nodes in D sys.  with FDR-IB connected is  63/  80.
Number of free nodes in E sys.  with FDR-IB connected is   0/   0.
Number of free nodes in F sys.  with FDR-IB connected is  42/  55.
Number of free nodes in G sys.  with 10GbE  connected is   4/   4.
Number of free nodes in H sys.  with 10GbE  connected is  92/ 136.
Number of free nodes in V sys.  with FDR-IB connected is   2/   2.
Number of free nodes in HPCIPPS with FDR-IB connected is   1/   1.

▲このページの先頭へ