4.1.キュー

目次 (4.1.キュー)

4.1.   キュー
4.1.1.  キューの一覧
4.1.2.  キュー情報の確認方法
4.1.3.  利用可能なノード数の確認方法

▲このページの先頭へ

4.1.キュー

4.1.1.キューの一覧

フロントエンドサーバから演算ノードに対して、ジョブを投入できるキューの一覧を示します。
表4.1.1 キューの一覧

キュー名実行システム最長実行時間最大同時ジョブ投入数最大ノード数 (※1)ジョブあたり最大ノード数 (※1)備考
a024hA24時間2000/利用者208208
a168hA168時間2000/利用者3232
b024hB24時間2000/利用者22
b168hB168時間2000/利用者11
d024hD24時間2000/利用者8080下記(4)参照
d168hD168時間2000/利用者4040下記(4)参照
e168hE168時間2000/利用者2424※3, Phi1基, 下記(5)参照
f024hF24時間2000/利用者6060
f072hF72時間2000/利用者3232
f072h_p100F72時間2000/利用者22GPU搭載
h024hH24時間2000/利用者136136
h072hH72時間2000/利用者102102
v024hV24時間2000/利用者22
v072hV72時間2000/利用者22
p072hHPCIプリポスト72時間3/利用者11無償
a006mA6分5/利用者22※2
b006mB6分5/利用者22※2
d006mD6分5/利用者22※2, 下記(4)参照
e006mE6分5/利用者22※2, ※3, Phi1基, 下記(5)参照
f006mF6分5/利用者22※2, GPU搭載
g006mG6分5/利用者44※2, 下記(3)参照
h006mH6分5/利用者44※2
v006mV6分5/利用者22※2
  1. 予約状況や混雑状況等により、変更する場合があります。
  2. デバッグキューです。計算資源利用料金は発生しません。デバッグ(ソフトウェアの動作検証等)にご利用ください。なお、FOCUS スパコン従量利用ソフトウェア(Gaussian09 等)を実行した場合、計算資源利用料金は発生しませんが、ソフトウェア利用料金は発生します。
  3. 全ノード停止中のため利用を希望される場合はOKBiz(https://secure.okbiz.okwave.jp/focus/)にて技術質問からご相談ください。
  1. 実際に本システムを利用する際には、sinfo -s コマンドで利用できるキュー名を確認して下さい。
  2. キューのノード実行状況を確認する際には、squeuesコマンドで確認して下さい。
  3. デフォルトキューは「g006m」となります。ジョブ実行時にキュー名が省略された場合「g006m」で実行されます。
  4. 【H28.04.12現在】下記のソフトウェアにてDシステム上でジョブを実行した際にジョブが正常に実行されない場合があるとの報告があります。各ソフトウェアをご利用の際は下記のとおりご対応ください。
    • ANSYS CFX : 回避策をベンダーにお問い合わせください。
  5. 【H30.2.28 現在】下記のソフトウェアにてEシステム上でジョブを実行した際にジョブが正常に実行されない場合があるとの報告があります。以下のソフトウェアをご利用の際は下記のとおりご対応ください。
    • ANSYS FLUENT : 回避策をベンダーにお問い合わせください。
    • ANSYS CFX : Eシステムの利用を回避してください。
    • STAR-CCM+ : -mpi intel オプションを指定してください。
    その他ソフトウェアのEシステムでの稼働状況につきましては提供ベンダーにお問い合わせください。

▲このページの先頭へ

4.1.2.キュー情報の確認方法

ジョブ投入先のキュー名を確認するには、sinfoコマンドを実行します。

$ sinfo -s

【実行例】

$ sinfo -s
PARTITION AVAIL  TIMELIMIT   NODES(A/I/O/T)  NODELIST
a024h             up 1-00:00:00     0/194/11/205  a[001-095,097-204,207-208]
a168h             up 7-00:00:00        0/31/1/32  a[001-032]
b024h             up 1-00:00:00          0/2/0/2  b[001-002]
b168h             up 7-00:00:00          0/1/0/1  b001
d024h             up 1-00:00:00       17/63/0/80  d[001-080]
d168h             up 7-00:00:00       17/23/0/40  d[001-040]
e168h          inact 7-00:00:00          0/0/0/0
f024h             up 1-00:00:00       13/40/5/58  f[201-254,257-260]
f072h             up 3-00:00:00       13/18/1/32  f[201-232]
f072h_p100        up 3-00:00:00          0/2/0/2  f[601-602]
h024h             up 1-00:00:00      45/91/0/136  h[001-136]
h072h             up 3-00:00:00      45/57/0/102  h[001-102]
v024h             up 1-00:00:00          0/2/0/2  v[001-002]
v072h             up 3-00:00:00          0/2/0/2  v[001-002]
p072h             up 3-00:00:00          0/1/0/1  hpcipps1
g006m*            up       6:00          0/4/0/4  g[001-004]
a006m             up       6:00          0/2/0/2  a[207-208]
b006m             up       6:00          0/2/0/2  b[001-002]
d006m             up       6:00          0/2/0/2  d[079-080]
f006m             up       6:00          0/2/0/2  f[601-602]
h006m             up       6:00          0/4/0/4  h[068,102,131,136]
v006m             up       6:00          0/2/0/2  v[001-002]

<出力説明>

カラム名 意味
PARTITION キュー名(パーティション名)
AVAIL キューの状態(up or inact)
TIMELIMIT 最大実行時間
NODES(A/I/O/T) ノードの状態(allocated/idle/other/total)
NODELIST キュー(パーティション)に割り当てられたノード

キューのノード実行状況を確認するには、squeuesコマンドを実行します。
注意:SLURMの標準コマンドのsqueueとは別コマンドです。

$ squeues

【実行例】

$ squeues
QUEUE_NAME       TIMELIMIT   STATUS MAXNODES NNODES DEPEND PEND RUN FREE
a006m                 6:00       up        2      0      0    0   0    2
a024h           1-00:00:00       up      194      0      0    0   0  194
a168h           7-00:00:00       up       31      0      0    0   0   31
b006m                 6:00       up        2      0      0    0   0    2
b024h           1-00:00:00       up        2      0      0    0   0    2
b168h           7-00:00:00       up        1      0      0    0   0    1
d006m                 6:00       up        2      0      0    0   0    2
d024h           1-00:00:00       up       80     17      0    0  17   63
d168h           7-00:00:00       up       40     17      0    0  17   23
e168h           7-00:00:00 inactive        0      0      0    0   0    0
f006m                 6:00       up        2      0      0    0   0    2
f024h           1-00:00:00       up       53     13      0    0  13   40
f072h           3-00:00:00       up       31     13      0    0  13   18
f072h_p100      3-00:00:00       up        2      0      0    0   0    2
g006m                 6:00       up        4      0      0    0   0    4
h006m                 6:00       up        4      0      0    0   0    4
h024h           1-00:00:00       up      136     45      0    0  45   91
h072h           3-00:00:00       up      102     45      0    0  45   57
p072h           3-00:00:00       up        1      0      0    0   0    1
v006m                 6:00       up        2      0      0    0   0    2
v024h           1-00:00:00       up        2      0      0    0   0    2
v072h           3-00:00:00       up        2      0      0    0   0    2

<出力説明>

カラム名 意味
QUEUE_NAME キュー名(パーティション名)
TIMELIMIT 最大実行時間
STATUS キューの状態(up or inact)
MAXNODES 最大ノード数
NNODES 実行中及び実行待ちのジョブが要求しているノード数
DEPEND 実行待ち(Dependency)のジョブが要求しているノード数
PEND 実行待ちのジョブが要求しているノード数
RUN 実行中のノード数
FREE 空きノード数

▲このページの先頭へ

4.1.3.利用可能なノード数の確認方法

空きノード数を確認するfreenodesというコマンドを用意しています。ジョブ投入のための空きノード数の確認の目安にご利用ください。

$ freenodes

【出力形式】

Number of free nodes in A sys.  with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in B sys.  with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in D sys.  with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in E sys.  with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in F sys.  with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in G sys.  with 10GbE  connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in H sys.  with 10GbE  connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in V sys.  with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in HPCIPPS with FDR-IB connected is 空きノード数 / 提供最大ノード数.

【実行例】

$ freenodes
Number of free nodes in A sys.  with QDR-IB connected is 195/ 195.
Number of free nodes in B sys.  with QDR-IB connected is   2/   2.
Number of free nodes in D sys.  with FDR-IB connected is  63/  80.
Number of free nodes in E sys.  with FDR-IB connected is   0/   0.
Number of free nodes in F sys.  with FDR-IB connected is  42/  55.
Number of free nodes in G sys.  with 10GbE  connected is   4/   4.
Number of free nodes in H sys.  with 10GbE  connected is  92/ 136.
Number of free nodes in V sys.  with FDR-IB connected is   2/   2.
Number of free nodes in HPCIPPS with FDR-IB connected is   1/   1.

▲このページの先頭へ