ジョブ一元管理システム 使用の手引

[目次][索引][前へ][次へ]

3.1 スーパーコンピューターのキュー一覧

スーパーコンピューターSR11000で稼働するキューイングシステムのキュー情報を示す。

項番用途(使用形態)キュー名 及びオプション
メモリ制限*2CPU時間制限*2etime制限*2
1デバッグ用EA3GB/JOB6時間52分
21CPUジョブ用SB3GB/JOB65時間69時間
3一般ジョブ用
(1ノードを1ジョブが占有,
1ジョブ4ノードまで使用可)
EB*1オプションなし48GB/node1,115時間76時間
-longtime48GB/node3,200時間210時間
-largememory 96GB/node1,115時間76時間
-longtime
-largememory
96GB/node3,200時間210時間

ノード(node):スーパーコンピューターのシステム(OS)が動作する単位。1ノードに16個のCPUが搭載されている。

(*1):キューEBでは、大規模なジョブの実行に対応するため、メモリ制限とCPU時間制限の上限値を可変としている。しかし、より多くの資源を使用することになるため、ジョブ実行の待ち時間が通常より長くなる。変更するにはsubmitコマンド実行時に上記オプションを指定する。

(*2):これらの制限を超えたジョブは強制終了となる。制限により終了した旨は標準エラーファイルまたはメールにより通知される。メールによる通知はジョブ一つに対し複数回行われる場合がある。

(メモリ制限を超えた場合)(CPU時間制限を超えた場合)
(標準エラーの例)(標準エラーの例)
KCHF504R cannot allocate area because of shortage memory.
system call name is [malloc]. errno is [12].
errno message is [Not enough space].
KCHF989R warning signal of job termination is received. the job termination prosess (fortran file closing process) is executed.
(メールの例)(メールの例)
Subject:JOB-NAME Memory limit exceeded.
super24-cx.99999.0
JOB-NAME
/home/user-name/Work-dir-name
JOB memory limit exceeded. Memory limit 48 (GB) on EB
The job step was canceled at: Tue Mar 25 12:00:00 2008
Subject:JOB-NAME CPU time limit exceeded.
super24-cx.99999.0
JOB-NAME
/home/user-name/Work-dir-name
JOB CPU time limit exceeded. CPU time limit 1115.0 (h)
The job step was canceled at: Tue Mar 25 12:00:00 2008