ジョブ一元管理システム 使用の手引
スーパーコンピューターSR11000で稼働するキューイングシステムのキュー情報を示す。
| 項番 | 用途(使用形態) | キュー名 及びオプション | メモリ制限*2 | CPU時間制限*2 | etime制限*2 | |
| 1 | デバッグ用 | EA | 3GB/JOB | 6時間 | 52分 | |
| 2 | 1CPUジョブ用 | SB | 3GB/JOB | 65時間 | 69時間 | |
| 3 | 一般ジョブ用 (1ノードを1ジョブが占有, 1ジョブ4ノードまで使用可) | EB*1 | オプションなし | 48GB/node | 1,115時間 | 76時間 |
| -longtime | 48GB/node | 3,200時間 | 210時間 | |||
| -largememory | 96GB/node | 1,115時間 | 76時間 | |||
| -longtime -largememory | 96GB/node | 3,200時間 | 210時間 | |||
ノード(node):スーパーコンピューターのシステム(OS)が動作する単位。1ノードに16個のCPUが搭載されている。
(*1):キューEBでは、大規模なジョブの実行に対応するため、メモリ制限とCPU時間制限の上限値を可変としている。しかし、より多くの資源を使用することになるため、ジョブ実行の待ち時間が通常より長くなる。変更するにはsubmitコマンド実行時に上記オプションを指定する。
(*2):これらの制限を超えたジョブは強制終了となる。制限により終了した旨は標準エラーファイルまたはメールにより通知される。メールによる通知はジョブ一つに対し複数回行われる場合がある。
| (メモリ制限を超えた場合) | (CPU時間制限を超えた場合) |
| (標準エラーの例) | (標準エラーの例) |
| KCHF504R cannot allocate area because of shortage memory. system call name is [malloc]. errno is [12]. errno message is [Not enough space]. |
KCHF989R warning signal of job termination is received. the job termination prosess (fortran file closing process) is executed. |
| (メールの例) | (メールの例) |
| Subject:JOB-NAME Memory limit exceeded. super24-cx.99999.0 JOB-NAME /home/user-name/Work-dir-name JOB memory limit exceeded. Memory limit 48 (GB) on EB The job step was canceled at: Tue Mar 25 12:00:00 2008 |
Subject:JOB-NAME CPU time limit exceeded. super24-cx.99999.0 JOB-NAME /home/user-name/Work-dir-name JOB CPU time limit exceeded. CPU time limit 1115.0 (h) The job step was canceled at: Tue Mar 25 12:00:00 2008 |
All Rights Reserved. Copyright (C) 2007, Hitachi, Ltd.