名古屋大学太陽地球環境研究所

  1. ホーム
  2. スーパーコンピュータ
  3. FAQ

スーパーコンピュータ

  • 大きなファイルの出力中にJobが固まる
既知の問題として、合計512GB以上の複数のファイルの書き込みを一度に行うとofedが落ちるようです。現在障害対応の検討中です。
  • Jobが走りません (Eqw 状態になる)
ジョブスクリプトの設定にミスがあります。
キュー(-q)の設定、並列環境(-pe)と使用するコア数の設定及び、スレッド(-v threads)の設定を確認してください。
また、h_mem とノードあたりのプロセス数の積が92GBを超えないように設定してください。

どうしても走らない場合は管理者に連絡してください。

  • 「OMP warning: KMP_AFFINITY: parameter invalid, ignoring 'disabled'」という警告が出る
ジョブスクリプトに
export KMP_AFFINITY=disabled
を付け加えてください。

  • スレッド並列時に、計算サイズが大きいと segmentation fault で止まる
ジョブスクリプトに
OMP_STACKSIZE=64M
export OMP_STACKSIZE
を付け加えてください。

それでも止まる場合は、128M, 256M, 512M と値を大きくしてください。

  • 走ったジョブがすぐに終了してしまう
出力に (ジョブスクリプト名).po(ジョブID) 又は (ジョブスクリプト名).pe(ジョブID) というファイルができているので、中を見てください。
mpdboot 関係でエラーが出ている場合には、ファイルの内容を管理者まで送ってください。
  • TERA TERMやPuTTYでログインしたときにパスが通らない
LANGUAGE_TERRITORY: Undefined variable.
というエラーが出ていると思います。

TERA TERMの設定に、LANGという環境変数を加えてください。
または、別のLinuxマシン経由でログインしてください。

≪ ホームへ戻る

Copyright c2010 Nagoya University All Rights Reserved.