Abstract
動的に計算量が変動するという特徴を持つ大規模シミュレーションプログラムをGridRPC とMPIを組み合わせることによりGrid 化し,長期間にわたってGrid 環境上で継続実行させることを試みた.実装に際して,(1) 大規模計算機を事前に一定期間予約し,対象を変更する,(2) 複数のユーザにより共有されている計算機から,その時点で利用可能なものを動的に利用していく,という二種類の現実的な実行シナリオを想定し,このシナリオを満足するためにアプリケーションに実装すべき機能を検討した.また,本手法に基づきGrid 化したプログラムを環太平洋Grid 環境上で半月から二ヶ月にわたり動作させることで,本手法により計算量の変動にあわせて動的に実行対象計算機を変更する柔軟性と,障害を検知・復旧する頑健性を実現できることを示す.