26年就職 : インターン・仕事体験 データサイエンティスト
【PJG12】HPC・AI研究分野における稼働情報データ分析
富士通株式会社
スーパーコンピュータは、HPCやAI研究等で利用されており、大量の計算ノード(サーバ)を複数のユーザで共有して、アプリケーション開発・シミュレーションの実行をおこなう特徴があります。
開発されるアプリケーションは、ユーザの研究テーマに依存する部分があり、利用目的や必要とされる計算リソース(計算ノード数、開発・シミュレーション時間)は研究テーマにより異なるとともに、時期によって状況が変化します。
この状況下でスーパーコンピュータを効率的に運用するには、研究テーマの把握だけでなく、運用データを分析して現状の把握と、改善点を検討することが必須となります。
分析のポイントには、例えば以下があります。
(1)利用されるアプリケーションや計算機の利用条件(実行時間、メモリ、I/O等)
(2)計算ノード群の利用規模・時間
(3)利用される言語ソフトウェア(C/C++/Fortran等)、スクリプト言語(Python等)、AIフレームワーク
(4)発生する事象との因果関係など
様々な要因が運用に影響を与えますが、本インターンシップの期間において項目を選択して分析を進めます。
分析の結果および進捗の状況に応じて、一歩踏み込んだ改善ポイントを探る活動にも挑戦いただきたいと思います。