生産性を1000倍に向上:完全にNVIDIA GPUに最適化されたCFDソルバー、HexagonのscFASTのご紹介
製品見積
1984年の創業以来、ソフトウェアクレードルは計算流体力学 (CFD) の革新の最前線に立ってきました。(2019年にMSC Softwareに統合され)、現在はHexagonの一部となっているクレードルは、業界をリードするソルバーを提供しています:scFLOWは、非構造化多面体メッシュを使用した一般的な流体流量シミュレーション用に設計されており、 scSTREAMは、電子機器の冷却と熱管理に最適化された高速デ高速直交格子ソルバーです。
性能と効率性を継続的に追求する中で、当社は完全にGPUに最適化されたCFDソルバーscFASTを導入しました。NVIDIA HopperとNVIDIA Blackwell アーキテクチャ専用に構築されたscFASTは、シミュレーション速度とスケーラビリティに大きな飛躍をもたらします。
GPU最適化が重要な理由
従来のCFDソルバーはCPUに依存していますが、 GPUはシミュレーションを劇的に加速できる膨大なパラレル処理能力を提供します。scFASTはscFLOWの基盤に基づいて構築されていますが、GPU上で完全に動作するように再設計され、 CPUのボトルネックを排除し、メモリ効率を最適化します。scFASTの主な革新
1. GPU常駐型アーキテクチャによる最高速度
scFASTはGPU上で完全に動作し、すべてのデータをGPUメモリに保持します。これによりCPUとGPU間の頻繁なデータ転送がなくなり、遅延が大幅に低減され、全体的なシミュレーション速度が向上します。
2. RM-MCGSメソッドによるメモリ使用量の削減
scFASTの画期的な技術の1つは、 低減メモリ多色ガウスシーデル法(RM-MCGS) です。RM-MCGSは、大規模なヤコビ行列を保存する代わりにフレシェ微分を活用し、メモリ消費を大幅に削減します。これは演算集約型である一方、従来のCPUクラスタと比較してメモリが限られているGPUにとっては特に有益です。
3. ポータブルOpenMPコードによるハードウェア適応性
scFASTはポータブルOpenMPコードで設計されており、マルチコアCPUとGPUの両方で効率的に実行できます。これにより、さまざまなハードウェア構成に柔軟に対応し、既存のワークフローにシームレスに統合できます。
4. C++テンプレートを使用したコードの最適化
scFASTはC++ テンプレートを使用して、特定のユーザー設定に基づいて高度に最適化されたコードパスを生成します。これにより、さまざまなシミュレーションシナリオで性能を最大化し、比類のない効率を実現します。
性能と効率性:450倍の飛躍
その結果は明らかです。単一のNVIDIA H100 GPUでscFASTは、384 CPUスレッド(4台のAMD EPYC 7763プロセッサ)で動作する前世代のソルバーよりも15%高速な性能を提供します。これにより、全体の性能が450倍向上し 、エンジニアは以前に比べて大幅に短い時間で高精度のシミュレーションを実行できるようになります。
図1:Onera OM6ウィング用の5300万要素のメッシュを使用したスピードアップ。オプションのRM-MCGS(Reduced Memory)アルゴリズムは、必要に応じて一部の速度を抑えることでメモリを節約します。
単一GPUでの大規模な問題の処理
scFASTの最も革新的な機能の1つは、 単一のGPUで大規模なシミュレーションを処理できることです。scFASTはGPUごとに5000万以上の要素に対応し、これまでマルチノードCPUクラスターを必要としていたシミュレーションを単一のGPUで実行することを可能にします。この画期的な進歩は、大規模なCFD問題が標準となる航空宇宙、自動車、エネルギーなどの業界に特に変革をもたらします。
図2:単一のNVIDIA A100 GPUで6800万要素のメッシュを使用したCRM-HLシミュレーション結果。
今後の展開について:1000倍の性能の向上とAI統合
「CFDをご利用のお客様に、scFASTの早期リリース版を提供できることを嬉しく思います」と、Hexagonの研究開発・革新、設計・エンジニアリング担当副社長のSubham Sett氏は述べています。「今年後半には、 NVIDIA Blackwellアーキテクチャとの完全な互換性を備えた幅広い展開が予定されています。」
さらにHexagonは、 より迅速なメッシング、 AIベースの低次元化モデルおよび強化されたCAD統合に投資しています。これらの進歩により、1000倍の生産性向上を達成できると当社は確信しており、これにより、高性能CFDシミュレーションがこれまで以上に利用しやすく、効率的で精度の高いものになります。
今後もCFD性能の限界に挑戦していきますので、最新情報にご期待ください!