「デル・テクノロジーズ:「デル・テクノロジーズ:AMD EPYC™ 7002シリーズ プロセッサーを使用したANSYS®のパフォーマンス(英語)」
Summary: この記事では、AMD EPYC™ 7002シリーズ プロセッサーを搭載したDell EMC Ready Solution for HPC Digital ManufacturingでのANSYS® CFX®およびANSYS Fluent®のパフォーマンスについて説明します。
Resolution
この記事は、2019年10月にDell EMC HPC & AI Innovation LabのJoshua Weageによって作成されました。
概要
このブログでは、AMD EPYC™ 7002シリーズ プロセッサーを搭載したDell EMC Ready Solution for HPC Digital ManufacturingでのANSYS® CFX®およびANSYS Fluent®のパフォーマンスについて説明します。このDell EMC Ready Solution for HPCは、仮想製品開発にコンピューター支援エンジニアリング(CAE)アプリケーションが不可欠なデジタル製造ワークロード向けに特別に設計および構成されています。Dell EMC Ready Solution for HPC Digital Manufacturingでは、柔軟なビルディング ブロック アプローチを使用してHPCシステム設計を行います。これにより、個々のビルディング ブロックを組み合わせて、お客様固有のワークロードとユース ケースに最適化されたHPCシステムを構築できます。
Dell EMC Ready Solution for HPC Digital Manufacturingは、Dell EMC HPCソリューション ポートフォリオに含まれる数多くのソリューションの1つです。Dell EMCが提供するHPCソリューションの包括的な概要については、www.dellemc.com/hpcを参照してください。
ベンチマーク システム構成
パフォーマンス ベンチマーキングは、7001および7002シリーズAMD EPYCプロセッサーを搭載したデュアルソケットDell EMC PowerEdgeサーバーを使用して実施されました。すべてのサーバーには、チャネルあたり2個のプロセッサーと1個のDIMMメモリー構成が搭載されました。パフォーマンス ベンチマーキングに使用されるシステム構成を表1と表2に示します。ベンチマーキング システムに使用されるBIOS設定を表3に示します。
| 表1 7001シリーズAMD EPYCのシステム構成 | |
|---|---|
| Server | Dell EMC Power Edge R7425 |
| CPU | 2 x AMD EPYC 7601 32コア プロセッサー |
| メモリー | 16x16GB 2400 MTps RDIMM |
| BIOSのバージョン | 1.10.6 |
| オペレーティングシステム | Red Hat Enterprise Linux Serverリリース7.5 |
| カーネル バージョン | 3.10.0-862.el7.x86_64 |
表1:7001シリーズAMD EPYCのシステム構成
| 表2 7002シリーズAMD EPYCのシステム構成 | |
|---|---|
|
Server |
Dell EMC Power Edge C6525 |
|
プロセッサ |
2 x AMD EPYC 7702 64コア プロセッサー 2 x AMD EPYC 7502 32コア プロセッサー 2 x AMD EPYC 7452 32コア プロセッサー 2 x AMD EPYC 7402 24コア プロセッサー |
|
メモリー |
16x16GB 3200 MTps RDIMM |
|
BIOSのバージョン |
1.0.1 |
|
オペレーティングシステム |
Red Hat Enterprise Linux Serverリリース7.6 |
|
カーネル バージョン |
3.10.0-957.27.2.el7.x86_64 |
表2: 7002シリーズAMD EPYCのシステム構成
| 表3 BIOS設定 | |
|---|---|
|
システムプロファイル |
最適化されたパフォーマンス |
|
論理プロセッサー |
Disabled |
|
仮想化テクノロジー |
Disabled |
|
NUMA Nodes Per Socket |
4(PowerEdge C6525のみ) |
表3:BIOS の設定
ソフトウェアのバージョン
アプリケーション ソフトウェアのバージョンについては、表4を参照してください。
| 表 4 ソフトウェア バージョン | |
|---|---|
|
ANSYS CFXの |
2019R3(インテルMPI搭載) |
|
ANSYSフルエント |
IBM MPIを使用した2019R3 |
表4:ソフトウェアのバージョン
ANSYS CFXのパフォーマンス
ANSYS CFXソフトウェアは、回転機械アプリケーションでの精度、堅牢性、および速度で定評のある数値流体力学(CFD)アプリケーションです。通常、CFDアプリケーションは、複数のプロセッサー コアとサーバー間で十分にスケーリングできるため、メモリー容量の要件は小さくなり、通常はソルバー セクションで最小限のディスクI/Oを実行します。ただし、大規模な過渡解析などの一部のシミュレーションでは、I/O要求が大きくなる場合があります。ここで報告されているベンチマーク結果は、サーバーで使用可能なすべてのプロセッサー コアを使用してベンチマークを実行した、単一サーバーのパフォーマンス結果です。図 1 は、CFX 2019R3 を使用した標準 CFX ベンチマークのパフォーマンスの測定を示しています。各ベンチマークのパフォーマンスは、ソルバーの経過時間を使用して測定されます。

図1: ANSYS CFXシングルサーバーのパフォーマンス
図1の結果は、AMD EPYC 7601プロセッサーで構成された1台のサーバーのパフォーマンスを基準にしてプロットしたものです。値を大きくすると、全体的なパフォーマンスが向上します。これらの結果は、7002シリーズAMD EPYCプロセッサーで使用可能なパフォーマンスのメリットを示しています。32コアAMD EPYC 7452および7502プロセッサーは、これらのベンチマークで非常に優れたパフォーマンスを提供します。64コアAMD EPYC 7702は、特にLeMansベンチマークとPumpベンチマークの場合において、32コア プロセッサーよりもパフォーマンスが大幅に向上しています。
ANSYS Fluentのパフォーマンス
ANSYS Fluentは、非常に幅広いCFDおよびマルチフィジックス アプリケーションで一般的に使用されている数値流体力学(CFD)アプリケーションです。CFDアプリケーションは、通常、複数のプロセッサコアとサーバー間で適切にスケーリングされ、適度なメモリ容量要件を持ち、通常、ソルバーセクションで最小限のディスクI/Oを実行します。ただし、一部のシミュレーションでは、大規模な過渡解析など、I/Oの要求が高くなる場合があります。
Fluent ベンチマークのパフォーマンスは、1 日に完了できる 25 回の反復解決の数である Solver Rating メトリックを使用して測定されます。つまり、(1 日の合計秒数)/(25 回の反復解析時間 (秒単位)) です。値が大きいほど、パフォーマンスが向上することを表します。ここで報告されているベンチマーク結果は、サーバーで使用可能なすべてのプロセッサー コアを使用してベンチマークを実行した、単一サーバーのパフォーマンス結果です。 図2は、6つのANSYS Fluentベンチマークで測定されたパフォーマンスを示しています。
図2:ANSYS Fluentシングルサーバーのパフォーマンス
図2は、AMD EPYC 7601プロセッサーで構成された単一サーバーのパフォーマンスに対してプロットされた、6つの標準的なFluentベンチマーク ケースの結果を示しています。値を大きくすると、全体的なパフォーマンスが向上します。これらの結果は、7002シリーズAMD EPYCプロセッサーで使用可能なパフォーマンスのメリットを示しています。32コアAMD EPYC 7452および7502プロセッサーは、これらのベンチマークに対して優れたパフォーマンスを提供します。これらのベンチマーク ケースでは、サーバーあたり64コアAMD EPYC 7702の方が、32コア プロセッサーよりもパフォーマンスが大幅に向上しています。
結論
このブログで紹介した結果によると、7002シリーズAMD EPYCプロセッサーは、7001シリーズAMD EPYCプロセッサーと比較して、ANSYS CFXおよびANSYS Fluentのパフォーマンスが大幅に向上しています。