Article Number: 000144408
2019年6月にHPCおよびAIイノベーション ラボのJyothi Bhaskarによって作成された記事
図1: HPC Lustreストレージ向けDell Readyソリューション: Lベース構成のアーキテクチャ図
表1: Ready Solution for Lustreの技術仕様を更新し、以前のリリースと簡単に比較
ハードウェア/ソフトウェア コンポーネント | 現在 | 戻る |
---|---|---|
OSSおよびMDSObject Storage Server( OSS )およびメタデータ サーバー( MDS )のプロセッサー | インテルXeon™ Gold 6230 CPU x 2(OSS/MDSあたり20コア@2.10GHz) | インテルXeon™ Gold 6136 x 2(12コア@ 3.00GHz) |
Lustre( IML )サーバー用Integrated Managerのプロセッサー | インテルXeon Gold 5218 x 2(2.3GHzで16コア) | インテルXeon Gold 5118 x 2(2.3GHzで12コア) |
OSSおよびMDSのメモリーDIMM | 12 x 32 GiB 2933 MT/s DDR4 RDIMM | 24 x 16GiB 2666MT/s DDR4 RDIMM |
IMLサーバーのメモリーDIMM | 12 x 8GiB 2666MT/s DDR4 RDIMM | 12 x 8GB 2666MT/s DDR4 RDIMM |
BIOS | 2.1.8以降 | 1.4.5以降 |
OSカーネル | 3.10.0-957.1.3 | 3.10.0-862 |
Lustreバージョン | 2.10.7 | 2.10.4 |
IMLバージョン | 4.0.10.0 | 4.0.7.0 |
Mellanox OFEDバージョン | 4.5-1.0.1.0 | 4.4-1 |
クライアント ノードの数 | 8 |
---|---|
クライアント ノード | C6420 |
クライアント ノードあたりのプロセッサー数 | 2 x インテル(R) Xeon(R) Gold 6248(20コア@ 2.50GHz) |
クライアント ノードあたりのメモリー | 12 16GiB 2933 MT/s RDIMM |
BIOS | 2.2.6 |
OSカーネル | 3.10.0-957.10.1 |
Lustreバージョン | 2.10.7 |
Mellanox OFED | 4.5-1.0.1.0 |
lctl set_param osc.*.checksums=0
lctl set_param timeout=600
lctl set_param at_min=250
lctl set_param at_max=600
lctl set_param ldlm.namespaces.*.lru_size=2000
lctl set_param osc.*OST *.max_rpcs_in_flight=16
lctl set_param osc.*OST*.max_dirty_mb=1024
lctl set_param osc.*.max_pages_per_rpc=1024
lctl set_param llite.*.max_read_ahead_mb=1024
lctl set_param llite.*.max_read_ahead_per_file_mb=1024
lctl set_param osc.*OST*.max_rpcs_in_flight=256
lctl set_param osc.*.max_pages_per_rpc=1024
図5: MDtestを使用したメタデータ操作。 Cascade Lake Lustreサーバーとクライアントを使用した、以前の結果と現在の結果の比較
図5は、メタデータ テストの結果を示しています。現在の結果と以前の結果を比較すると、3つすべてのメタデータ操作の傾向が変わらないことが分かります。ピークファイル作成操作が75.4%向上し、ピークファイル削除操作が18%低下し、ファイル統計操作のパフォーマンスデルタがごくわずかであることに注意してください。 表1に示すように、ソリューション スタック上のソフトウェアとハードウェアのアップデートに見られるパフォーマンスの差を示すことができます。
構成、インストール、およびパフォーマンスに関して、Lustre Ready Solutionのアップデートを検証および検証しました。また、収集されたパフォーマンス データもこのブログに含まれています。
Cascade LakeベースのLustreサーバーとクライアント
を使用して、以前の結果と現在の結果を比較 1)シーケンシャルIO: シーケンシャル書き込みとシーケンシャル読み取りにより、32スレッド未満の低いスレッド数で、最大で2倍以上のパフォーマンス向上が見られます。ピーク時のパフォーマンスは、以前のSkylakeベースのソリューションと同様です。
2)ランダムIO: 読み取り/書き込みパフォーマンスの傾向は非常に似ていますが、変動の実行を考慮すると、パフォーマンスデルタは統計的に有意ではありません。
3)メタデータ パフォーマンス テスト: ピーク時のファイル作成操作が最大75.4%向上しています。ファイル統計操作は、以前に観察された結果に非常に近いままであり、パフォーマンスの差はごくわずかです。ピーク時のファイル削除操作は約18%減少していますが、一般的なファイル削除操作の傾向は同じであり、他のスレッド数ではデルタはごくわずかです。
High Performance Computing Solution Resources
19 Jan 2024
6
Solution