Numéro d’article: 000130962

HPC PixStorストレージ向けDell EMC Readyソリューション

Résumé: ソリューションのリファレンスアーキテクチャと初期パフォーマンス評価。

Cet article a peut-être été traduit automatiquement. Si vous avez des commentaires concernant sa qualité, veuillez nous en informer en utilisant le formulaire au bas de cette page.

Contenu de l’article

Symptômes

HPCおよびAIイノベーションラボのMario Gallegosが2019年10月に執筆した記事

Cause

に戻ります。

Résolution

概要
1. ソリューションアーキテクチャ
2. ソリューションコンポーネント
パフォーマンス特性
1. シーケンシャルIOゾーンパフォーマンス - NクライアントからNファイル
2. シーケンシャルIORパフォーマンス - Nクライアントから1ファイル
3. 小さなブロックを使用したIOzoneランダムパフォーマンス - NクライアントからNファイル
4. 空のファイルを使用したMDtestによるメタデータパフォーマンス
5. 4 KiBファイルを使用したMDtestによるメタデータパフォーマンス
6. 3KファイルでのMDtestを使用したメタデータのパフォーマンス
高度な分析
結論および今後の計画

概要

今日のHPC環境では、非常に高速なストレージに対する需要が高まっています。これにはまた、NFS、SMBなどのいくつかの標準プロトコルを介した高容量かつ分散されたアクセスも必要です。このような要求の厳しいHPC要件は通常、複数のノードからの単一のファイルまたは一連のファイルへの同時アクセスを提供し、複数のサーバー間で複数のLUNにデータを非常に効率的かつ安全に分散する、並列ファイルシステムによってカバーされます。

ソリューションアーキテクチャ

このブログでは、HPC環境向けの並列ファイルシステム(PFS)ソリューションにDell EMCが新たに加わったDell EMC Ready Solution for HPC PixStor Storageをご紹介します。図1は、Dell EMC PowerEdge R740サーバー、PowerVault ME4084およびME4024ストレージアレイを、パートナー企業ArcastreamのPixStorソフトウェアと活用したリファレンスアーキテクチャを示しています。
PixStorには、高度な分析、シンプルな管理とモニタリング、効率的なファイル検索、高度なゲートウェイ機能などのArcastreamソフトウェアコンポーネントに加えて、PFSコンポーネントとしてSpectrum Scaleとしても知られる広く普及しているGeneral Parallel File Systemが含まれています。

SLN318841_en_US__1image(11979年)

図1: リファレンスアーキテクチャ

ソリューションコンポーネント

このソリューションは、最新のインテルXeon第2世代スケーラブルXeon CPU（別名Cascade Lake CPU）を搭載してリリースされる予定です。一部のサーバーは、使用可能な最速のRAM (2933 MT/s)を使用します。ただし、ソリューションのプロトタイプを作成し、そのパフォーマンスの特性を明らかにするために利用できるハードウェアがあるため、インテル Xeon第1世代スケーラブルXeon CPUを搭載したサーバーはSkylakeプロセッサーと低速のRAMが使用されました。ソリューションのボトルネックはDell EMC PowerVault ME40x4アレイのSASコントローラーにあるため、Skylake CPUとRAMを想定されるCascade Lake CPUとより高速なRAMに置き換えても、パフォーマンスに大きな差は生じません。さらに、システム構成時にRHEL 7.6をサポートする最新バージョンのPixStorが利用可能であったとしても、QAプロセスを続行し、Red Hat® Enterprise Linux® 7.5と以前のマイナーバージョンのPixStorを使用してシステムの特性評価を行うことが決定されました。システムがCascade Lake CPUにアップデートされると、PixStorソフトウェアも最新バージョンにアップデートされ、パフォーマンスが本書で報告されている数値に近いことを確認するために、パフォーマンスのスポットチェックがいくつか行われます。

前述の状況のため、表1 にソリューションの主要コンポーネントのリストを示します。真ん中の列には、リリース時に使用してお客様が利用できる予定のコンポーネントが含まれています。最後の列は、ソリューションのパフォーマンスを評価するために実際に使用されるコンポーネントのリストです。リストされているドライブまたはデータ(12TB NLS)とメタデータ(960Gb SSD)は、パフォーマンス特性評価に使用されるドライブであり、高速なドライブは、より優れたランダムIOPSを提供し、メタデータの作成/削除操作を改善する可能性があります。

最後に、完全を期すために、使用可能なデータHDDとメタデータSSDのリストが含まれています。これは、オンラインで入手可能なDell EMC PowerVault ME4サポートマトリックスで指定されているとおりにサポートされているドライブに基づいています。

表1 リリース時に使用する部品とテストベッドで使用する部品

SLN318841_en_US__2image(12041)

パフォーマンス特性

この新しい Ready Solutionの特徴を示すために、表1の最後の列で指定されているハードウェア(オプションの高需要メタデータモジュールを含む)を使用しました。ソリューションのパフォーマンスを評価するために、次のベンチマークが使用されました。

シーケンシャルIOzone - NからN
シーケンシャルIOR - Nから1
ランダムIOzone

MDtest

上記のすべてのベンチマークについて、テストベッドには、以下の表2 に示すクライアントがありました。テストに使用できるコンピュートノードの数は 16 であったため、より多くのスレッドが必要な場合、これらのスレッドはコンピュートノードに均等に分散されました (つまり、32 スレッド = ノードあたり 2 スレッド、64 スレッド = ノードあたり 4 スレッド、128 スレッド = ノードあたり 8 スレッド、256 スレッド = ノードあたり 16 スレッド、512 スレッド = ノードあたり 32 スレッド、 1024スレッド = ノードあたり64スレッド)。この目的は、コンピューティングノードの数が限られている状態で、より多くの同時クライアント数をシミュレートすることです。ベンチマークでは多数のスレッドがサポートされているため、過剰なコンテキストの切り替えやその他の関連する副作用がパフォーマンス結果に影響を与えるのを回避しながら、最大値 1024 (各テストで指定) が使用されました。

表2 クライアントテストベッド

クライアントノードの数	16
クライアントノード	C6320
クライアントノードあたりのプロセッサー数	2 インテル(R) Xeon(R) Gold E5-2697v4 18コア @ 2.30GHz
クライアントノードあたりのメモリー	12 16GiB 2400 MT/s RDIMM
BIOS	2.8.0
OSカーネル	3.10.0-957.10.1
GPFSのバージョン	5.0.3

シーケンシャルIOゾーンパフォーマンス - NクライアントからNファイル

NクライアントからNファイルへのシーケンシャルパフォーマンスは、IOzoneバージョン3.487で測定されました。実行されたテストは、1 つのスレッドから最大 1024 スレッドまでさまざまです。
キャッシュ効果は、16GiBに調整可能なGPFSページプールを設定し、その2倍のサイズのファイルを使用した場合に、最小限に抑えられました。GPFS の場合、その tunable は、インストールされている RAM の量と空き容量に関係なく、データのキャッシングに使用されるメモリーの最大量を設定することに注意することが重要です。また、以前のDell EMC HPCソリューションでは、大規模なシーケンシャル転送のブロックサイズは1 MiBですが、GPFSは8 MiBブロックでフォーマットされていたため、その値がベンチマークで使用され、最適なパフォーマンスが得られることに注意することが重要です。容量が大きすぎて、スペースが無駄になる可能性がありますが、GPFSはサブブロック割り当てを使用して状況を回避します。現在の構成では、各ブロックはそれぞれ 32 KiB の 256 個のサブブロックに分割されていました。
次のコマンドを使用して、書き込みと読み取りのベンチマークを実行しました。ここで、Threadsは使用されたスレッド数(2の累乗で1から1024まで増分)を含む変数であり、threadlistは各スレッドを異なるノードに割り当て、ラウンドロビンを使用して16個のコンピューティングノードに均一に分散するファイルです。

./iozone -i0 -c -e -w -r 8M -s 128G -t $Threads -+n -+m ./threadlist
./iozone -i1 -c -e -w -r 8M -s 128G -t $Threads -+n -+m ./threadlist

図2： N対Nシーケンシャルパフォーマンス

この結果から、使用するクライアントの数に応じてパフォーマンスが非常に速く上昇し、IOzoneが許可する最大スレッド数に達するまでは安定したプラトーに達するため、同時クライアントが1024個でも大容量ファイルのシーケンシャルパフォーマンスが安定していることがわかります。最大読み取りパフォーマンスは32スレッドで23 GB/秒であり、ボトルネックはInfiniBand EDRインターフェイスである可能性が非常に高いことに注意してください。一方、ME4アレイには追加のパフォーマンスがまだ使用可能でした。同様に、最大ライトパフォーマンス16.7は16スレッドで少し早く到達しており、ME4アレイの仕様と比較して明らかに低いことに注意してください。
ここで重要なのは、GPFS 優先操作モードが分散していること、およびそれを使用するようにソリューションがフォーマットされていることです。このモードでは、ブロックは最初から疑似ランダム方式で割り当てられ、各HDDの表面全体にデータが分散されます。明らかなデメリットは、初期の最大パフォーマンスが小さくなることですが、ファイルシステムで使用されているスペースの量に関係なく、そのパフォーマンスはかなり一定に維持されます。これは、ディスクレボリューションあたりより多くのデータ（セクター）を保持できる外部のトラックを最初に使用する他の並列ファイルシステムとは対照的に、HDDが提供できる最高のパフォーマンスを備えていますが、システムがより多くのスペースを使用するため、レボリューションあたりのデータがより少ない内部トラックが使用され、パフォーマンスが低下します。

シーケンシャルIORパフォーマンス - Nクライアントから1ファイル

Nクライアントから単一の共有ファイルへのシーケンシャルパフォーマンスは、IORバージョン3.3.0を使用して測定されました。また、OpenMPI v4.0.1によるアシストにより、16個のコンピューティングノード上でベンチマークを実行しました。実行されたテストは、単一スレッドから最大1024スレッドまでさまざまです。
キャッシュ効果は、16GiBに調整可能なGPFSページプールを設定し、その2倍のサイズのファイルを使用した場合に、最小限に抑えられました。このベンチマークテストでは、最適なパフォーマンスを実現するために8 MiBブロックを使用しました。これらの事項については、前のパフォーマンステストのセクションで詳しく説明しています。
次のコマンドを使用して、書き込みと読み取りのベンチマークを実行しました。ここで、Threadsは使用されたスレッド数(2の累乗で1から1024まで増分)を含む変数であり、my_hosts.$Threadsは、各スレッドを異なるノードに割り当て、ラウンドロビンを使用して16個のコンピューティングノードに均一に分散する対応するファイルです。

mpirun --allow-run-as-root -np $Threads --hostfile my_hosts.$Threads --mca btl_openib_allow_ib 1 --mca pml ^ucx --oversubscribe --prefix /mmfs1/perftest/ompi /mmfs1/perftest/lanl_ior/bin/ior -a POSIX -v -i 1 -d 3 -e -k -o /mmfs1/perftest/tst.file -w -s 1 -t 8m -b 128G

mpirun --allow-run-as-root -np $Threads --hostfile my_hosts.$Threads --mca btl_openib_allow_ib 1 --mca pml ^ucx --oversubscribe --prefix /mmfs1/perftest/ompi /mmfs1/perftest/lanl_ior/bin/ior -a POSIX -v -i 1 -d 3 -e -k -o /mmfs1/perftest/tst.file -r -s 1 -t 8m -b 128G

図3：N から 1 のシーケンシャルパフォーマンス

結果から、使用するクライアントの数に応じてパフォーマンスが非常に急速に上昇し、その後、読み取りでは半安定、書き込みでは非常に安定したプラトーに達し、このテストで使用されるスレッドの最大数に達することがわかります。したがって、大規模な単一共有ファイルのシーケンシャルパフォーマンスは、同時クライアント数が1024の場合でも安定しています。最大読み取りパフォーマンスは16スレッドで23.7 GB/秒でした。ボトルネックはInfiniBand EDRインターフェイスである可能性が非常に高いですが、ME4アレイには追加のパフォーマンスがまだ使用可能でした。さらに、読み取りパフォーマンスは、約20.5 GB/秒でプラトーに達するまでその値から低下し、128スレッドで18.5 GB/秒に一時的に低下しました。同様に、最大ライトパフォーマンス16.5は16スレッドで達成されており、ME4アレイの仕様と比較すると明らかに低いことに注意してください。

小さなブロックを使用したIOzoneランダムパフォーマンス - NクライアントからNファイル

ランダムNクライアントからNファイルへのパフォーマンスは、IOzoneバージョン3.487で測定されました。実行されたテストは、単一スレッドから最大1024スレッドまでさまざまです。このベンチマークテストでは、小さなブロックトラフィックをエミュレートするために4 KiBのブロックを使用しました。
キャッシング効果は、GPFS ページ・プール・チューナブルを 16GiB に設定し、その 2 倍のサイズのファイルを使用することで最小限に抑えられました。最初のパフォーマンステストのセクションでは、GPFSでこれが有効である理由について詳しく説明しています。
次のコマンドを使用して、書き込みと読み取りの両方に対してランダムIOモードでベンチマークを実行しました。ここで、Threadsは使用されたスレッド数(2の累乗で1から1024まで増分)の変数で、threadlistは各スレッドを異なるノードに割り当て、ラウンドロビンを使用して16個のコンピューティングノードに均一に分散させるファイルです。

./iozone -i2 -c -O -w -r 4K -s 32G -t $Threads -+n -+m ./threadlist

図4： N対Nのランダムパフォーマンス

:結果から、ライトパフォーマンスは約8.2K IOPSという高い値から始まり、128スレッドまで着実に上昇し、そこで横ばいになり、最大値の16.2K IOPSに近い状態を維持していることがわかります。一方、リードパフォーマンスは、200 IOPSを超える非常に小さい値から始まり、使用されるクライアントの数にほぼ比例してパフォーマンスを向上させ(各データポイントのスレッド数が2倍になることに注意してください)、512スレッドで最大パフォーマンスの20.4K IOPSに達しますが、最大値に達する兆候はありません。ただし、それぞれ 2 つの CPU を搭載し、各 CPU に 18 コアがある現在の 16 個のコンピューティングノードでより多くのスレッドを使用すると、コンテキスト切り替え (16 x 2 x 18 = 576 コア) を発生させずに最大数の IOzone スレッド (1024) を実行するのに十分なコアがないという制限があり、パフォーマンスが大幅に制限されます。コンピューティングノードを増やした今後のテストでは、IOzoneを使用して1024スレッドで達成できるランダム読み取りパフォーマンスを確認したり、IORを使用して1024スレッドを超える動作を調査したりできます。

空のファイルを使用したMDtestによるメタデータパフォーマンス

メタデータのパフォーマンスは、MDtestバージョン3.3.0で測定されました。また、OpenMPI v4.0.1のアシストにより、16個のコンピューティングノード上でベンチマークを実行しました。テストは、1つのスレッドから最大512スレッドで実行されました。ベンチマークはファイルのみ(ディレクトリーのメタデータなし)に使用され、ソリューションが処理できる作成、統計、読み取り、削除の数を取得しました。
このソリューションを他のDell EMC HPCストレージソリューションと比較して適切に評価するために、オプションの高需要メタデータモジュールを使用しました。ただし、1台のME4024アレイを使用し、この作業でテストした大規模構成では2台のME4024を指定するようにしました。
このハイデマンドメタデータモジュールは、最大4つのME4024アレイをサポートできます。別のメタデータモジュールを追加する前に、ME4024アレイの数を4に増やすことを推奨します。ME4024アレイを追加すると、アレイを追加するたびにメタデータのパフォーマンスが直線的に向上することが予想されます。統計操作(および空ファイルの読み取り)を除いて、数値が非常に大きいため、ある時点でCPUがボトルネックになり、パフォーマンスが直線的に増加し続けることはありません。
次のコマンドを使用してベンチマークを実行しました。ここで、「Threads」は使用されたスレッド数の変数（1～512、2乗で増分）です。また、「my_hosts.$Threads」は、ラウンドロビンを使用して各スレッドを16個のコンピューティングノードに均一に分散したファイルです。ランダムIOベンチマークと同様に、スレッドの最大数は512に制限されました。1024スレッドに十分なコアがなく、コンテキストの切り替えが結果に影響を与えたため、ソリューションの実際のパフォーマンスよりも少ない数値が報告されました。

mpirun --allow-run-as-root -np $Threads --hostfile my_hosts.$Threads --prefix /mmfs1/perftest/ompi --mca btl_openib_allow_ib 1 /mmfs1/perftest/lanl_ior/bin/mdtest -v -d /mmfs1/perftest/ -i 1 -b $Directories -z 1 -L -I 1024 -y -u -t -F

パフォーマンスの結果は、IOPの総数、ディレクトリーあたりのファイル数、スレッド数によって影響を受ける可能性があるため、表3に示すように、ファイルの総数を2 MiBファイル(2^21 = 2097152)に固定し、ディレクトリーあたりのファイル数を1024に固定し、スレッド数の変化に応じてディレクトリー数を変化させることにしました。

表3： MDtest ディレクトリ上のファイルの配布

スレッド数	スレッドあたりのディレクトリー数	ファイルの総数
1	2048	2,097,152
2	1024	2,097,152
4	512	2,097,152
8	256	2,097,152
16	128	2,097,152
32	64	2,097,152
64	32	2,097,152
128	16	2,097,152
256	8	2,097,152
512	4	2,097,152
1024	2	2,097,152

図5：メタデータのパフォーマンス - 空のファイル

まず、選択されたスケールが 10 を底とする対数であり、数桁の違いがある演算を比較できるようにしていることに注意してください。そうしないと、一部の操作は通常のグラフで 0 に近い平坦な線のように見えます。スレッドの数は 2 の累乗で増加するため、基数 2 の対数グラフの方が適切ですが、グラフは非常に似ており、人々は 10 の累乗に基づいてより良い数値を処理し、記憶する傾向があります。

このシステムでは、Stat操作とRead操作がそれぞれ11.2M op/sと4.8M op/sで64スレッドのピーク値に達し、非常に良い結果が得られています。削除操作は16スレッドで最大169.4K op/sを達成し、作成操作は194.2K op/sで512スレッドでピークに達しました。統計操作と読み取り操作での変動性は高いですが、ピーク値に達すると、その後パフォーマンスは、統計の場合は300万op/s、読み取りの場合は200万op/sを下回ることはありません。作成と削除は、プラトーに達するとより安定し、削除の場合は140K op/s、作成の場合は120K op/sを超える状態が維持されます。

4 KiBファイルを使用したMDtestによるメタデータパフォーマンス

このテストは、空のファイルではなく4KiBの小容量ファイルが使用されている点を除き、前のテストとほぼ同じです。
次のコマンドを使用してベンチマークを実行しました。ここで、「Threads」は使用されたスレッド数の変数（1～512、2乗で増分）です。また、「my_hosts.$Threads」は、ラウンドロビンを使用して各スレッドを16個のコンピューティングノードに均一に分散したファイルです。

mpirun --allow-run-as-root -np $Threads --hostfile my_hosts.$Threads --prefix /mmfs1/perftest/ompi --mca btl_openib_allow_ib 1 /mmfs1/perftest/lanl_ior/bin/mdtest -v -d /mmfs1/perftest/ -i 1 -b $Directories -z 1 -L -I 1024 -y -u -t -F -w 4K -e 4K

SLN318841_en_US__7image(11989年)
図6：メタデータのパフォーマンス - 小容量ファイル(4K)

このシステムでは、Stat操作とRemoval操作で非常に良好な結果が得られ、それぞれ7.7M op/sと1M op/sで128スレッドのピーク値に達しています。削除操作は最大37.3K op/秒、作成操作は55.5K op/秒でピークに達しました(いずれも512スレッド)。統計と除去操作のばらつきは大きくなりますが、ピーク値に達すると、パフォーマンスは統計で4M op/s、削除で200K op/sを下回ることはありません。作成と読み取りでは変動が少なく、スレッドの数が増えるにつれて上昇し続けます。
これらの数値は単一のME4024を搭載したメタデータモジュールの場合であるため、ME4024アレイを追加するごとにパフォーマンスは向上しますが、各操作で直線的に増加すると想定することはできません。このようなファイルのinode内にファイル全体が収まる場合を除き、ME4084上のデータターゲットは4Kファイルの格納に使用され、パフォーマンスがある程度制限されます。inodeサイズは4KiBですが、メタデータを保存する必要があるため、内部には3 KiB前後のファイルのみを格納し、それ以上のファイルはデータターゲットを使用します。

3KファイルでのMDtestを使用したメタデータのパフォーマンス

このテストは、3KiBの小さなファイルが使用されたことを除いて、前のテストとほぼ同じです。主な違いは、これらのファイルがinode内に完全に収まることです。したがって、ストレージノードとそのME4084は使用されず、ストレージにSSDメディアのみを使用し、ネットワークアクセスを減らすことで全体的な速度が向上します。
次のコマンドを使用してベンチマークを実行しました。ここで、「Threads」は使用されたスレッド数の変数（1～512、2乗で増分）です。また、「my_hosts.$Threads」は、ラウンドロビンを使用して各スレッドを16個のコンピューティングノードに均一に分散したファイルです。

mpirun --allow-run-as-root -np $Threads --hostfile my_hosts.$Threads --prefix /mmfs1/perftest/ompi --mca btl_openib_allow_ib 1/mmfs1/perftest/lanl_ior/bin/mdtest -v -d /mmfs1/perftest/ -i 1 -b $Directories -z 1 -L -I 1024 -y -u -t -F -w 3K -e 3K

SLN318841_en_US__8image(11990年)
図7：メタデータのパフォーマンス - 小容量ファイル(3K)

統計操作と読み取り操作の結果は非常に良好で、それぞれ8.29M op/sと5.06M op/sで256スレッドのピーク値に達しています。削除操作は128スレッドで最大609K op/sを達成し、作成操作は512スレッドで78K op/sでピークに達しました。統計操作と読み取り操作は、作成と削除よりも変動性が大きくなります。削除により、上位2つのスレッドポイントのパフォーマンスがわずかに低下し、128スレッド後の持続的なパフォーマンスが400K op/sをわずかに超えることが示唆されます。Createは最大512スレッドまで増加し続けましたが、頭打ちになっているように見えるため、最大パフォーマンスはまだ100K op/s未満である可能性があります。
このような小容量ファイルはSSDベースのメタデータモジュールに完全に格納されるため、小容量ファイルの優れたパフォーマンスを必要とするアプリケーションでは、1つ以上のオプションの高負荷メタデータモジュールを使用して小容量ファイルのパフォーマンスを向上させることができます。ただし、inodeに収まるファイルは、現在の基準では小さいものです。また、メタデータターゲットは比較的小さい(最大サイズ19.2TB)SSDを搭載したRAID1を使用するため、ストレージノードと比較すると容量は制限されます。そのため、メタデータターゲットがいっぱいにならないように注意する必要があります。メタデータターゲットがいっぱいになると、不要な障害やその他の問題が発生するおそれがあります。

高度な分析

PixStorの機能の中でも、高度な分析を使用してファイルシステムを監視することは、管理を大幅に簡素化し、問題や潜在的な問題をプロアクティブまたはリアクティブに発見するために不可欠です。次に、これらの機能の一部について簡単に説明します。
図8は、ファイルシステムの容量に基づく有用な情報を示しています。左側には、ファイルシステムの使用済み領域の合計と、使用済みファイルシステムの容量に基づく上位10人のユーザーが表示されます。右側には、長年にわたる使用済み容量の履歴ビュー、使用された容量に基づく上位10個のファイルタイプと上位10個のファイルセットが、パレート図に似た形式(累積合計の線なし)で表示されます。この情報を使用して、ファイルシステムの公平なシェアを超える値を得ているユーザー、容量使用率のトレンドを簡単に見つけることができ、容量の将来の増加に関する決定に役立ちます。また、容量の大部分を使用しているファイルや、容量の大部分を占めているプロジェクトもどれかを確認できます。

SLN318841_en_US__9image(11993年)
図8： PixStor Analytics - 容量ビュー

図 9 は、問題を見つけるための 2 つの非常に便利な方法を備えたファイル数ビューを示しています。画面の前半には、上位 10 人のユーザーが円グラフで表示され、上位 10 個のファイルタイプと上位 10 個のファイルセット (プロジェクトなど) がパレート図に似た形式 (累積合計の線なし) で表示され、すべてファイル数に基づいています。この情報は、いくつかの重要な質問に答えるために使用できます。たとえば、作成しすぎるファイルによってファイルシステムを独占しているユーザー、メタデータの悪夢を生み出しているファイルのタイプ、リソースの大部分を使用しているプロジェクトなどです。
下半分には、ファイルサイズごとに5つのカテゴリを使用したファイルサイズごとのファイル数(頻度)のヒストグラムがあります。これは、ファイルシステム全体で使用されているファイルサイズを把握するために使用でき、ファイルタイプと連携して圧縮が有益かどうかを判断するために使用できます。

SLN318841_en_US__10image(11994年)
図9： PixStor Analytics - ファイル数ビュー

結論および今後の計画

現在のソリューションは、表4に示すように、使用スペースに関係なく安定して動作することが見込めます(システムが分散モードでフォーマットされているため)。さらに、ストレージノードモジュールが追加されると、ソリューションの容量とパフォーマンスが直線的に拡張され、オプションのハイデマンドメタデータモジュールでも同様のパフォーマンスの向上が期待できます。このソリューションは、HPCのお客様に、多くの上位500のHPCクラスターで使用される非常に信頼性の高い並列ファイルシステムを提供します。さらに、卓越した検索機能、高度なモニタリングと管理を備え、オプションのゲートウェイを追加することで、NFSやSMBなどのユビキタス標準プロトコルを介して、必要な数のクライアントとファイルを共有できます。

表 4 ピーク時および持続的なパフォーマンス

	ピーク時のパフォーマンス		継続的なパフォーマンス
	書き込み	読み取り	書き込み	読み取り
大規模 - シーケンシャル - NクライアントからNファイル	16.7 GB/秒	23 GB/秒	16.5 GB/秒	20.5 GB/秒
大規模 - シーケンシャル - Nクライアントから単一の共有ファイル	16.5 GB/秒	23.8 GB/s	16.2 GB/秒	20.5 GB/秒
ランダム - 小さなブロック - NクライアントからNファイル	15.8キログラフ	20.4Kアップ	15,700キロ秒	20.4Kアップ
メタデータ - 作成 - 空のファイル	169.4K IOps		127.2,000 IOPS
メタデータ - 統計 - 空のファイル	1,120万IOPS		330万IOPS
メタデータ - 読み取り - 空のファイル	480万IOPS		2.4M IOps
メタデータ - 削除 - 空のファイル	194.2K IOPS		144.8K IOps
メタデータ - 作成 - 4KiBファイル	55,400 IOPS		55,400 IOPS
メタデータ - 統計 - 4KiBファイル	640万IOPS		400万IOPS
メタデータ - 読み取り - 4KiBファイル	37.3千のIOPS		37.3千のIOPS
メタデータ - 削除 4KiBファイル	100万IOps		219.5千IOPS

このソリューションは、Cascade Lake CPUとより高速なRAMを搭載してリリースされる予定であるため、システムが最終的な構成になると、パフォーマンスのスポットチェックが実行されます。また、少なくとも2台のME4024と4KiBファイルを使用して、オプションのハイデマンドメタデータモジュールをテストし、データターゲットが関連する場合にメタデータのパフォーマンスがどのように拡張されるかをより的確に文書化する必要があります。さらに、ゲートウェイノードのパフォーマンスが測定され、スポットチェックからの関連する結果とともに、新しいブログまたはホワイトペーパーで報告されます。最後に、さらに多くの機能を提供するために、より多くのソリューションコンポーネントをテストおよびリリースする予定です。

Propriétés de l’article

Produit concerné

High Performance Computing Solution Resources, Dell EMC PowerVault ME4012, Dell EMC PowerVault ME4024, Dell EMC PowerVault ME4084

Dernière date de publication

23 févr. 2024

Version

Type d’article

Solution

Haut de la page

Bienvenue

Bienvenue dans l’univers Dell