PowerScale |L3キャッシュとメタデータ戦略について
Summary: PowerScaleでは、ノード プール内のソリッド ステート ドライブ(SSD)を使用してパフォーマンスを向上させる方法を柔軟に選択できます。2つの主要な戦略は、L3キャッシュとメタデータの高速化です。L3キャッシュは、頻繁にアクセスされるデータとメタデータをキャッシュして、読み取りパフォーマンスを向上させるように設計されています。メタデータ アクセラレーションは、メタデータの格納と操作の高速化にSSDを割り当てます。これは、メタデータ集約型のワークロードで役立ちます。 ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Instructions
L3キャッシュについて:
L3キャッシュ: L3キャッシュは、SSDに存在する第2レベルのキャッシュで、プライマリー メモリー キャッシュ(L1およびL2)を補完します。頻繁にアクセスされるデータとメタデータを格納して読み取りレイテンシーを向上させるエビクション キャッシュとして機能します。L3キャッシュは、ランダム ファイル アクセスを伴うワークフローに最も有益です。アーカイブ シリーズのストレージ ノードではメタデータ専用モードで動作できます。SSD上の既存のデータを使用してノード プールでL3キャッシュを有効にするには、SSDをキャッシュに使用する前に、ドライブでそのデータをHDDに退避させる必要があります。一般に、L3キャッシュを無効にする方が高速です。
L3キャッシュの恩恵を受けるワークフロー:
-
- L3キャッシュは、次のような特徴を持つワークフローに役立ちます。
- ランダム ファイル アクセス: ファイルのシーケンシャルでないさまざまな部分の頻繁な読み取りを伴うワークロードでは、L3キャッシュによってレイテンシーが大幅に短縮されます。
- 高い読み取り/書き込み比率: L3キャッシュは主に読み取りを高速化するため、優先度の高い読み取りコンポーネントを使用するワークフローには最大のメリットがあります。
- 頻繁にアクセスされる「ホット」データのキャッシュ: L3キャッシュは、頻繁にアクセスされるデータを自動的に識別して保存し、繰り返しアクセスのパフォーマンスを向上させます。
- ストリーミングおよびコンカレント ファイル アクセス(ある程度): ランダム アクセスが最も大きなメリットをもたらしますが、ストリーミングと同時アクセスを使用するワークフローでも、L3キャッシュによってパフォーマンスがいくらか向上します。
L3キャッシュを選択する場合:
-
- 主なパフォーマンスのボトルネックが、データとメタデータの両方のランダム読み取りレイテンシーである場合。
- RAMを増やすコストをかけずに、ノードの実効メモリー容量を拡張するため。
- L2から最近削除されたデータとメタデータの再読み取りが大量に行われるワークロード用。
- ファイル システム トラバーサルのメタデータ パフォーマンスが重要なアーカイブ クラス ノードの場合。
- 構成のオーバーヘッドを大きくすることなく、シンプルな「設定後は忘れる」読み取りパフォーマンスの向上が必要な場合
メタデータ アクセラレーションを選択する場合: - メタデータ操作(ルックアップ、アクセス、変更)がパフォーマンスの主なボトルネックである場合。
- 大量のメタデータ読み取り(メタデータ読み取りの高速化)または読み取りと書き込みの両方(メタデータ読み取り/書き込みの高速化)を行うワークロード向け。
- 地震の解釈のように、基盤となるデータが低速のストレージにある場合でも、メタデータへの高速アクセスが最優先されるシナリオ。
- メタデータが存在する場所をきめ細かく制御する必要がある場合。
- ローカルSSDのないノードにメタデータ読み取りのメリットを拡張する必要がある場合(他のノードでメタデータ読み取りアクセラレーションでGNAを使用)。
- ホーム ディレクトリーなどのワークロード、大量のファイル列挙を伴うワークフロー、多数の比較を必要とするアクティビティーでは、多くの場合、メタデータ読み取りアクティビティーが高くなります。このような場合、メタデータへのアクセスを直接高速化すると、パフォーマンスが大幅に向上する可能性があります
メタデータ戦略の理解:
メタデータ戦略: データをキャッシュする代わりに、主にメタデータの保存と処理を高速化するようにSSDを構成できます。この戦略は、大量の小容量ファイル、頻繁なディレクトリー検索、メタデータ集約型のジョブ エンジン タスクなど、メタデータ アクセス量が多いワークロードにとって有益です。OneFSは、メタデータ読み取りやメタデータ書き込みなど、さまざまなメタデータSSD戦略をサポートしています。
メタデータ読み取り: SSDは、主にメタデータの読み取り操作を高速化するために使用されます。
メタデータ書き込み: SSDは、メタデータの書き込み処理を高速化するために使用されます。
- L3キャッシュと比較したメタデータ戦略のメリット:
- メタデータ アクセラレーション は、特定のデータセットとワークフローのメタデータ パフォーマンスを向上させるためにSSDをどのように使用するかについて、より的を絞ったきめ細かな制御を提供します。一方、L3キャッシュは、より汎用的なキャッシュ レイヤーであり、幅広いワークロード、特にデータとメタデータの両方に対してランダム読み取りアクセスが繰り返されるワークロードにメリットをもたらします。L3キャッシュは、頻繁にアクセスされるデータの読み取りパフォーマンスを向上させる点で優れていますが、専用のメタデータ戦略には特定の利点があります。
- メタデータ パフォーマンスの向上: メタデータ操作がボトルネックとなっているワークロード(ファイルのオープン、クローズ、名前変更、多数のファイルの一覧表示など)では、SSDをメタデータ専用にすることで、レイテンシーを大幅に削減し、全体的なスループットを向上させることができます。
- ジョブ エンジン パフォーマンスの向上: 特定のOneFSジョブ エンジン タスクは、メタデータを大量に使用します。メタデータ アクセスを高速化すると、これらのジョブの完了時間が短縮されます。
- メタデータ負荷の高いワークロード向けの予測可能なパフォーマンス: メタデータ アクティビティの多いパターンが一貫している環境では、専用のメタデータ戦略により、削除ベースのキャッシュと比較して、より予測可能で持続的なパフォーマンスの向上を実現できます。
- 特定のアプリケーション とワークフローでは、実際のデータの読み取りと書き込みと比較して、不釣り合いなほど多くのメタデータ操作が生成されます。例としては、ファイル アーカイブ、メディア資産管理、電子設計自動化(EDA)、コンパイルを頻繁に行うソフトウェア開発環境、多数の小さなファイル アクセスと分析を伴うゲノミクス パイプラインなどがあります。このような場合、メタデータへのアクセスと操作に関連するレイテンシーが、パフォーマンスの大きなボトルネックになる可能性があります
- 複雑なディレクトリー構造をナビゲート したり、多数のディレクトリーの内容を一覧表示したりする操作は、メタデータのパフォーマンスに大きく依存します。メタデータ アクセラレーションにより、システムはinode情報とディレクトリー エントリーにすばやくアクセスできるようになり、容量の制約やアクセス頻度の低さが原因でこの情報を削除した可能性のあるL3キャッシュに依存する場合と比較して、これらの操作が大幅に高速化されます
- バックアップ、 レプリケーション、 移行: これらのデータ管理タスクには、多くの場合、広範なメタデータのスキャンと処理が含まれます。高速化によるメタデータ アクセスの高速化により、これらのジョブの完了に必要な時間が大幅に短縮され、プライマリー ワークロードの中断が最小限に抑えられ、運用効率が向上します。
- 検索とインデックス作成: ユーザーまたは自動化されたプロセスがメタデータ属性(名前、サイズ、変更日など)に基づいて特定のファイルを検索する必要がある場合、メタデータ アクセスを高速化することで、クエリの実行を高速化できます。これは、ファイル システム メタデータのインデックスを作成し、複数のクラスター間で効率的なクエリーとデータ検出を行うMetadataIQなどのソリューションに関連しています
- メタデータを選択する場合:
- 大量のディレクトリの閲覧、ファイルまたはデータの検索操作、インデックス作成。
- ディレクトリーのオープン、終了、削除、作成などのファイル操作(mkdir)。
- ルックアップ、getattr、アクセス操作。
- ホーム ディレクトリー、特に多数のオブジェクトを含むホーム ディレクトリー。
- 大量の列挙や比較を伴うワークフロー。
- メタデータの適時性が重要な地震探査データの解釈。
- メタデータの高速化により、これらのタイプのアクティビティのパフォーマンスが大幅に向上し、スループットが向上し、レイテンシーが短縮されます
[Summary]:選ぶタイミング
-
- ワークロードがファイル メタデータへのアクセスまたは変更操作(参照、検索、インデックス作成、作成、削除、属性の変更)に大きく偏っている場合は、メタデータ高速化戦略(メタデータ読み取りまたはメタデータ読み取り/書き込み)を選択します。
- ワークロードが主にメタデータ読み取り集中型で、使用するSSD容量を減らしたい場合は、メタデータ読み取りアクセラレーションを選択します。
- ワークロードに大量のメタデータの書き込みが含まれる場合、より高速なスナップショット削除が必要な場合、またはフラッシュ上のインライン小容量ファイルのメリットが得られるEDAなどの小容量ファイルのHPCワークロードの場合は、[Metadata Read/Write Acceleration]を選択します。十分なSSD容量があることを確認します。
- 混在クラスター(SSD搭載ノードと非搭載ノード)があり、クラスター全体でSSD以外のノードに存在するデータのメタデータ読み取りを高速化する必要がある場合は、GNAを検討してください。これは、分散しているメタデータ集約型のワークロードに関連しています。
- グローバル ネームスペースの高速化(GNA): GNAは古いメカニズム(すべてのノードにSSDがある場合にL3キャッシュに置き換えることを意図したもの)であり、SSDのないノード プールが、SSDに追加のメタデータ ミラーを保存することで、クラスター内の他の場所でSSDを活用できるようにするものです。これにより、HDDのみのプールに格納されているデータのメタデータ読み取り操作が高速化されます。L3キャッシュとGNAは同じクラスター内で共存できますが、通常は異なるノード プールで動作します。
- ワークロードに大量のランダム読み取りが含まれる場合、大規模なワーキング セットの拡張キャッシュのメリットが得られる場合、またはノードにSSDがある場合にジョブ エンジンのパフォーマンスを向上させる必要がある場合は、L3キャッシュを検討してください。
ツールとコマンド:
- パフォーマンス監視:InsightIQ、CloudIQ、MetadataIQなどのツールを使用して、クラスターの正常性、パフォーマンス メトリック、使用状況の予測を監視します。InsightIQは、パフォーマンスのトレンドを追跡し、パターンを識別し、ファイル分析を実行できます。また、クラスターが最大容量に達するタイミングを見積もるのにも役立ちます。CloudIQは、クラスターのパフォーマンスに関するインサイトを提供します。MetadataIQは、クラスター間でのデータのインデックス作成とクエリーを容易にし、データのライフサイクル管理とデータ分散の把握に使用できます。
- isi_cache_stats ユーティリティーは、L2およびL3キャッシュのSSDのサイズ設定に関連する、作業データセットのサイズを決定するのに役立ちます。一般的なルールとして、L2容量 + L3容量は、 > = ワーキング セット サイズの150%にする必要があります。
- MetadataIQ (OneFS 9.10+): MetadataIQを導入して構成し、クラスター全体でメタデータのインデックス作成とグローバル カタログを作成します。Kibanaダッシュボードを使用して、データ分散、ファイル数、メタデータ属性を可視化します。これは、データの構成とメタデータがどのように増加しているかを理解するのに役立ちます。定期的な同期により、メタデータ データベースを最新の状態に維持
- InsightIQ は、合計容量、プロビジョニング容量、使用済み容量など、クラスター容量に関するレポートを提供します。これにより、履歴の傾向に基づいてストレージ ニーズを予測できます。ワークロードのパフォーマンス、レイテンシー、IOPS、スループットを監視できるため、データの増加に伴う潜在的なボトルネックを検出できます。InsightIQのFile System Analyticsレポートには、ファイル数とサイズの分布が表示され、LIN数の増加に直接関係するデータの規模と構成に関するインサイトが得られます。
Affected Products
Isilon, PowerScale, PowerScale OneFSArticle Properties
Article Number: 000321641
Article Type: How To
Last Modified: 16 May 2025
Version: 1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.