PowerScale | Grundlegendes zu L3-Cache- und Metadatenstrategien
Summary: PowerScale bietet Flexibilität bei der Verwendung von Solid-State-Laufwerken (SSDs) in einem Node-Pool zur Verbesserung der Leistung. Zwei primäre Strategien sind L3-Cache und Metadatenbeschleunigung. Der L3-Cache wurde entwickelt, um häufig aufgerufene Daten und Metadaten zwischenzuspeichern und so die Leseleistung zu verbessern. Bei der Metadatenbeschleunigung werden SSDs zum Speichern und Beschleunigen von Metadatenvorgängen dediziert, was für Metadaten-intensive Workloads von Vorteil sein kann. ...
Instructions
Grundlegendes zum L3-Cache:
L3-Cache: Der L3-Cache ist eine sekundäre Cacheebene, die sich auf SSDs befindet und den primären Arbeitsspeichercache (L1 und L2) ergänzt. Er fungiert als Leerungscache und speichert Daten und Metadaten, auf die häufig zugegriffen wird, um die Leselatenz zu verbessern. Der L3-Cache eignet sich besonders für Workflows mit wahlfreiem Dateizugriff. Es kann in einem reinen Metadatenmodus für Storage-Nodes der Archivserie betrieben werden. Die Aktivierung von L3-Cache in einem Node-Pool mit vorhandenen Daten auf SSDs erfordert, dass die Laufwerke diese Daten auf HDDs evakuieren, bevor die SSDs für das Caching verwendet werden können. Das Deaktivieren des L3-Caches ist in der Regel ein schnellerer Vorgang.
Workflows, die vom L3-Cache profitieren:
-
- L3-Cache ist für Workflows mit den folgenden Eigenschaften von Vorteil:
- Zufälliger Dateizugriff: Bei Workloads, die häufige Lesevorgänge verschiedener, nicht sequenzieller Teile von Dateien beinhalten, können mit L3-Cache erhebliche Latenzreduzierungen erzielt werden.
- Hohes Lese-zu-Schreib-Verhältnis: Da L3-Cache Lesevorgänge in erster Linie beschleunigt, profitiert ein Workflow mit einer dominanten Lesekomponente am meisten.
- Zwischenspeichern häufig aufgerufener "heißer" Daten: Der L3-Cache identifiziert und speichert Daten, auf die häufig zugegriffen wird, automatisch, um die Leistung bei wiederholtem Zugriff zu verbessern.
- Streaming und gleichzeitiger Dateizugriff (bis zu einem gewissen Grad): Während der zufällige Zugriff den größten Nutzen bringt, können auch Workflows mit Streaming und gleichzeitigem Zugriff einige Leistungsverbesserungen mit L3-Cache erzielen.
Wann sollten Sie L3-Cache wählen?
-
- Wenn der primäre Performanceengpass eine zufällige Leselatenz für Daten und Metadaten ist.
- Zur Erweiterung der effektiven Arbeitsspeicherkapazität von Nodes, ohne die Kosten für mehr RAM zu verursachen.
- Für Workloads, die eine erhebliche Menge an erneuten Lesevorgängen von Daten und Metadaten aufweisen, die kürzlich aus L2 entfernt wurden.
- Für Nodes der Archivklasse, bei denen die Metadatenperformance für das Durchlaufen des Dateisystems kritisch ist.
- Wenn eine einfachere Verbesserung der Leseperformance nach dem Prinzip "Einstellen und Vergessen" ohne signifikanten Konfigurationsaufwand gewünscht wird.
Wann sollten Sie sich für eine Metadatenbeschleunigung entscheiden? - Wenn Metadatenvorgänge (Suchen, Zugriff, Änderungen) der primäre Performanceengpass sind.
- Für Workloads mit einem hohen Volumen an Metadatenlesevorgängen (Beschleunigung der Metadatenlesevorgänge) oder Lese- und Schreibvorgängen (Beschleunigung der Lese-/Schreibvorgänge für Metadaten).
- In Szenarien wie der seismischen Interpretation, in denen ein schneller Metadatenzugriff von größter Bedeutung ist, selbst wenn sich die zugrunde liegenden Daten auf einem langsameren Speicher befinden.
- Wenn eine fein abgestimmte Kontrolle darüber erforderlich ist, wo sich Metadaten befinden.
- Bei der Erweiterung der Vorteile beim Lesen von Metadaten auf Nodes ohne lokale SSDs ist dies erforderlich (bei Verwendung von GNA mit Lesebeschleunigung für Metadaten auf anderen Nodes).
- Workloads wie Stammverzeichnisse, Workflows mit umfangreichen Dateiaufzählungen und Aktivitäten, die zahlreiche Vergleiche erfordern, weisen häufig eine hohe Aktivität beim Lesen von Metadaten auf. In solchen Fällen kann die direkte Beschleunigung des Metadatenzugriffs zu einer deutlichen Performanceverbesserung führen
Grundlegendes zu Metadatenstrategien:
Metadatenstrategie: Anstatt Daten zwischenzuspeichern, können SSDs so konfiguriert werden, dass sie in erster Linie Metadatenvorgänge speichern und beschleunigen. Diese Strategie kann für Workloads mit einem hohen Volumen an Metadatenzugriffen von Vorteil sein, z. B. viele kleine Dateien, häufige Verzeichnisabfragen und metadatenintensive Job-Engine-Aufgaben. OneFS unterstützt verschiedene Metadaten-SSD-Strategien, einschließlich Metadatenlese- und Metadatenschreibvorgängen.
Metadatenlesevorgänge: SSDs werden in erster Linie zur Beschleunigung von Metadatenlesevorgängen verwendet.
Metadaten-Schreibvorgang: SSDs werden verwendet, um Schreibvorgänge für Metadaten zu beschleunigen.
- Vorteile der Metadatenstrategie gegenüber L3-Cache:
- Die Metadatenbeschleunigung bietet eine gezieltere und feiner abgestimmte Kontrolle darüber, wie SSDs verwendet werden, um die Metadaten-Performance für bestimmte Datenvolumen und Workflows zu verbessern. Der L3-Cache hingegen ist eine allgemeinere Zwischenspeicherungsschicht, von der ein breiteres Spektrum an Workloads profitieren, insbesondere solche mit wiederholtem zufälligem Lesezugriff auf Daten und Metadaten. Während sich L3-Cache durch eine bessere Leseperformance für häufig verwendete Daten auszeichnet, kann eine dedizierte Metadatenstrategie spezifische Vorteile bieten:
- Verbesserte Metadatenleistung: Bei Workloads, bei denen Metadatenvorgänge den Engpass darstellen (z. B. Öffnen, Schließen, Umbenennen, Auflisten einer großen Anzahl von Dateien), kann die Zuweisung von SSDs für Metadaten die Latenz erheblich reduzieren und den Gesamtdurchsatz verbessern.
- Verbesserte Job-Engine-Performance: Bestimmte Aufgaben der OneFS-Job-Engine erfordern Metadaten. Die Beschleunigung des Metadatenzugriffs kann zu schnelleren Abschlusszeiten für diese Jobs führen.
- Zuverlässige Performance für Metadaten-intensive Workloads: In Umgebungen mit einem konsistenten Muster hoher Metadatenaktivität kann eine dedizierte Metadatenstrategie im Vergleich zu einem leerungsbasierten Cache vorhersehbarere und nachhaltigere Leistungsverbesserungen bieten.
- Bestimmte Anwendungen und Workflows erzeugen eine unverhältnismäßig hohe Anzahl von Metadatenoperationen im Vergleich zu tatsächlichen Lese- und Schreibvorgängen von Daten. Beispiele hierfür sind Dateiarchivierung, Media Asset Management, Electronic Design Automation (EDA), Softwareentwicklungsumgebungen mit häufigen Kompilierungen und Genomikpipelines, die zahlreiche Zugriffe auf kleine Dateien und Analysen beinhalten. In diesen Fällen kann die Latenz, die mit dem Zugriff auf und der Bearbeitung von Metadaten verbunden ist, zu einem erheblichen Leistungsengpass werden
- Vorgänge, die das Navigieren in komplexen Verzeichnisstrukturen oder das Auflisten der Inhalte vieler Verzeichnisse umfassen, hängen stark von der Metadatenperformance ab. Die Metadatenbeschleunigung sorgt dafür, dass das System schnell auf die Inode-Informationen und Verzeichniseinträge zugreifen kann, was diese Vorgänge erheblich beschleunigt, verglichen mit einem L3-Cache, der diese Informationen möglicherweise aufgrund von Kapazitätseinschränkungen oder weniger häufigem Zugriff entfernt hat
- Backup, Replikation und Migration: Diese Datenmanagementaufgaben umfassen oft umfangreiche Metadatenüberprüfungen und -verarbeitungen. Ein schnellerer Metadatenzugriff durch Beschleunigung kann die für die Ausführung dieser Aufgaben erforderliche Zeit erheblich verkürzen, Unterbrechungen primärer Workloads minimieren und die Betriebseffizienz verbessern.
- Suche und Indexierung: Wenn Benutzer oder automatisierte Prozesse basierend auf ihren Metadatenattributen (z. B. Name, Größe, Änderungsdatum) nach bestimmten Dateien suchen müssen, ermöglicht der beschleunigte Metadatenzugriff eine schnellere Abfrageausführung. Dies ist relevant für Lösungen wie MetadataIQ, die Dateisystemmetadaten für effiziente Abfragen und Datenermittlungen über mehrere Cluster hinweg indizieren
- Wann Sie Metadaten auswählen sollten:
- Intensives Durchsuchen von Verzeichnissen, Datei- oder Datensuchvorgänge, Indexierung.
- Dateivorgänge wie Öffnen, Schließen, Löschen, Erstellen von Verzeichnissen (mkdir).
- Such-, Getattr- und Zugriffsvorgänge.
- Stammverzeichnisse, insbesondere solche mit vielen Objekten.
- Workflows mit umfangreichen Aufzählungen oder Vergleichen.
- Interpretation seismischer Daten, bei denen die Aktualität der Metadaten von entscheidender Bedeutung ist.
- Die Metadatenbeschleunigung kann für diese Arten von Aktivitäten erhebliche Leistungsverbesserungen erzielen, den Durchsatz erhöhen und die Latenz verringern
Zusammenfassung: Wann Sie wählen sollten
-
- Wählen Sie eine Strategie zur Beschleunigung von Metadaten (Lesen von Metadaten oder Lesen/Schreiben von Metadaten), wenn Ihre Workload stark auf Vorgänge ausgerichtet ist, die auf Dateimetadaten zugreifen oder diese ändern (Durchsuchen, Suchen, Indexieren, Erstellen, Löschen, Ändern von Attributen).
- Wählen Sie Metadaten-Lesebeschleunigung , wenn Ihre Workload hauptsächlich Metadatenleseintensiv ist und Sie weniger SSD-Kapazität verwenden möchten.
- Wählen Sie die Lese-/Schreibbeschleunigung für Metadaten aus , wenn Ihre Workload eine erhebliche Anzahl von Metadatenschreibvorgängen umfasst, schnellere Snapshot-Löschvorgänge erfordert oder eine HPC-Workload mit kleinen Dateien wie EDA von Inline-Dateien auf Flash profitiert. Stellen Sie sicher, dass Sie über ausreichend SSD-Kapazität verfügen.
- Ziehen Sie GNA in Betracht , wenn Sie ein gemischtes Cluster (Nodes mit und ohne SSDs) haben und Lesevorgänge für Metadaten für Daten auf Nicht-SSD-Nodes im gesamten Cluster beschleunigen müssen. Dies ist relevant für metadatenintensive Workloads, die verteilt sind.
- Beschleunigung des globalen Namespace (GNA): GNA ist ein älterer Mechanismus (der durch L3-Cache ersetzt werden soll, wenn alle Nodes über SSDs verfügen), der es Node-Pools ohne SSDs ermöglicht, SSDs an anderer Stelle im Cluster zu nutzen, indem zusätzliche Metadatenspiegelungen auf diesen SSDs gespeichert werden. Dies beschleunigt Metadatenlesevorgänge für Daten, die auf reinen HDD-Pools gespeichert sind. L3-Cache und GNA können im selben Cluster vorhanden sein, werden aber in der Regel auf unterschiedlichen Node-Pools betrieben.
- Ziehen Sie L3-Cache in Betracht , wenn Ihre Workload erhebliche zufällige Lesevorgänge umfasst, von erweitertem Caching für einen großen Arbeitssatz profitiert oder eine verbesserte Job-Engine-Leistung benötigt, sofern Ihre Nodes über SSDs verfügen.
Tools und Befehle:
- Leistungsüberwachung: Verwenden Sie Tools wie InsightIQ, CloudIQ und MetadataIQ für das Monitoring der Clusterintegrität, der Leistungskennzahlen und der Nutzungsprognosen. InsightIQ kann Performancetrends nachverfolgen, Muster identifizieren und Dateianalysen durchführen. Es kann auch abschätzen, wann ein Cluster die maximale Kapazität erreicht. CloudIQ bietet Einblicke in die Clusterperformance. MetadataIQ erleichtert die Indexierung und Abfrage von Daten über Cluster hinweg und kann für das Datenlebenszyklusmanagement und das Verständnis der Datenverteilung verwendet werden.
- Das Dienstprogramm isi_cache_stats kann Ihnen helfen, die Größe des Arbeits-Datenvolumens zu bestimmen, die für die Dimensionierung von SSDs für L2- und L3-Cache relevant ist. Eine allgemeine Regel besagt, dass L2-Kapazität + L3-Kapazität = 150 % der Working-Set-Größe betragen >sollte.
- MetadatenIQ (OneFS 9.10+): Stellen Sie MetadataIQ bereit und konfigurieren Sie es, um einen globalen Katalog von Metadaten clusterübergreifend zu indizieren und zu erstellen. Verwenden Sie das Kibana-Dashboard, um die Datenverteilung, Dateianzahl und Metadatenattribute zu visualisieren. Auf diese Weise können Sie die Zusammensetzung Ihrer Daten und die Zunahme von Metadaten besser verstehen. Regelmäßige Synchronisierungen halten die Metadatendatenbank auf dem neuesten Stand
- InsightIQ bietet Berichte zur Clusterkapazität, einschließlich der gesamten, bereitgestellten und genutzten Kapazität, sodass Sie den Speicherbedarf basierend auf historischen Trends prognostizieren können. Es kann Workload-Performance, Latenz, IOPS und Durchsatz überwachen, sodass Sie potenzielle Engpässe erkennen können, wenn die Daten wachsen. Die Dateisystemanalyseberichte von InsightIQ können die Dateianzahl und -größenverteilung anzeigen, sodass Sie einen Einblick in den Umfang und die Zusammensetzung Ihrer Daten erhalten, die in direktem Zusammenhang mit dem Wachstum der LIN-Anzahl stehen.