FluidFS-Kundenbenachrichtigung. Wie der Reclaimer-Service Speicherplatz auf einem NAS-Pool freigibt
Zusammenfassung: In dieser Kundenbenachrichtigung wird erläutert, wie der Reclaimer-Service Speicherplatz auf einem NAS Pool freigibt.
Symptome
Wenn ein Snapshot gelöscht wird, wird er gescannt, um die Blöcke freizugeben, die er exklusiv besaß. Dieser Prozess, auch bekannt als reclaimer, läuft im Hintergrund.
Je größer der Snapshot, desto länger dauert dieser Vorgang. Nachdem die reclaimer Wenn der Prozess abgeschlossen ist, wird der gesamte freigegebene Speicherplatz für das Volume verfügbar.
Er muss ausgeführt werden, bevor die Zuordnung von Blöcken mithilfe von SCSI unmap (falls aktiviert) in die Back-end-SAN-Volumes.
Die Spalte reclaimer Der Prozess wird in Warteschlangen gestellt, um ausgeführt zu werden, wenn Daten aus dem NAS-Pool gelöscht werden, einschließlich von Freigaben, NAS-Volumes und Snapshot-Löschungen.
Ursache
Bekannte Einschränkungen und Probleme
- Die Spalte
reclaimerDer Service kann nicht manuell ausgeführt oder über einen längeren Zeitraum angehalten werden. Nach dem Start muss die Warteschlange abgeschlossen werden, bevor Speicherplatz für den NAS-Pool freigegeben wird. - Die Rückgewinnung von Snapshots ist ressourcenintensiv. Wenn viele Rückgewinnungsaktivitäten gleichzeitig auftreten, kann dies zu Performanceproblemen im gesamten Cluster führen.
-
- Ressourcenintensive Rückgewinnungsvorgänge können sich so stark auf die Performance auswirken, dass der Client-Zugriff auf das Cluster beeinträchtigt wird.
- Es gibt ein Limit für die Erstellung und den Ablauf von Snapshots, das je nach Appliance basierend auf der Gesamtsystemlast variiert. Dies kann sich direkt auf den Reclaimer und die Systemfunktionalität auswirken.
-
- Während
reclaimerin der FluidFS-Firmware v6 für Snapshot-Löschvorgänge verbessert wurde, ist es möglich, dass ein überlasteter Reclaimer-Dienst den Client-Zugriff beeinträchtigt. Diese Ereignisse werden gemeldet als"clients may encounter a long period of partial data access"
- Während
Prüfen Sie, ob die Performanceprobleme zu dem Zeitpunkt auftreten, zu dem einige Snapshots ablaufen.
Es gibt verschiedene Arten von Snapshots:
- Manuelle Snapshots: Snapshots, die ablaufen, wenn der Administrator sie löscht, oder gemäß der vom Administrator festgelegten Ablaufzeit.
- Geplante Snapshots: Snapshots, die gemäß den Planungsdetails ablaufen. Die Namen basieren auf dem Namen des Zeitplans.
- NDMP-Snapshots (Network Data Management Protocol): Snapshots, die ablaufen, wenn das NDMP-Backup abgeschlossen ist. Die Namen beginnen mit ndmp.
- Replikations-Snapshots: Snapshots, die nach erfolgreichem Abschluss der nächsten Replikation ablaufen. (Während einer Replikation gibt es zwei Snapshots, den vorherigen Snapshot und den aktuellen Snapshot.) Namen von Replikations-Snapshots beginnen mit rep.
Lösung
Staffelung von Snapshot-Aufgaben (Standard-Snapshots, Replikation, NDMP)
Wenn viele Snapshots gleichzeitig ablaufen, kann dies zu Performanceproblemen führen.
Weniger, aber größere Snapshots, die gleichzeitig ablaufen, können ebenfalls zu Performanceproblemen führen.
Es wird empfohlen, stündliche Snapshots über die Zeit (in Schritten von 10 Minuten) und tägliche Snapshots über den Tag zu staffeln (vorzugsweise mit Ablauf in der Nacht). Wöchentliche Snapshots sollten vorzugsweise am Wochenende ablaufen.