PowerFlex: Client-I/O-Fehler bei Verwendung der Replikation
Summary: Bei Clients/Servern treten I/O-Fehler auf PowerFlex-gestützten Geräten auf. Das gesamte Back-end (MDM/SDS) scheint fehlerfrei zu sein. Die PowerFlex-Replikation wird verwendet, und es sind einige RPO-Fehler bei mindestens einer RCG aufgetreten. ...
Symptoms
- Keine heruntergestufte oder ausgefallene Kapazität
- Keine SDSs entkoppelt oder SDS-Geräte melden Fehler.
- Keine getrennten MDMs
Die Replikationsfunktion wird verwendet.
Eine oder mehrere Warnmeldungen in der Benutzeroberfläche melden die folgenden Fehler:
Major - The RCG consistent image is too large to be consumed by the destination in one piece. Minor - Remote Consistency Group RPO ExceededMDM-Ereignisprotokolle melden möglicherweise Folgendes:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR WARNING Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level 2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR ERROR Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level 2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level 2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level ... 2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE INFO Replication Consistency Group ID <rcg_id> entered slim mode 2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE ERROR SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
Auswirkungen
Clients können nicht auf Volumes zugreifen, die für die Replikation abgefangen werden.
Cause
Resolution
|
Ein fortlaufender Neustart aller SDR-Komponenten ist erforderlich und die MDM-Eigentumsrechte auf dem Quellsystem müssen gewechselt werden, um das Problem zu beheben. Starten Sie SDR-Komponenten neu: 1) Identifizieren Sie alle SDRs: scli --query_all_sdr 2) Wechseln Sie in den Wartungsmodus auf dem SDR: scli --enter_sdr_maintenance_mode --sdr_name <name> 3) Überprüfen Sie, ob sich der SDR vollständig im Wartungsmodus befindet, indem Sie den Befehl in Schritt 1 ausführen. 4) Starten Sie die SDR-Komponente neu. pkill sdr 5) Wiederholen Sie dies für alle SDRs am Quellstandort. Sobald alle SDRs neu gestartet wurden, wechseln Sie die MDM-Eigentumsrechte: #3.x scli --switch_mdm_ownership --new_master_mdm_name <name> #4.x scli --switch_mdm_ownership --new_primary_mdm_name <name> *Falls gewünscht, können die Eigentumsrechte zurück auf den ursprünglichen MDM-Server übertragen werden. Bis die Ursache ermittelt werden kann, wird außerdem empfohlen, alle RCGs auf dem Quellsystem zu beenden. Wenn die IO-Fehler nach Anwendung der oben genannten Schritte weiterhin auftreten, wenden Sie sich an PowerFlex Engineering. |
Additional Information
Betroffene Versionen
PowerFlex 3.x
PowerFlex 4.x
Behoben in Version
PFMP 4.5.3