PowerFlex: Client IO-fouten bij gebruik van replicatie
Summary: Client/servers ondervinden IO-fouten voor apparaten met PowerFlex-back-up. De algehele backend (MDM/SDS'en) lijkt in orde te zijn. PowerFlex-replicatie wordt gebruikt en er zijn enkele RPO-fouten tegen 1 of meer van de RCG's. ...
Symptoms
- Geen verslechterde of defecte capaciteit
- Er zijn geen ontkoppelde SDS-servers of SDS-apparaten die fouten melden.
- Geen losgekoppelde MDM's
De replicatiefunctie wordt gebruikt.
Een of meer meldingen in de gebruikersinterface melden de volgende fouten:
Major - The RCG consistent image is too large to be consumed by the destination in one piece. Minor - Remote Consistency Group RPO ExceededMDM-gebeurtenislogboeken kunnen het volgende melden:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR WARNING Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level 2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR ERROR Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level 2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level 2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level ... 2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE INFO Replication Consistency Group ID <rcg_id> entered slim mode 2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE ERROR SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
Impact
Clients hebben geen toegang tot volumes die worden onderschept voor replicatie.
Cause
Resolution
|
Een rollende herstart van alle SDR-componenten is vereist en het MDM-eigendom op het bronsysteem moet worden omgeschakeld om het probleem op te lossen. SDR-onderdelen opnieuw starten: 1) Identificeer alle SDR's: scli --query_all_sdr 2) Ga naar de onderhoudsmodus op de SDR: scli --enter_sdr_maintenance_mode --sdr_name <name> 3) Bevestig dat de SDR volledig in de onderhoudsmodus staat door de opdracht in stap 1 uit te voeren. 4) Start het SDR-onderdeel opnieuw op. pkill sdr 5) Herhaal dit voor alle SDR's op de bronsite. Zodra alle SDR's opnieuw zijn gestart, schakelt u over naar MDM: #3.x scli --switch_mdm_ownership --new_master_mdm_name <name> #4.x scli --switch_mdm_ownership --new_primary_mdm_name <name> *Indien gewenst kan het eigendom worden teruggezet naar de oorspronkelijke MDM-server. Totdat de oorzaak kan worden vastgesteld, wordt ook aanbevolen om alle RCG's op het bronsysteem te beëindigen. Als de IO-fouten zich blijven voordoen na het toepassen van de bovenstaande stappen, schakelt u PowerFlex Engineering in. |
Additional Information
Versies waarop dit van toepassing is
PowerFlex 3.x
PowerFlex 4.x
Opgelost in versie
PFMP 4.5.3