PowerFlex: Klient-IO-fel när replikering används
Summary: Klient/servrar har IO-fel mot enheter med PowerFlex-stöd. Den övergripande serverdelen (MDM/SDS) verkar vara felfri. PowerFlex-replikering används och det finns några RPO-fel mot en eller flera av RCG:erna. ...
Symptoms
- Ingen försämrad eller trasig kapacitet
- Inga SDS:er frikopplade eller SDS-enheter rapporterar fel.
- Inga frånkopplade MDM-enheter
Replikeringsfunktionen används.
En eller flera aviseringar i användargränssnittet som rapporterar följande fel:
Major - The RCG consistent image is too large to be consumed by the destination in one piece. Minor - Remote Consistency Group RPO ExceededMDM-händelseloggar kan rapportera följande:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR WARNING Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level 2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR ERROR Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level 2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level 2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level ... 2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE INFO Replication Consistency Group ID <rcg_id> entered slim mode 2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE ERROR SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
Påverkan
Klienter kan inte komma åt volymer som fångas upp för replikering.
Cause
Resolution
|
En löpande omstart av alla SDR-komponenter krävs och MDM-ägarskapet på källsystemet måste bytas för att problemet ska kunna lösas. Starta om SDR-komponenter: 1) Identifiera alla särskilda dragningsrätter: scli --query_all_sdr 2) Gå in i underhållsläge på SDR: scli --enter_sdr_maintenance_mode --sdr_name <name> 3) Kontrollera att SDR är helt i underhållsläge genom att köra kommandot i steg 1. 4) Starta om SDR-komponenten. pkill sdr 5) Upprepa detta för alla SDR:er på källwebbplatsen. När alla SDR-noder har startats om byter du MDM-ägarskap: #3.x scli --switch_mdm_ownership --new_master_mdm_name <name> #4.x scli --switch_mdm_ownership --new_primary_mdm_name <name> *Om så önskas kan ägarskapet överföras tillbaka till den ursprungliga MDM-servern. Fram till dess att orsaken kan fastställas kommer det också att rekommenderas att alla RCG:er på källsystemet avslutas. Om IO-felen kvarstår efter att stegen ovan har tillämpats kopplar du in PowerFlex Engineering. |
Additional Information
Versioner som påverkas
PowerFlex 3.x
PowerFlex 4.x
Åtgärdat i version
PFMP 4.5.3