PowerFlex: Klient-I/O-feil når replikering brukes
Summary: Klient/servere opplever I/O-feil mot PowerFlex-støttede enheter. Den generelle backend (MDM / SDSes) ser ut til å være sunn. PowerFlex-replikering brukes, og det er noen RPO-feil mot 1 eller flere av RCG-ene. ...
Symptoms
- Ingen redusert eller feilet kapasitet
- Ingen SDS-er frakoblede eller SDS-enheter rapporterer feil.
- Ingen frakoblede MDM-er
Replikeringsfunksjonen brukes.
Ett eller flere varsler i brukergrensesnittet som rapporterer følgende feil:
Major - The RCG consistent image is too large to be consumed by the destination in one piece. Minor - Remote Consistency Group RPO ExceededMDM-hendelseslogger kan rapportere følgende:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR WARNING Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level 2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR ERROR Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level 2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level 2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level ... 2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE INFO Replication Consistency Group ID <rcg_id> entered slim mode 2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE ERROR SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
Innvirkning
Klienter får ikke tilgang til volumer som er avlyttet for replikering.
Cause
Resolution
|
Det kreves en rullerende omstart av alle SDR-komponenter, og MDM-eierskapet for kildesystemet må byttes for å løse problemet. Start SDR-komponenter på nytt: 1) Identifiser alle SDR-ene: scli --query_all_sdr 2) Gå inn i vedlikeholdsmodus på SDR: scli --enter_sdr_maintenance_mode --sdr_name <name> 3) Bekreft at SDR er fullstendig i vedlikeholdsmodus ved å kjøre kommandoen i trinn 1. 4) Start SDR-komponenten på nytt. pkill sdr 5) Gjenta dette for alle SDR på kilden nettstedet. Når alle SDR er startet på nytt, bytter du MDM-eierskap: #3.x scli --switch_mdm_ownership --new_master_mdm_name <name> #4.x scli --switch_mdm_ownership --new_primary_mdm_name <name> *Hvis det er ønskelig, kan eierskapet overføres tilbake til den opprinnelige MDM-serveren. Inntil årsaken kan fastslås, vil det også bli anbefalt at alle RCGer på kildesystemet avsluttes. Hvis I/O-feilene vedvarer etter at trinnene ovenfor er utført, må du engasjere PowerFlex Engineering. |
Additional Information
Berørte versjoner
PowerFlex 3.x
PowerFlex 4.x
Løst i versjon
PFMP 4.5.3