PowerFlex: Klient-IO-fejl, når replikering bruges
Summary: Klient/servere oplever IO-fejl i forhold til PowerFlex-understøttede enheder. Den samlede backend (MDM / SDS'er) ser ud til at være sund. PowerFlex-replikering bruges, og der er nogle RPO-fejl mod 1 eller flere af RCG'erne. ...
Symptoms
- Ingen forringet eller fejlbehæftet kapacitet
- Ingen frakoblede SDS'er eller SDS-enheder rapporterer fejl.
- Ingen afbrudte MDM'er
Replikeringsfunktionen anvendes.
En eller flere advarsler i brugergrænsefladen, der rapporterer følgende fejl:
Major - The RCG consistent image is too large to be consumed by the destination in one piece. Minor - Remote Consistency Group RPO ExceededMDM-hændelseslogfiler rapporterer muligvis følgende:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR WARNING Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level 2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR ERROR Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level 2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level 2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level ... 2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE INFO Replication Consistency Group ID <rcg_id> entered slim mode 2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE ERROR SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
Påvirkning
Klienter kan ikke få adgang til diskenheder, der opfanges til replikering.
Cause
Resolution
|
Der kræves en rullende genstart af alle SDR-komponenter, og MDM-ejerskabet på kildesystemet skal skiftes for at løse problemet. Genstart SDR-komponenter: 1) Identificer alle SDR'er: scli --query_all_sdr 2) Gå til vedligeholdelsestilstand på SDR: scli --enter_sdr_maintenance_mode --sdr_name <name> 3) Bekræft, at SDR er helt i vedligeholdelsestilstand ved at køre kommandoen i trin 1. 4) Genstart SDR-komponenten. pkill sdr 5) Gentag dette for alle SDR er på kildewebstedet. Når alle SDR er genstartet, skal du skifte MDM-ejerskab: #3.x scli --switch_mdm_ownership --new_master_mdm_name <name> #4.x scli --switch_mdm_ownership --new_primary_mdm_name <name> *Hvis det ønskes, kan ejerskabet overføres tilbage til den oprindelige MDM-server. Indtil årsagen kan bestemmes, anbefales det også, at alle RCG'er på kildesystemet afsluttes. Hvis IO-fejlene fortsætter efter anvendelse af ovenstående trin, skal du kontakte PowerFlex Engineering. |
Additional Information
Påvirkede versioner
PowerFlex 3.x
PowerFlex 4.x
Fast i version
PFMP 4.5.3