PowerFlex: Klient-IO-fejl, når replikering bruges

Summary: Klient/servere oplever IO-fejl i forhold til PowerFlex-understøttede enheder. Den samlede backend (MDM / SDS'er) ser ud til at være sund. PowerFlex-replikering bruges, og der er nogle RPO-fejl mod 1 eller flere af RCG'erne. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • Ingen forringet eller fejlbehæftet kapacitet
  • Ingen frakoblede SDS'er eller SDS-enheder rapporterer fejl.
  • Ingen afbrudte MDM'er

Replikeringsfunktionen anvendes.
En eller flere advarsler i brugergrænsefladen, der rapporterer følgende fejl:

Major - The RCG consistent image is too large to be consumed by the destination in one piece.

Minor - Remote Consistency Group RPO Exceeded
MDM-hændelseslogfiler rapporterer muligvis følgende:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR     WARNING  Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level
2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR     ERROR    Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level
2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level
2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level
...
2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE        INFO     Replication Consistency Group ID <rcg_id> entered slim mode
2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE          ERROR    SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
 

Påvirkning 

Klienter kan ikke få adgang til diskenheder, der opfanges til replikering.


Cause

Der kan opstå en sjælden softwarefejl, hvis MDM og SDR-komponenten er uenige om de interne tællere, der er relateret til journalkapacitet. Denne uoverensstemmelse kan medføre, at MDM ikke-allokerer ekstra journalkapacitet, når SDR'ens kapacitet er fuld, hvilket potentielt kan føre til IO-fejl på klient/servere, der bruger enheder, der understøttes af PowerFlex.

Resolution

Der kræves en rullende genstart af alle SDR-komponenter, og MDM-ejerskabet på kildesystemet skal skiftes for at løse problemet.

Genstart SDR-komponenter:

1) Identificer alle SDR'er:

scli --query_all_sdr

2) Gå til vedligeholdelsestilstand på SDR:

scli --enter_sdr_maintenance_mode --sdr_name <name>

3) Bekræft, at SDR er helt i vedligeholdelsestilstand ved at køre kommandoen i trin 1.

4) Genstart SDR-komponenten.

pkill sdr

5) Gentag dette for alle SDR er på kildewebstedet.
 

Når alle SDR er genstartet, skal du skifte MDM-ejerskab:

#3.x
scli --switch_mdm_ownership --new_master_mdm_name <name>
 
#4.x
scli --switch_mdm_ownership --new_primary_mdm_name <name>

*Hvis det ønskes, kan ejerskabet overføres tilbage til den oprindelige MDM-server.

Bekræft, at IO-fejlene på klienten/serverne ikke længere rapporteres. Hvis klienten har indtastet et skrivebeskyttet filsystem, kan klienten/serveren kræve genstart.

Indtil årsagen kan bestemmes, anbefales det også, at alle RCG'er på kildesystemet afsluttes.

Hvis IO-fejlene fortsætter efter anvendelse af ovenstående trin, skal du kontakte PowerFlex Engineering.

Additional Information

Påvirkede versioner

PowerFlex 3.x

PowerFlex 4.x

Fast i version

PFMP 4.5.3

Affected Products

PowerFlex Software
Article Properties
Article Number: 000227849
Article Type: Solution
Last Modified: 17 Nov 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.