PowerFlex: Klient-IO-fejl, når replikering bruges

Oversigt: Klient/servere oplever IO-fejl i forhold til PowerFlex-understøttede enheder. Den samlede backend (MDM / SDS'er) ser ud til at være sund. PowerFlex-replikering bruges, og der er nogle RPO-fejl mod 1 eller flere af RCG'erne. ...

Denne artikel gælder for Denne artikel gælder ikke for Denne artikel er ikke knyttet til et bestemt produkt. Det er ikke alle produktversioner, der er identificeret i denne artikel.

Symptomer

  • Ingen forringet eller fejlbehæftet kapacitet
  • Ingen frakoblede SDS'er eller SDS-enheder rapporterer fejl.
  • Ingen afbrudte MDM'er

Replikeringsfunktionen anvendes.
En eller flere advarsler i brugergrænsefladen, der rapporterer følgende fejl:

Major - The RCG consistent image is too large to be consumed by the destination in one piece.

Minor - Remote Consistency Group RPO Exceeded
MDM-hændelseslogfiler rapporterer muligvis følgende:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR     WARNING  Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level
2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR     ERROR    Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level
2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level
2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level
...
2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE        INFO     Replication Consistency Group ID <rcg_id> entered slim mode
2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE          ERROR    SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
 

Påvirkning 

Klienter kan ikke få adgang til diskenheder, der opfanges til replikering.


Årsag

Der kan opstå en sjælden softwarefejl, hvis MDM og SDR-komponenten er uenige om de interne tællere, der er relateret til journalkapacitet. Denne uoverensstemmelse kan medføre, at MDM ikke-allokerer ekstra journalkapacitet, når SDR'ens kapacitet er fuld, hvilket potentielt kan føre til IO-fejl på klient/servere, der bruger enheder, der understøttes af PowerFlex.

Løsning

Der kræves en rullende genstart af alle SDR-komponenter, og MDM-ejerskabet på kildesystemet skal skiftes for at løse problemet.

Genstart SDR-komponenter:

1) Identificer alle SDR'er:

scli --query_all_sdr

2) Gå til vedligeholdelsestilstand på SDR:

scli --enter_sdr_maintenance_mode --sdr_name <name>

3) Bekræft, at SDR er helt i vedligeholdelsestilstand ved at køre kommandoen i trin 1.

4) Genstart SDR-komponenten.

pkill sdr

5) Gentag dette for alle SDR er på kildewebstedet.
 

Når alle SDR er genstartet, skal du skifte MDM-ejerskab:

#3.x
scli --switch_mdm_ownership --new_master_mdm_name <name>
 
#4.x
scli --switch_mdm_ownership --new_primary_mdm_name <name>

*Hvis det ønskes, kan ejerskabet overføres tilbage til den oprindelige MDM-server.

Bekræft, at IO-fejlene på klienten/serverne ikke længere rapporteres. Hvis klienten har indtastet et skrivebeskyttet filsystem, kan klienten/serveren kræve genstart.

Indtil årsagen kan bestemmes, anbefales det også, at alle RCG'er på kildesystemet afsluttes.

Hvis IO-fejlene fortsætter efter anvendelse af ovenstående trin, skal du kontakte PowerFlex Engineering.

Flere oplysninger

Påvirkede versioner

PowerFlex 3.x

PowerFlex 4.x

Fast i version

PFMP 4.5.3

Berørte produkter

PowerFlex Software
Artikelegenskaber
Artikelnummer: 000227849
Artikeltype: Solution
Senest ændret: 19 jan. 2026
Version:  7
Find svar på dine spørgsmål fra andre Dell-brugere
Supportservices
Kontrollér, om din enhed er dækket af supportservices.