PowerFlex: Klient-I/O-feil når replikering brukes

Summary: Klient/servere opplever I/O-feil mot PowerFlex-støttede enheter. Den generelle backend (MDM / SDSes) ser ut til å være sunn. PowerFlex-replikering brukes, og det er noen RPO-feil mot 1 eller flere av RCG-ene. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • Ingen redusert eller feilet kapasitet
  • Ingen SDS-er frakoblede eller SDS-enheter rapporterer feil.
  • Ingen frakoblede MDM-er

Replikeringsfunksjonen brukes.
Ett eller flere varsler i brukergrensesnittet som rapporterer følgende feil:

Major - The RCG consistent image is too large to be consumed by the destination in one piece.

Minor - Remote Consistency Group RPO Exceeded
MDM-hendelseslogger kan rapportere følgende:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR     WARNING  Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level
2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR     ERROR    Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level
2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level
2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level
...
2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE        INFO     Replication Consistency Group ID <rcg_id> entered slim mode
2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE          ERROR    SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
 

Innvirkning 

Klienter får ikke tilgang til volumer som er avlyttet for replikering.


Cause

En sjelden programvarefeil kan oppstå der MDM- og SDR-komponenten er uenige om de interne tellerne knyttet til journalkapasitet. Dette avviket kan føre til at MDM-en ikke tildeles ekstra journalkapasitet når kapasiteten til SDR-en er full, noe som kan føre til I/O-feil på klient/servere som bruker enheter støttet av PowerFlex.

Resolution

Det kreves en rullerende omstart av alle SDR-komponenter, og MDM-eierskapet for kildesystemet må byttes for å løse problemet.

Start SDR-komponenter på nytt:

1) Identifiser alle SDR-ene:

scli --query_all_sdr

2) Gå inn i vedlikeholdsmodus på SDR:

scli --enter_sdr_maintenance_mode --sdr_name <name>

3) Bekreft at SDR er fullstendig i vedlikeholdsmodus ved å kjøre kommandoen i trinn 1.

4) Start SDR-komponenten på nytt.

pkill sdr

5) Gjenta dette for alle SDR på kilden nettstedet.
 

Når alle SDR er startet på nytt, bytter du MDM-eierskap:

#3.x
scli --switch_mdm_ownership --new_master_mdm_name <name>
 
#4.x
scli --switch_mdm_ownership --new_primary_mdm_name <name>

*Hvis det er ønskelig, kan eierskapet overføres tilbake til den opprinnelige MDM-serveren.

Kontrollere at I/O-feil på klienten/serverne ikke lenger rapporteres. Hvis klienten har angitt et skrivebeskyttet filsystem, kan klienten/serveren kreve en omstart.

Inntil årsaken kan fastslås, vil det også bli anbefalt at alle RCGer på kildesystemet avsluttes.

Hvis I/O-feilene vedvarer etter at trinnene ovenfor er utført, må du engasjere PowerFlex Engineering.

Additional Information

Berørte versjoner

PowerFlex 3.x

PowerFlex 4.x

Løst i versjon

PFMP 4.5.3

Affected Products

PowerFlex Software
Article Properties
Article Number: 000227849
Article Type: Solution
Last Modified: 17 Nov 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.