PowerFlex: Klient-IO-fel när replikering används

Summary: Klient/servrar har IO-fel mot enheter med PowerFlex-stöd. Den övergripande serverdelen (MDM/SDS) verkar vara felfri. PowerFlex-replikering används och det finns några RPO-fel mot en eller flera av RCG:erna. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • Ingen försämrad eller trasig kapacitet
  • Inga SDS:er frikopplade eller SDS-enheter rapporterar fel.
  • Inga frånkopplade MDM-enheter

Replikeringsfunktionen används.
En eller flera aviseringar i användargränssnittet som rapporterar följande fel:

Major - The RCG consistent image is too large to be consumed by the destination in one piece.

Minor - Remote Consistency Group RPO Exceeded
MDM-händelseloggar kan rapportera följande:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR     WARNING  Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level
2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR     ERROR    Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level
2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level
2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level
...
2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE        INFO     Replication Consistency Group ID <rcg_id> entered slim mode
2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE          ERROR    SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
 

Påverkan 

Klienter kan inte komma åt volymer som fångas upp för replikering.


Cause

Ett sällsynt programvarufel kan uppstå där MDM-enheten och SDR-komponenten är oense om de interna räknarna som är relaterade till journalkapacitet. Den här avvikelsen kan leda till att MDM-enheten förlorar ytterligare journalkapacitet när SDR-kapaciteten är full, vilket kan leda till IO-fel på klienter/servrar som använder enheter som stöds av PowerFlex.

Resolution

En löpande omstart av alla SDR-komponenter krävs och MDM-ägarskapet på källsystemet måste bytas för att problemet ska kunna lösas.

Starta om SDR-komponenter:

1) Identifiera alla särskilda dragningsrätter:

scli --query_all_sdr

2) Gå in i underhållsläge på SDR:

scli --enter_sdr_maintenance_mode --sdr_name <name>

3) Kontrollera att SDR är helt i underhållsläge genom att köra kommandot i steg 1.

4) Starta om SDR-komponenten.

pkill sdr

5) Upprepa detta för alla SDR:er på källwebbplatsen.
 

När alla SDR-noder har startats om byter du MDM-ägarskap:

#3.x
scli --switch_mdm_ownership --new_master_mdm_name <name>
 
#4.x
scli --switch_mdm_ownership --new_primary_mdm_name <name>

*Om så önskas kan ägarskapet överföras tillbaka till den ursprungliga MDM-servern.

Kontrollera att I/O-felen på klienten/servrarna inte längre rapporteras. Om klienten har angett ett skrivskyddat filsystem kan klienten/servern kräva en omstart.

Fram till dess att orsaken kan fastställas kommer det också att rekommenderas att alla RCG:er på källsystemet avslutas.

Om IO-felen kvarstår efter att stegen ovan har tillämpats kopplar du in PowerFlex Engineering.

Additional Information

Versioner som påverkas

PowerFlex 3.x

PowerFlex 4.x

Åtgärdat i version

PFMP 4.5.3

Affected Products

PowerFlex Software
Article Properties
Article Number: 000227849
Article Type: Solution
Last Modified: 17 Nov 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.