PowerFlex: Chyby vstupně-výstupních operací klienta při použití replikace

Summary: U klientů/serverů dochází u zařízení podporovaných systémem PowerFlex k chybám IO. Celkový back-end (MDM/SDS) se zdá být v pořádku. Používá se replikace PowerFlex a u 1 nebo více skupin RCG dochází k chybám RPO. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • Žádná snížená nebo vadná kapacita
  • Žádné oddělené SDS ani zařízení SDS nehlásí chyby.
  • Žádné odpojené uzly MDM

Používá se funkce replikace.
Jedna nebo více výstrah v uživatelském rozhraní, které hlásí následující chyby:

Major - The RCG consistent image is too large to be consumed by the destination in one piece.

Minor - Remote Consistency Group RPO Exceeded
Protokoly událostí MDM mohou hlásit následující:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR     WARNING  Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level
2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR     ERROR    Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level
2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level
2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level
...
2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE        INFO     Replication Consistency Group ID <rcg_id> entered slim mode
2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE          ERROR    SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
 

Důsledky 

Klienti nemají přístup ke svazkům, které jsou zachyceny pro účely replikace.


Cause

Vzácná softwarová závada může nastat tehdy, když se komponenta MDM a SDR neshodnou na interních čítačích souvisejících s kapacitou žurnálu. Tato nesrovnalost může způsobit, že uzel MDM nealokuje dodatečnou kapacitu žurnálu, když je kapacita SDR plná, což může vést k chybám IO na klientech/serverech využívajících zařízení zálohovaná systémem PowerFlex.

Resolution

Problém je třeba postupně restartovat všechny součásti SDR a přepnout vlastnictví uzlu MDM ve zdrojovém systému.

Restartování komponent SDR:

1) Identifikujte všechna SDR:

scli --query_all_sdr

2) Vstupte do režimu údržby na SDR:

scli --enter_sdr_maintenance_mode --sdr_name <name>

3) Ověřte, zda je SDR plně v režimu údržby, pomocí příkazu v kroku 1.

4) Restartujte komponentu SDR.

pkill sdr

5) Opakujte tento postup pro všechny SDR na zdrojovém webu.
 

Po restartování všech SDR přepněte vlastnictví MDM:

#3.x
scli --switch_mdm_ownership --new_master_mdm_name <name>
 
#4.x
scli --switch_mdm_ownership --new_primary_mdm_name <name>

*V případě potřeby lze vlastnictví převést zpět na původní MDM server.

Ověřte, zda již nejsou hlášeny chyby IO na klientech/serverech. Pokud klient přešel do systému souborů pouze pro čtení, může klient/server vyžadovat restartování.

Dokud nebude možné určit příčinu, bude také doporučeno ukončit všechny RCG ve zdrojovém systému.

Pokud chyby IO přetrvávají i po provedení výše uvedených kroků, obraťte se na technický tým PowerFlex.

Additional Information

Dotčené verze

PowerFlex 3.x

PowerFlex 4.x

Opraveno ve verzi

PFMP 4.5.3

Affected Products

PowerFlex Software
Article Properties
Article Number: 000227849
Article Type: Solution
Last Modified: 17 Nov 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.