PowerFlex: Chyby vstupně-výstupních operací klienta při použití replikace

Shrnutí: U klientů/serverů dochází u zařízení podporovaných systémem PowerFlex k chybám IO. Celkový back-end (MDM/SDS) se zdá být v pořádku. Používá se replikace PowerFlex a u 1 nebo více skupin RCG dochází k chybám RPO. ...

Tento článek se vztahuje na Tento článek se nevztahuje na Tento článek není vázán na žádný konkrétní produkt. V tomto článku nejsou uvedeny všechny verze produktu.

Příznaky

  • Žádná snížená nebo vadná kapacita
  • Žádné oddělené SDS ani zařízení SDS nehlásí chyby.
  • Žádné odpojené uzly MDM

Používá se funkce replikace.
Jedna nebo více výstrah v uživatelském rozhraní, které hlásí následující chyby:

Major - The RCG consistent image is too large to be consumed by the destination in one piece.

Minor - Remote Consistency Group RPO Exceeded
Protokoly událostí MDM mohou hlásit následující:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR     WARNING  Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level
2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR     ERROR    Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level
2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level
2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level
...
2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE        INFO     Replication Consistency Group ID <rcg_id> entered slim mode
2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE          ERROR    SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
 

Důsledky 

Klienti nemají přístup ke svazkům, které jsou zachyceny pro účely replikace.


Příčina

Vzácná softwarová závada může nastat tehdy, když se komponenta MDM a SDR neshodnou na interních čítačích souvisejících s kapacitou žurnálu. Tato nesrovnalost může způsobit, že uzel MDM nealokuje dodatečnou kapacitu žurnálu, když je kapacita SDR plná, což může vést k chybám IO na klientech/serverech využívajících zařízení zálohovaná systémem PowerFlex.

Řešení

Problém je třeba postupně restartovat všechny součásti SDR a přepnout vlastnictví uzlu MDM ve zdrojovém systému.

Restartování komponent SDR:

1) Identifikujte všechna SDR:

scli --query_all_sdr

2) Vstupte do režimu údržby na SDR:

scli --enter_sdr_maintenance_mode --sdr_name <name>

3) Ověřte, zda je SDR plně v režimu údržby, pomocí příkazu v kroku 1.

4) Restartujte komponentu SDR.

pkill sdr

5) Opakujte tento postup pro všechny SDR na zdrojovém webu.
 

Po restartování všech SDR přepněte vlastnictví MDM:

#3.x
scli --switch_mdm_ownership --new_master_mdm_name <name>
 
#4.x
scli --switch_mdm_ownership --new_primary_mdm_name <name>

*V případě potřeby lze vlastnictví převést zpět na původní MDM server.

Ověřte, zda již nejsou hlášeny chyby IO na klientech/serverech. Pokud klient přešel do systému souborů pouze pro čtení, může klient/server vyžadovat restartování.

Dokud nebude možné určit příčinu, bude také doporučeno ukončit všechny RCG ve zdrojovém systému.

Pokud chyby IO přetrvávají i po provedení výše uvedených kroků, obraťte se na technický tým PowerFlex.

Další informace

Dotčené verze

PowerFlex 3.x

PowerFlex 4.x

Opraveno ve verzi

PFMP 4.5.3

Dotčené produkty

PowerFlex Software
Vlastnosti článku
Číslo článku: 000227849
Typ článku: Solution
Poslední úprava: 19 Jan 2026
Verze:  7
Najděte odpovědi na své otázky od ostatních uživatelů společnosti Dell
Služby podpory
Zkontrolujte, zda se na vaše zařízení vztahují služby podpory.