PowerFlex: Chyby vstupně-výstupních operací klienta při použití replikace

Zusammenfassung: U klientů/serverů dochází u zařízení podporovaných systémem PowerFlex k chybám IO. Celkový back-end (MDM/SDS) se zdá být v pořádku. Používá se replikace PowerFlex a u 1 nebo více skupin RCG dochází k chybám RPO. ...

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

  • Žádná snížená nebo vadná kapacita
  • Žádné oddělené SDS ani zařízení SDS nehlásí chyby.
  • Žádné odpojené uzly MDM

Používá se funkce replikace.
Jedna nebo více výstrah v uživatelském rozhraní, které hlásí následující chyby:

Major - The RCG consistent image is too large to be consumed by the destination in one piece.

Minor - Remote Consistency Group RPO Exceeded
Protokoly událostí MDM mohou hlásit následující:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR     WARNING  Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level
2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR     ERROR    Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level
2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level
2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level
...
2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE        INFO     Replication Consistency Group ID <rcg_id> entered slim mode
2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE          ERROR    SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
 

Důsledky 

Klienti nemají přístup ke svazkům, které jsou zachyceny pro účely replikace.


Ursache

Vzácná softwarová závada může nastat tehdy, když se komponenta MDM a SDR neshodnou na interních čítačích souvisejících s kapacitou žurnálu. Tato nesrovnalost může způsobit, že uzel MDM nealokuje dodatečnou kapacitu žurnálu, když je kapacita SDR plná, což může vést k chybám IO na klientech/serverech využívajících zařízení zálohovaná systémem PowerFlex.

Lösung

Problém je třeba postupně restartovat všechny součásti SDR a přepnout vlastnictví uzlu MDM ve zdrojovém systému.

Restartování komponent SDR:

1) Identifikujte všechna SDR:

scli --query_all_sdr

2) Vstupte do režimu údržby na SDR:

scli --enter_sdr_maintenance_mode --sdr_name <name>

3) Ověřte, zda je SDR plně v režimu údržby, pomocí příkazu v kroku 1.

4) Restartujte komponentu SDR.

pkill sdr

5) Opakujte tento postup pro všechny SDR na zdrojovém webu.
 

Po restartování všech SDR přepněte vlastnictví MDM:

#3.x
scli --switch_mdm_ownership --new_master_mdm_name <name>
 
#4.x
scli --switch_mdm_ownership --new_primary_mdm_name <name>

*V případě potřeby lze vlastnictví převést zpět na původní MDM server.

Ověřte, zda již nejsou hlášeny chyby IO na klientech/serverech. Pokud klient přešel do systému souborů pouze pro čtení, může klient/server vyžadovat restartování.

Dokud nebude možné určit příčinu, bude také doporučeno ukončit všechny RCG ve zdrojovém systému.

Pokud chyby IO přetrvávají i po provedení výše uvedených kroků, obraťte se na technický tým PowerFlex.

Weitere Informationen

Dotčené verze

PowerFlex 3.x

PowerFlex 4.x

Opraveno ve verzi

PFMP 4.5.3

Betroffene Produkte

PowerFlex Software
Artikeleigenschaften
Artikelnummer: 000227849
Artikeltyp: Solution
Zuletzt geändert: 19 Jan. 2026
Version:  7
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.