PowerFlex: Błędy we/wy klienta podczas korzystania z replikacji
Summary: Klienci/serwery doświadczają błędów we/wy na urządzeniach wspieranych przez PowerFlex. Ogólny backend (MDM/SDS) wydaje się być w dobrej kondycji. Używana jest replikacja PowerFlex i występują błędy RPO dla co najmniej 1 z grup RCG. ...
Symptoms
- Brak zdegradowanej lub uszkodzonej pojemności
- Brak odłączonych kart SDS lub urządzeń SDS zgłaszających błędy.
- Brak odłączonych modułów MDM
Funkcja replikacji jest używana.
Co najmniej jeden alert w interfejsie użytkownika zgłaszający następujące błędy:
Major - The RCG consistent image is too large to be consumed by the destination in one piece. Minor - Remote Consistency Group RPO ExceededDzienniki zdarzeń MDM mogą zgłaszać następujące informacje:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR WARNING Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level 2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR ERROR Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level 2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level 2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level ... 2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE INFO Replication Consistency Group ID <rcg_id> entered slim mode 2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE ERROR SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
Wpływ
Klienci nie mogą uzyskać dostępu do woluminów przechwyconych w celu replikacji.
Cause
Resolution
|
Wymagane jest stopniowe ponowne uruchomienie wszystkich komponentów SDR, a w celu rozwiązania problemu należy przełączyć własność MDM w systemie źródłowym. Uruchom ponownie komponenty SDR: 1) Zidentyfikuj wszystkie moduły SDR: scli --query_all_sdr 2) Przejdź do trybu konserwacji modułu SDR: scli --enter_sdr_maintenance_mode --sdr_name <name> 3) Sprawdź, czy moduł SDR jest w pełni uruchomiony w trybie konserwacji, uruchamiając polecenie w kroku 1. 4) Uruchom ponownie moduł SDR. pkill sdr 5) Powtórz tę czynność dla wszystkich modułów SDR w lokalizacji źródłowej. Po ponownym uruchomieniu wszystkich modułów SDR przełącz własność MDM: #3.x scli --switch_mdm_ownership --new_master_mdm_name <name> #4.x scli --switch_mdm_ownership --new_primary_mdm_name <name> * W razie potrzeby własność można przenieść z powrotem na oryginalny serwer MDM. Do czasu ustalenia przyczyny zaleca się również zakończenie wszystkich grup RCG w systemie źródłowym. Jeśli po wykonaniu powyższych czynności błędy we/wy nadal występują, skontaktuj się z działem inżynierii PowerFlex. |
Additional Information
Wersje, których dotyczy problem
PowerFlex 3.x
PowerFlex 4.x
Naprawiono w wersji
PFMP 4.5.3