PowerStore: Kontrola poprawności działania systemu może zgłaszać wiele błędów po ponownym uruchomieniu CP PowerStoreOS 3.2 lub 3.5

Summary: W tym artykule wyjaśniono, jak po ponownym uruchomieniu CP (w tym NDU) w systemie PowerStoreOS 3.2 lub 3.5 może wystąpić następujący problem. - Uruchomienie kontroli poprawności działania systemu może spowodować wiele nieudanych kontroli. - Sesje replikacji mogą być również w stanie wstrzymania systemu. - Nie ma możliwości dodania systemu zdalnego. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

- Kontrola systemu może zwrócić następujące nieudane kontrole:
Pre-Upgrade Check              node_a     Failed     PUHC health check returned 3 failed checks.
Checking SFP Alerts                       Failed
Checking Active Imports                   Failed 
Checking Storage Migrations               Failed  
REST Configuration Service     node_a     Failed     Unable to perform health check due to communication error.


- Sesje replikacji mogą być w stanie wstrzymania systemu.
Alert 0x01302d03 Data transfer is paused for file system replication session
Alert 0x01700403 A replication session associated with resource VolumeABC123 is in System_Paused state because of error.

- Próba dodania zdalnego systemu może zakończyć się niepowodzeniem natychmiast lub po 60 sekundach.

Cause

Ten problem był wynikiem problemu z oprogramowaniem od wersji 3.2.
Istnieje wiele certyfikatów, co odpowiada wielu adresom IP używanym przez klaster.
Podczas ponownego uruchomienia CP (może się zdarzyć podczas NDU, ponieważ ponownie uruchamiamy CP podczas NDU, może się również zdarzyć podczas ręcznego ponownego uruchomienia CP lub dowolnego innego ponownego uruchomienia CP podczas pracy w wersji, której dotyczy problem), występuje warunek wyścigu polegający na tym, że CP nie może załadować wszystkich poprawnych certyfikatów przez cały czas podczas każdego ponownego uruchomienia.
W rezultacie może to mieć wpływ na komunikację opartą na certyfikacie, w tym na przykład:

- Przerwane połączenie zarządzania replikacją i naruszone sesje replikacji.
- Kontrola poprawności działania systemu nie powiodła się.
- Nie można dodać systemu zdalnego w celu skonfigurowania replikacji.

Resolution

Obejście problemu:

- Obejście błędu PUHC:
uruchom ponownie ścieżkę sterowania (CP) ponownie i przeprowadź kontrolę poprawności działania systemu po pięciu minutach.
svc_container_mgmt restart CP
UWAGA: Jeśli ponowne uruchomienie CP nie rozwiąże problemu, odczekaj 15 minut i ponownie uruchom CP.
Ponowne uruchomienie CP (usług zarządzania) nie wpływa na dostęp hosta i powinno spowodować jedynie krótką utratę dostępu do interfejsu użytkownika (UI) PowerStore Manager.

 - Obejście problemu z wstrzymaniem replikacji:
1. Ponownie uruchomić CP ponownie na problematycznym urządzeniu.
2. Wznów replication_session w interfejsie użytkownika macierzy źródłowej. Sprawdź wynik.

- Obejście problemu "nie można dodać systemu zdalnego":

1. Uruchom ponownie CP na problematycznym urządzeniu.
2. Ponów próbę "add remote system" w interfejsie użytkownika macierzy źródłowej. Sprawdź wynik.

 

UWAGA: Jeśli ponowne uruchomienie CP nie rozwiąże problemu, odczekaj 15 minut i ponownie uruchom CP.
Ponowne uruchomienie CP (usług zarządzania) nie wpływa na dostęp hosta i powinno spowodować jedynie krótką utratę dostępu do interfejsu użytkownika (UI) PowerStore Manager.

 

Rozwiązanie:

Rozwiązanie tego problemu jest dostępne w systemie PowerStoreOS 3.6.

Affected Products

PowerStore, PowerStore 1000T, PowerStore 1200T, PowerStore 3000T, PowerStore 3200T, PowerStore 5000T, PowerStore 500T, PowerStore 5200T, PowerStore 7000T, PowerStore 9000T

Products

PowerStore 9200T
Article Properties
Article Number: 000216753
Article Type: Solution
Last Modified: 26 Feb 2024
Version:  8
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.