PowerStore: Nieoczekiwane ponowne uruchomienie węzła z powodu klapy portu FC
Summary: Podczas przetwarzania powiadomienia o zarejestrowanej zmianie stanu (RSCN) może wystąpić wyciek pamięci w sterowniku FC węzła PowerStore. W rezultacie pamięć wymagana do zwrócenia listy nazw portów i węzłów podzielonych na strefy w systemie może nie zostać zwolniona zgodnie z oczekiwaniami. ...
Symptoms
Objawy mogą obejmować:
- Błąd węzła spowodowany nieoczekiwanym ponownym uruchomieniem
- Kernel Panic (brak pamięci) OOM z powodu niestabilnego działania portu FC
- Karta HBA hosta, której dotyczy problem, nie może uzyskać stabilnej łączności
- Utrata dostępu do danych po stronie hosta
Cause
Gdy zmieni się stan urządzenia (logowanie/wylogowanie) w sieci szkieletowej SAN, przełącznik wysyła powiadomienia RSCN do wszystkich podłączonych urządzeń.
Sterownik PowerStore FC wysyła polecenia do przełącznika w celu wysłania zapytania do nazw WWN znajdujących się w strefie PowerStore.
Pamięć jest przydzielona dla takiego zapytania, ale może nie zostać prawidłowo zwolniona.
Resolution
Problem rozwiązany w systemie PowerStoreOS w wersji 3.5.x.x
Węzeł zostanie automatycznie odzyskany po nieoczekiwanym ponownym uruchomieniu.
Additional Information
Wadliwa nazwa WWN powinna zostać zidentyfikowana i naprawiona lub odłączona.
Przejrzyj dzienniki przełącznika i hosta, aby określić przyczynę problemów.
Możliwe przyczyny nieprawidłowego działania portów to: luźny lub brudny FC, wadliwy port przełącznika, wadliwy sterownik/oprogramowanie wewnętrzne karty HBA hosta, SFP, HBA hosta lub HBA hosta.
Należy sprawdzić zgodność sterownika/oprogramowania wewnętrznego HBA hosta.
Przykłady zmiany stanu portu z Online na Offline:
Przykład zmiany stanu przełącznika Brocade w porcie 2:
fabriclog --show : Time Stamp Input and *Action S, P Sn,Pn Port Xid =================================================================================== Switch 0; Sat Mar 19 10:02:31 2022 GMT (GMT+0:00) 10:02:31.817858 SCN Port Offline;rsn=0x4,g=0x4fd58 D2,P0 D2,P0 2 NA 10:02:31.817865 *Removing all nodes from port D2,P0 D2,P0 2 NA 10:02:31.831807 SCN LR_PORT(0);g=0x4fd58 D2,P0 D2,P0 2 NA 10:02:31.840928 SCN Port Online; g=0x4fd58,isolated=0 D2,P0 D2,P1 2 NA 10:02:31.841017 Port Elp engaged D2,P1 D2,P0 2 NA 10:02:31.841034 *Removing all nodes from port D2,P0 D2,P0 2 NA 10:02:31.841093 SCN Port F_PORT D2,P1 D2,P0 2 NA
przykładowego portu przełącznika Cisco fc1/22:
`show port-config internal all` *************** Port Config Port Control Log *************** ---- ------ ----------- ------- Time PortNo Port Action ErrCode ---- ------ ----------- ------- Mar 19 12:27:53 2023 00986053 fc1/22 Enable None Mar 19 12:27:53 2023 00984797 fc1/22 Participating Mode None Mar 19 12:13:43 2023 00558421 fc1/22 Enable None Mar 19 12:13:43 2023 00557170 fc1/22 Participating Mode None Mar 19 12:02:21 2023 00738769 fc1/22 Enable None Mar 19 12:02:21 2023 00737461 fc1/22 Participating Mode None Mar 19 11:40:58 2023 00976928 fc1/22 Enable None Mar 19 11:40:58 2023 00975543 fc1/22 Participating Mode None Mar 19 11:39:01 2023 00195273 fc1/22 Enable None Mar 19 11:39:01 2023 00193893 fc1/22 Participating Mode None Mar 19 11:37:13 2023 00341497 fc1/22 Enable None Mar 19 11:37:13 2023 00340169 fc1/22 Participating Mode None