PowerStore: Oväntad nodomstart på grund av FC-portklaff
Summary: En minnesläcka i PowerStore-nodens FC-drivrutin kan uppstå när ett RSCN (Registered State Change Notification) bearbetas. Det innebär att det minne som krävs för att returnera en lista med port- och nodnamn som är zonindelade till systemet kanske inte frigörs som förväntat. ...
Symptoms
Symtomen kan vara:
- Nodpanik på grund av oväntad omstart
- Kernel Panic (slut på minne) OOM på grund av FC-portväxling
- Berörd värd-HBA kan inte få stabil anslutning
- Förlust av åtkomst till data på värdsidan
Cause
När en enhetsstatus ändras (inloggning/utloggning) i en SAN-struktur skickar switchen ut RSCN-meddelanden till alla anslutna enheter.
PowerStore FC-drivrutinen skickar kommandon till switchen för att fråga de WWN:er som finns i PowerStore-zonen.
Minne allokeras för en sådan fråga men kanske inte frigörs korrekt.
Resolution
Problemet åtgärdat i PowerStoreOS version 3.5.x.x
Noden återställs automatiskt efter den oväntade omstarten.
Additional Information
Det felaktiga WWN ska identifieras och åtgärdas eller kopplas bort.
Granska switch- och värdloggarna för att fastställa orsaken till problemen.
Möjliga orsaker till portklaffar är: lös eller smutsig FC-kabel, felaktig switchport, felaktig SFP, värd-HBA eller värd-HBA-drivrutin/fast programvara.
Kompatibiliteten med värd-HBA-drivrutiner/fast programvara bör kontrolleras.
Exempel på portväxling, portstatus ändrad från Online till Offline:
Brocade-switchexempel på port2-växling:
fabriclog --show : Time Stamp Input and *Action S, P Sn,Pn Port Xid =================================================================================== Switch 0; Sat Mar 19 10:02:31 2022 GMT (GMT+0:00) 10:02:31.817858 SCN Port Offline;rsn=0x4,g=0x4fd58 D2,P0 D2,P0 2 NA 10:02:31.817865 *Removing all nodes from port D2,P0 D2,P0 2 NA 10:02:31.831807 SCN LR_PORT(0);g=0x4fd58 D2,P0 D2,P0 2 NA 10:02:31.840928 SCN Port Online; g=0x4fd58,isolated=0 D2,P0 D2,P1 2 NA 10:02:31.841017 Port Elp engaged D2,P1 D2,P0 2 NA 10:02:31.841034 *Removing all nodes from port D2,P0 D2,P0 2 NA 10:02:31.841093 SCN Port F_PORT D2,P1 D2,P0 2 NA
Exempel på Cisco-switch port fc1/22-växling:
`show port-config internal all` *************** Port Config Port Control Log *************** ---- ------ ----------- ------- Time PortNo Port Action ErrCode ---- ------ ----------- ------- Mar 19 12:27:53 2023 00986053 fc1/22 Enable None Mar 19 12:27:53 2023 00984797 fc1/22 Participating Mode None Mar 19 12:13:43 2023 00558421 fc1/22 Enable None Mar 19 12:13:43 2023 00557170 fc1/22 Participating Mode None Mar 19 12:02:21 2023 00738769 fc1/22 Enable None Mar 19 12:02:21 2023 00737461 fc1/22 Participating Mode None Mar 19 11:40:58 2023 00976928 fc1/22 Enable None Mar 19 11:40:58 2023 00975543 fc1/22 Participating Mode None Mar 19 11:39:01 2023 00195273 fc1/22 Enable None Mar 19 11:39:01 2023 00193893 fc1/22 Participating Mode None Mar 19 11:37:13 2023 00341497 fc1/22 Enable None Mar 19 11:37:13 2023 00340169 fc1/22 Participating Mode None