PowerStore: Onverwacht opnieuw opstarten van knooppunt door FC-poortklep
Summary: Er kan een geheugenlek in de FC-driver van het PowerStore-knooppunt optreden terwijl een Registered State Change Notification (RSCN) wordt verwerkt. Als gevolg hiervan wordt het geheugen dat nodig is om een lijst met poort- en knooppuntnamen te retourneren die zijn gezoneerd naar het systeem, mogelijk niet vrijgemaakt zoals verwacht. ...
Symptoms
Symptomen kunnen zijn:
- Knooppuntpanic als gevolg van onverwacht opnieuw opstarten
- Kernel Panic (Out of Memory) OOM als gevolg van FC-poort flappert
- Getroffen host-HBA kan geen stabiele connectiviteit krijgen
- Verlies van toegang tot data aan de hostzijde
Cause
Wanneer de status van een apparaat verandert (aanmelden/afmelden) in een SAN-fabric, stuurt de switch RSCN-meldingen naar alle aangesloten apparaten.
De PowerStore FC-driver stuurt opdrachten naar de switch om query's uit te voeren op de WWN's die zich in de PowerStore-zone bevinden.
Geheugen wordt toegewezen voor een dergelijke query, maar wordt mogelijk niet op de juiste manier vrijgemaakt.
Resolution
Het probleem opgelost in PowerStoreOS versie 3.5.x.x
Het knooppunt wordt automatisch hersteld na de onverwachte herstart.
Additional Information
De defecte WWN moet worden geïdentificeerd en gerepareerd of losgekoppeld.
Controleer de switch- en hostlogboeken om de oorzaak van de problemen vast te stellen.
Mogelijke redenen voor het omklappen van de poort zijn: losse of vuile FC-kabel, defecte switchpoort, defecte SFP, host HBA of host HBA driver/firmware.
De compatibiliteit van de HBA-driver/firmware van de host moet worden gecontroleerd.
Voorbeelden van poortflappen, poortstatus gewijzigd van Online naar Offline:
Brocade switch Voorbeeld van poort2 flappen:
fabriclog --show : Time Stamp Input and *Action S, P Sn,Pn Port Xid =================================================================================== Switch 0; Sat Mar 19 10:02:31 2022 GMT (GMT+0:00) 10:02:31.817858 SCN Port Offline;rsn=0x4,g=0x4fd58 D2,P0 D2,P0 2 NA 10:02:31.817865 *Removing all nodes from port D2,P0 D2,P0 2 NA 10:02:31.831807 SCN LR_PORT(0);g=0x4fd58 D2,P0 D2,P0 2 NA 10:02:31.840928 SCN Port Online; g=0x4fd58,isolated=0 D2,P0 D2,P1 2 NA 10:02:31.841017 Port Elp engaged D2,P1 D2,P0 2 NA 10:02:31.841034 *Removing all nodes from port D2,P0 D2,P0 2 NA 10:02:31.841093 SCN Port F_PORT D2,P1 D2,P0 2 NA
Cisco-switch voorbeeld poort fc1/22 flapping:
`show port-config internal all` *************** Port Config Port Control Log *************** ---- ------ ----------- ------- Time PortNo Port Action ErrCode ---- ------ ----------- ------- Mar 19 12:27:53 2023 00986053 fc1/22 Enable None Mar 19 12:27:53 2023 00984797 fc1/22 Participating Mode None Mar 19 12:13:43 2023 00558421 fc1/22 Enable None Mar 19 12:13:43 2023 00557170 fc1/22 Participating Mode None Mar 19 12:02:21 2023 00738769 fc1/22 Enable None Mar 19 12:02:21 2023 00737461 fc1/22 Participating Mode None Mar 19 11:40:58 2023 00976928 fc1/22 Enable None Mar 19 11:40:58 2023 00975543 fc1/22 Participating Mode None Mar 19 11:39:01 2023 00195273 fc1/22 Enable None Mar 19 11:39:01 2023 00193893 fc1/22 Participating Mode None Mar 19 11:37:13 2023 00341497 fc1/22 Enable None Mar 19 11:37:13 2023 00340169 fc1/22 Participating Mode None