PowerStore: Uventet nodegenstart pga. FC-portklap
Summary: Der kan opstå et hukommelsessvigt i FC-driveren til PowerStore-noden, mens en RSCN (Registered State Change Notification) behandles. Derfor frigøres den hukommelse, der kræves for at returnere en liste over port- og nodenavne, der er zoneinddelt til systemet, muligvis ikke som forventet. ...
Symptoms
Symptomerne kan omfatte:
- Nodepanik pga. uventet genstart
- Kernel Panic (Out of Memory) OOM pga. FC-port, der flagrer
- Påvirket værts-HBA kan ikke få stabil forbindelse
- Værtssidens tab af adgang til data
Cause
Når en enhedsstatus ændres (login/logout) i en SAN-struktur, sender switchen RSCN-meddelelser til alle tilsluttede enheder.
PowerStore FC-driveren sender kommandoer til switchen for at forespørge på de WWN er, der er i PowerStores zone.
Hukommelsen er allokeret til en sådan forespørgsel, men frigøres muligvis ikke korrekt.
Resolution
Problemet er løst i PowerStoreOS version 3.5.x.x
Noden gendannes automatisk efter den uventede genstart.
Additional Information
Det defekte WWN skal identificeres og repareres eller frakobles.
Gennemse switch- og værtslogfilerne for at fastslå årsagen til problemerne.
Mulige årsager til portklapping omfatter: løst eller snavset FC-kabel, defekt switchport, defekt SFP, værts-HBA eller værts-HBA-driver/firmware.
Værtens HBA-driver-/firmwarekompatibilitet bør kontrolleres.
Eksempler på port-flapping, portstatus ændret fra Online til Offline:
Eksempel på Brocade-switch, hvor port2 flagrer:
fabriclog --show : Time Stamp Input and *Action S, P Sn,Pn Port Xid =================================================================================== Switch 0; Sat Mar 19 10:02:31 2022 GMT (GMT+0:00) 10:02:31.817858 SCN Port Offline;rsn=0x4,g=0x4fd58 D2,P0 D2,P0 2 NA 10:02:31.817865 *Removing all nodes from port D2,P0 D2,P0 2 NA 10:02:31.831807 SCN LR_PORT(0);g=0x4fd58 D2,P0 D2,P0 2 NA 10:02:31.840928 SCN Port Online; g=0x4fd58,isolated=0 D2,P0 D2,P1 2 NA 10:02:31.841017 Port Elp engaged D2,P1 D2,P0 2 NA 10:02:31.841034 *Removing all nodes from port D2,P0 D2,P0 2 NA 10:02:31.841093 SCN Port F_PORT D2,P1 D2,P0 2 NA
Eksempel på Cisco-switch port fc1/22 blafrer:
`show port-config internal all` *************** Port Config Port Control Log *************** ---- ------ ----------- ------- Time PortNo Port Action ErrCode ---- ------ ----------- ------- Mar 19 12:27:53 2023 00986053 fc1/22 Enable None Mar 19 12:27:53 2023 00984797 fc1/22 Participating Mode None Mar 19 12:13:43 2023 00558421 fc1/22 Enable None Mar 19 12:13:43 2023 00557170 fc1/22 Participating Mode None Mar 19 12:02:21 2023 00738769 fc1/22 Enable None Mar 19 12:02:21 2023 00737461 fc1/22 Participating Mode None Mar 19 11:40:58 2023 00976928 fc1/22 Enable None Mar 19 11:40:58 2023 00975543 fc1/22 Participating Mode None Mar 19 11:39:01 2023 00195273 fc1/22 Enable None Mar 19 11:39:01 2023 00193893 fc1/22 Participating Mode None Mar 19 11:37:13 2023 00341497 fc1/22 Enable None Mar 19 11:37:13 2023 00340169 fc1/22 Participating Mode None