PowerStore: Neočekávané restartování uzlu kvůli klopě portu FC
Summary: Při zpracování registrovaného oznámení o změně stavu (RSCN) může v ovladači FC uzlu PowerStore dojít k nevrácení paměti. V důsledku toho nemusí být paměť potřebná k vrácení seznamu názvů portů a uzlů, které jsou zónovány pro systém, uvolněna očekávaným způsobem. ...
Symptoms
Příznaky mohou zahrnovat:
- Panika uzlu kvůli neočekávanému restartování
- Panika jádra (nedostatek paměti) OOM kvůli třepotání portu FC
- Dotčený hostitelský adaptér HBA nemůže získat stabilní připojení
- Ztráta přístupu k datům na straně hostitele
Cause
Když se změní stav zařízení (přihlášení/odhlášení) v topologii sítě SAN, přepínač odešle upozornění RSCN všem připojeným zařízením.
Ovladač PowerStore FC odesílá přepínači příkazy k dotazování na názvy WWN, které jsou v zóně zařízení PowerStore.
Paměť je pro takový dotaz přidělena, ale nemusí být správně uvolněna.
Resolution
Problém opravený v systému PowerStoreOS verze 3.5.x.x
Uzel se automaticky obnoví po neočekávaném restartování.
Additional Information
Vadné WWN by mělo být identifikováno a opraveno nebo odpojeno.
Zkontrolujte protokoly přepínače a hostitele a zjistěte příčinu problémů.
Mezi možné příčiny nedostupnosti portu patří: uvolněný nebo znečištěný kabel FC, vadný port přepínače, vadný port SFP, hostitelský adaptér HBA nebo ovladač/firmware hostitelského adaptéru.
Je třeba zkontrolovat kompatibilitu ovladačů/firmwaru hostitelského adaptéru HBA.
Příklady přepínání portů, kdy se stav portu změnil z Online na Offline:
Příklad flappingu portu port2 u přepínače Brocade:
fabriclog --show : Time Stamp Input and *Action S, P Sn,Pn Port Xid =================================================================================== Switch 0; Sat Mar 19 10:02:31 2022 GMT (GMT+0:00) 10:02:31.817858 SCN Port Offline;rsn=0x4,g=0x4fd58 D2,P0 D2,P0 2 NA 10:02:31.817865 *Removing all nodes from port D2,P0 D2,P0 2 NA 10:02:31.831807 SCN LR_PORT(0);g=0x4fd58 D2,P0 D2,P0 2 NA 10:02:31.840928 SCN Port Online; g=0x4fd58,isolated=0 D2,P0 D2,P1 2 NA 10:02:31.841017 Port Elp engaged D2,P1 D2,P0 2 NA 10:02:31.841034 *Removing all nodes from port D2,P0 D2,P0 2 NA 10:02:31.841093 SCN Port F_PORT D2,P1 D2,P0 2 NA
Příklad flappingu portu fc1/22 přepínače Cisco:
`show port-config internal all` *************** Port Config Port Control Log *************** ---- ------ ----------- ------- Time PortNo Port Action ErrCode ---- ------ ----------- ------- Mar 19 12:27:53 2023 00986053 fc1/22 Enable None Mar 19 12:27:53 2023 00984797 fc1/22 Participating Mode None Mar 19 12:13:43 2023 00558421 fc1/22 Enable None Mar 19 12:13:43 2023 00557170 fc1/22 Participating Mode None Mar 19 12:02:21 2023 00738769 fc1/22 Enable None Mar 19 12:02:21 2023 00737461 fc1/22 Participating Mode None Mar 19 11:40:58 2023 00976928 fc1/22 Enable None Mar 19 11:40:58 2023 00975543 fc1/22 Participating Mode None Mar 19 11:39:01 2023 00195273 fc1/22 Enable None Mar 19 11:39:01 2023 00193893 fc1/22 Participating Mode None Mar 19 11:37:13 2023 00341497 fc1/22 Enable None Mar 19 11:37:13 2023 00340169 fc1/22 Participating Mode None