Connectrix B-Series: Panika jądra przełącznika spowodowana rosnącym użyciem pamięci demona Weblinker
Summary: Przełącznik zgłosił problem z MEMORY_USAGE_STATE, a po 30 minutach przełącznik został uruchomiony ponownie z powodu awarii jądra.
Symptoms
Przy użyciu polecenia errdump wyjście:
2025/07/22-22:50:19 (CST), [MAPS-1003], 293324, SLOT 2 | FID 128, WARNING, CC-MA001-SANX7-1, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-22:52:19 (CST), [MAPS-1003], 293331, SLOT 2 | FID 81, WARNING, CC-MA001-SANX7-1-81, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-23:10:09 (CST), [EM-1033], 156895, SLOT 1 | CHASSIS, ERROR, nevccsg31swb01, CP in Slot 2 set to faulty because CP ERROR asserted. 2025/07/22-23:10:09 (CST), [EM-1047], 156896, SLOT 1 | CHASSIS, INFO, nevccsg31swb01, CP in slot 2 not faulty, CP ERROR deasserted. 2025/07/22-23:11:19 (CST), [HAM-1004], 293376, SLOT 2 | CHASSIS, INFO, nevccsg31swb01, Processor rebooted - Software Fault:Kernel Panic
Cause
Przełącznik napotkał FOS-863077 i tę wadę powodującą wyciek pamięci.
Objaw:
Ten weblinker daemon Zużycie pamięci stale wzrasta podczas monitorowania SANnav, a działania takie jak configupload zaczynają zawodzić.
Bieżąca wersja przełącznika Fabric OS 9.2.2 nie zawiera tej poprawki. Klient korzysta z narzędzia do monitorowania innej firmy, którego również dotyczy problem.
Błędy SRM-5011 pokazujące, że osiągnął 75% limitu począwszy od 21 lipca 2025 r., więc przejście awaryjne trwało 1 dzień:
2025/07/21-18:19:43:390633 (CST), [SRM-5011], 2330474/0, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, phy memory utilization meets or exceeds threshold of 75 percent. Current value is 76 percent., osmisc.c, line: 405, comp:osmiscd, ltime:2025/07/21-18:19:43:390406
I widać, że jest wiele komunikatów o niepowodzeniu logowania LDAP. Ponieważ wszystkie błędy logowania dotyczą protokołu HTTPS, używają weblinker . Wyczerpują dostępne weblinker pamięci, aż do całkowitego wyczerpania i wywołania awarii jądra w celu odzyskania.
2025/07/22-23:06:26:207115 (CST), [SEC-1347], 2336526/293364, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-23:06:26:206934 2025/07/22-23:06:26:207828 (CST), [SEC-1193], 2336527/293365, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, Security violation: Login failure attempt via HTTPS. IP Addr: 10.236.90.16., public.c, line: 4039, comp:weblinker, ltime:2025/07/22-23:06:26:207430 2025/07/22-23:07:12:879161 (CST), [SEC-1347], 2336528/293366, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-
Resolution
Domyślnie w systemach Gen7 monitor przepływu jest włączony. Jeśli jednak jakikolwiek przełącznik z systemem FOS w wersji 9.1.0 lub nowszej wyłącza monitorowanie przepływu, problem ten może być widoczny. Ten problem może być również ujawniony na platformach Gen6 bez zainstalowanej licencji Flow Vision.
Obejście problemu:
Aktywuj monitor przepływu:
flow --activate sys_flow_monitor
W systemach Gen6 bez licencji Flow Vision uaktualnij oprogramowanie do wersji FOS z poprawką tego problemu.
- FOS9.1.1d6RN — zamknięty
- FOS9.2.0c3RN — zamknięte
- FOS9.2.1bRN — zamknięte
- FOS9.2.2aRN — zamknięte
Additional Information
Zapoznaj się z dokumentacją:
Informacje dotyczące wydania systemu operacyjnego Dell Connectrix z serii B