Connectrix B-Series: Switch Kernel Panic på grund av att minnesanvändningen för Weblinker-daemon ökar
Summary: Switchen rapporterade ett MEMORY_USAGE_STATE problem och efter 30 minuter startades switchen om på grund av kärnpanik.
Symptoms
Från errdump utdata:
2025/07/22-22:50:19 (CST), [MAPS-1003], 293324, SLOT 2 | FID 128, WARNING, CC-MA001-SANX7-1, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-22:52:19 (CST), [MAPS-1003], 293331, SLOT 2 | FID 81, WARNING, CC-MA001-SANX7-1-81, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-23:10:09 (CST), [EM-1033], 156895, SLOT 1 | CHASSIS, ERROR, nevccsg31swb01, CP in Slot 2 set to faulty because CP ERROR asserted. 2025/07/22-23:10:09 (CST), [EM-1047], 156896, SLOT 1 | CHASSIS, INFO, nevccsg31swb01, CP in slot 2 not faulty, CP ERROR deasserted. 2025/07/22-23:11:19 (CST), [HAM-1004], 293376, SLOT 2 | CHASSIS, INFO, nevccsg31swb01, Processor rebooted - Software Fault:Kernel Panic
Cause
Switchen har stött på FOS-863077 och denna defekt orsakar en minnesläcka.
Symptom:
Den weblinker daemon minnesanvändningen fortsätter att öka under SANnav-övervakning, och aktiviteter som configupload börjar misslyckas.
Den aktuella switchversionen Fabric OS 9.2.2 har inte korrigeringen. Kunden använder ett övervakningsverktyg från tredje part, vilket också påverkas.
SRM-5011-felen visar att den nådde 75 % av gränsen från och med den 21 juli 2025, så det tog 1 dag därifrån till failover:
2025/07/21-18:19:43:390633 (CST), [SRM-5011], 2330474/0, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, phy memory utilization meets or exceeds threshold of 75 percent. Current value is 76 percent., osmisc.c, line: 405, comp:osmiscd, ltime:2025/07/21-18:19:43:390406
Och sett finns det massor av meddelanden om att LDAP-inloggningen misslyckas. Eftersom alla inloggningsfel kommer från HTTPS använder de weblinker process. De dränerar de tillgängliga weblinker minnet tills det töms helt och orsakar en kernelpanik att återställas.
2025/07/22-23:06:26:207115 (CST), [SEC-1347], 2336526/293364, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-23:06:26:206934 2025/07/22-23:06:26:207828 (CST), [SEC-1193], 2336527/293365, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, Security violation: Login failure attempt via HTTPS. IP Addr: 10.236.90.16., public.c, line: 4039, comp:weblinker, ltime:2025/07/22-23:06:26:207430 2025/07/22-23:07:12:879161 (CST), [SEC-1347], 2336528/293366, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-
Resolution
Som standard är flödesövervakaren aktiverad på Gen7-system. Men om någon switch som kör FOS v9.1.0 eller senare inaktiverar flödesövervakning kan det här problemet vara exponerat. Det här problemet kan också exponeras på Gen6-plattformar utan flödesvisningslicens installerad.
Lösning:
Aktivera flödesvakten:
flow --activate sys_flow_monitor
På Gen6-system utan flow vision-licens uppgraderar du till en FOS-version med en lösning på det här problemet.
- FOS9.1.1d6RN-Stängd
- FOS9.2.0c3RN – Stängd
- FOS9.2.1bRN-Stängd
- FOS9.2.2aRN – Stängd
Additional Information
Granska dokumentation:
Versionskommentarer för Dell Connectrix B-Series Fabric OS