Connectrix B-serie: Kernelpaniek switch doordat het geheugengebruik van Weblinker Daemon toeneemt
Summary: De switch meldde een MEMORY_USAGE_STATE probleem en na 30 minuten werd de switch opnieuw opgestart vanwege een kernelpanic.
Symptoms
Van errdump uitvoer:
2025/07/22-22:50:19 (CST), [MAPS-1003], 293324, SLOT 2 | FID 128, WARNING, CC-MA001-SANX7-1, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-22:52:19 (CST), [MAPS-1003], 293331, SLOT 2 | FID 81, WARNING, CC-MA001-SANX7-1-81, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-23:10:09 (CST), [EM-1033], 156895, SLOT 1 | CHASSIS, ERROR, nevccsg31swb01, CP in Slot 2 set to faulty because CP ERROR asserted. 2025/07/22-23:10:09 (CST), [EM-1047], 156896, SLOT 1 | CHASSIS, INFO, nevccsg31swb01, CP in slot 2 not faulty, CP ERROR deasserted. 2025/07/22-23:11:19 (CST), [HAM-1004], 293376, SLOT 2 | CHASSIS, INFO, nevccsg31swb01, Processor rebooted - Software Fault:Kernel Panic
Cause
De switch is FOS-863077 tegengekomen en dit defect veroorzaakt een geheugenlek.
Symptoom:
De weblinker daemon Het geheugengebruik blijft toenemen tijdens SANnav-bewaking en activiteiten zoals configupload beginnen te mislukken.
Huidige switchversie Fabric OS 9.2.2 heeft de oplossing niet. De klant gebruikt een externe controletool die ook wordt beïnvloed.
De SRM-5011-fouten die aangeven dat deze vanaf 21 juli 2025 75% van de limiet hebben bereikt, waardoor het vanaf daar 1 dag duurde om failover uit te voeren:
2025/07/21-18:19:43:390633 (CST), [SRM-5011], 2330474/0, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, phy memory utilization meets or exceeds threshold of 75 percent. Current value is 76 percent., osmisc.c, line: 405, comp:osmiscd, ltime:2025/07/21-18:19:43:390406
En gezien zijn er veel LDAP-aanmeldingsfoutmeldingen. Omdat alle mislukte aanmeldingen via HTTPS zijn, gebruiken ze de weblinker proces. Ze putten de beschikbare weblinker geheugen totdat het volledig uitgeput is en een kernel panic veroorzaakt om te herstellen.
2025/07/22-23:06:26:207115 (CST), [SEC-1347], 2336526/293364, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-23:06:26:206934 2025/07/22-23:06:26:207828 (CST), [SEC-1193], 2336527/293365, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, Security violation: Login failure attempt via HTTPS. IP Addr: 10.236.90.16., public.c, line: 4039, comp:weblinker, ltime:2025/07/22-23:06:26:207430 2025/07/22-23:07:12:879161 (CST), [SEC-1347], 2336528/293366, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-
Resolution
Standaard is op Gen7-systemen de flowmonitor ingeschakeld. Als een switch met FOS v9.1.0 of hoger echter stroombewaking uitschakelt, kan dit probleem aan het licht komen. Dit probleem kan ook worden waargenomen op Gen6-platforms zonder dat een Flow Vision-licentie is geïnstalleerd.
Tijdelijke oplossing:
Flowmonitor activeren:
flow --activate sys_flow_monitor
Upgrade op Gen6-systemen zonder Flow Vision-licentie naar een FOS-versie met een oplossing voor dit probleem.
- FOS9.1.1d6RN-Gesloten
- FOS9.2.0c3RN-Gesloten
- FOS9.2.1bRN-Gesloten
- FOS9.2.2aRN-Gesloten
Additional Information
Bekijk documentatie:
Releaseopmerkingen voor Dell Connectrix B-Series Fabric OS