Connectrix B-Series: Skift kernelpanik på grund af stigende brug af Weblinker-dæmonhukommelse
Summary: Switchen rapporterede et problem med MEMORY_USAGE_STATE, og efter 30 minutter genstartede switchen på grund af kernelpanik.
Symptoms
Fra errdump udgang:
2025/07/22-22:50:19 (CST), [MAPS-1003], 293324, SLOT 2 | FID 128, WARNING, CC-MA001-SANX7-1, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-22:52:19 (CST), [MAPS-1003], 293331, SLOT 2 | FID 81, WARNING, CC-MA001-SANX7-1-81, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-23:10:09 (CST), [EM-1033], 156895, SLOT 1 | CHASSIS, ERROR, nevccsg31swb01, CP in Slot 2 set to faulty because CP ERROR asserted. 2025/07/22-23:10:09 (CST), [EM-1047], 156896, SLOT 1 | CHASSIS, INFO, nevccsg31swb01, CP in slot 2 not faulty, CP ERROR deasserted. 2025/07/22-23:11:19 (CST), [HAM-1004], 293376, SLOT 2 | CHASSIS, INFO, nevccsg31swb01, Processor rebooted - Software Fault:Kernel Panic
Cause
Switchen er stødt på FOS-863077 , og denne defekt forårsager en hukommelseslækage.
Symptom:
Den weblinker daemon hukommelsesforbruget fortsætter med at stige under SANnav-overvågning, og aktiviteter som f.eks. configupload begynde at mislykkes.
Aktuel switchversion Fabric OS 9.2.2 har ikke rettelsen. Kunden bruger et tredjepartsovervågningsværktøj, som også er berørt.
SRM-5011-fejlene, der viser, at den nåede 75% af grænsen startende den 21. juli 2025, så det tog 1 dag derfra til failover:
2025/07/21-18:19:43:390633 (CST), [SRM-5011], 2330474/0, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, phy memory utilization meets or exceeds threshold of 75 percent. Current value is 76 percent., osmisc.c, line: 405, comp:osmiscd, ltime:2025/07/21-18:19:43:390406
Og set, der er masser af LDAP-loginfejlmeddelelser. Da alle loginfejl er fra HTTPS, bruger de weblinker proces. De dræner de tilgængelige weblinker hukommelse, indtil den er helt opbrugt og får en kernepanik til at genoprettes.
2025/07/22-23:06:26:207115 (CST), [SEC-1347], 2336526/293364, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-23:06:26:206934 2025/07/22-23:06:26:207828 (CST), [SEC-1193], 2336527/293365, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, Security violation: Login failure attempt via HTTPS. IP Addr: 10.236.90.16., public.c, line: 4039, comp:weblinker, ltime:2025/07/22-23:06:26:207430 2025/07/22-23:07:12:879161 (CST), [SEC-1347], 2336528/293366, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-
Resolution
På Gen7-systemer er flowovervågningen som standard aktiveret. Men hvis en switch, der kører FOS v9.1.0 eller nyere, deaktiverer flowovervågning, kan dette problem blive afsløret. Dette problem kan også blive afsløret på Gen6-platforme uden flowvisionslicens installeret.
Løsning:
Aktivér flowmonitor:
flow --activate sys_flow_monitor
På Gen6-systemer uden flowvision-licens skal du opgradere til en FOS-version med en rettelse af dette problem.
- FOS9.1.1d6RN-Lukket
- FOS9.2.0c3RN-Lukket
- FOS9.2.1bRN-lukket
- FOS9.2.2aRN-Lukket
Additional Information
Gennemse dokumentation:
Produktbemærkninger til Dell Connectrix B-seriens strukturoperativsystem