Connectrix B-Series: Estado de alarma del kernel del switch debido al aumento del uso de la memoria del demonio de Weblinker
Summary: El switch informó un problema de MEMORY_USAGE_STATE y, después de 30 minutos, el switch se reinició debido a un kernel panic.
Symptoms
En errdump salida:
2025/07/22-22:50:19 (CST), [MAPS-1003], 293324, SLOT 2 | FID 128, WARNING, CC-MA001-SANX7-1, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-22:52:19 (CST), [MAPS-1003], 293331, SLOT 2 | FID 81, WARNING, CC-MA001-SANX7-1-81, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-23:10:09 (CST), [EM-1033], 156895, SLOT 1 | CHASSIS, ERROR, nevccsg31swb01, CP in Slot 2 set to faulty because CP ERROR asserted. 2025/07/22-23:10:09 (CST), [EM-1047], 156896, SLOT 1 | CHASSIS, INFO, nevccsg31swb01, CP in slot 2 not faulty, CP ERROR deasserted. 2025/07/22-23:11:19 (CST), [HAM-1004], 293376, SLOT 2 | CHASSIS, INFO, nevccsg31swb01, Processor rebooted - Software Fault:Kernel Panic
Cause
El switch encontró FOS-863077 y este defecto causó una pérdida de memoria.
Síntoma:
El weblinker daemon El uso de la memoria continúa aumentando durante el monitoreo de SANnav y actividades como configupload empiezan a fallar.
La versión actual del switch Fabric OS 9.2.2 no tiene la corrección. El cliente utiliza una herramienta de monitoreo de otros fabricantes que también se ve afectada.
Los errores de SRM-5011 que muestran que alcanzó el 75 % del límite a partir del 21 de julio de 2025, por lo que la conmutación por error tardó 1 día desde allí:
2025/07/21-18:19:43:390633 (CST), [SRM-5011], 2330474/0, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, phy memory utilization meets or exceeds threshold of 75 percent. Current value is 76 percent., osmisc.c, line: 405, comp:osmiscd, ltime:2025/07/21-18:19:43:390406
Y, como se ve, hay muchos mensajes de error de inicio de sesión de LDAP. Debido a que todos los errores de inicio de sesión provienen de HTTPS, están utilizando el weblinker . Están agotando los recursos disponibles weblinker memoria hasta que se agote por completo y provoque una recuperación de kernel panic.
2025/07/22-23:06:26:207115 (CST), [SEC-1347], 2336526/293364, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-23:06:26:206934 2025/07/22-23:06:26:207828 (CST), [SEC-1193], 2336527/293365, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, Security violation: Login failure attempt via HTTPS. IP Addr: 10.236.90.16., public.c, line: 4039, comp:weblinker, ltime:2025/07/22-23:06:26:207430 2025/07/22-23:07:12:879161 (CST), [SEC-1347], 2336528/293366, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-
Resolution
De manera predeterminada, en los sistemas Gen7, el monitor de flujo está habilitado. Sin embargo, si algún switch que ejecuta FOS v9.1.0 o posterior deshabilita el monitoreo de flujo, este problema puede quedar expuesto. Este problema también se puede exponer en plataformas Gen6 sin licencia de Flow Vision instalada.
Solución alternativa:
Active el monitor de flujo:
flow --activate sys_flow_monitor
En sistemas Gen6 sin licencia de visión de flujo, actualice a una versión de FOS con una corrección para este problema.
- FOS9.1.1d6RN-Cerrado
- FOS9.2.0c3RN-Cerrado
- FOS9.2.1bRN-Cerrado
- FOS9.2.2aRN-Cerrado
Additional Information
Revise la documentación:
Notas de la versión del SO de fabric de Dell Connectrix serie B