Connectrix Série B: Pane do kernel do switch devido ao aumento do uso de memória do daemon do Weblinker
Summary: O switch relatou um problema de MEMORY_USAGE_STATE e, após 30 minutos, o switch reinicializou devido a uma pane no kernel.
Symptoms
De errdump saída:
2025/07/22-22:50:19 (CST), [MAPS-1003], 293324, SLOT 2 | FID 128, WARNING, CC-MA001-SANX7-1, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-22:52:19 (CST), [MAPS-1003], 293331, SLOT 2 | FID 81, WARNING, CC-MA001-SANX7-1-81, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-23:10:09 (CST), [EM-1033], 156895, SLOT 1 | CHASSIS, ERROR, nevccsg31swb01, CP in Slot 2 set to faulty because CP ERROR asserted. 2025/07/22-23:10:09 (CST), [EM-1047], 156896, SLOT 1 | CHASSIS, INFO, nevccsg31swb01, CP in slot 2 not faulty, CP ERROR deasserted. 2025/07/22-23:11:19 (CST), [HAM-1004], 293376, SLOT 2 | CHASSIS, INFO, nevccsg31swb01, Processor rebooted - Software Fault:Kernel Panic
Cause
O switch encontrou FOS-863077 e esse defeito causou perda de memória.
Sintoma:
O weblinker daemon O uso da memória continua aumentando durante o monitoramento do SANnav e atividades como configupload começam a falhar.
A versão atual do switch Fabric OS 9.2.2 não tem a correção. O cliente está usando uma ferramenta de monitoramento de terceiros, que também é afetada.
Os erros do SRM-5011 mostram que o atingiu 75% do limite a partir de 21 de julho de 2025, portanto, levou um dia entre lá para o failover:
2025/07/21-18:19:43:390633 (CST), [SRM-5011], 2330474/0, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, phy memory utilization meets or exceeds threshold of 75 percent. Current value is 76 percent., osmisc.c, line: 405, comp:osmiscd, ltime:2025/07/21-18:19:43:390406
E vemos que há muitas mensagens de falha de login do LDAP. Como todas as falhas de log-in são provenientes do HTTPS, elas estão usando o weblinker . Eles estão drenando o disponível weblinker memória até que ela se esgote completamente e faça com que um kernel se recupere.
2025/07/22-23:06:26:207115 (CST), [SEC-1347], 2336526/293364, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-23:06:26:206934 2025/07/22-23:06:26:207828 (CST), [SEC-1193], 2336527/293365, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, Security violation: Login failure attempt via HTTPS. IP Addr: 10.236.90.16., public.c, line: 4039, comp:weblinker, ltime:2025/07/22-23:06:26:207430 2025/07/22-23:07:12:879161 (CST), [SEC-1347], 2336528/293366, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-
Resolution
Por padrão, em sistemas Gen7, o monitor de fluxo está ativado. No entanto, se qualquer switch que executa o FOS v9.1.0 ou posterior desativar o monitoramento de fluxo, esse problema pode ser exposto. Esse problema também pode ser exposto em plataformas de 6ª geração sem a licença de visão de fluxo instalada.
Solução temporária:
Ative o monitor de fluxo:
flow --activate sys_flow_monitor
Em sistemas de 6ª geração sem licença de visão de fluxo, faça upgrade para uma versão FOS com uma correção para esse problema.
- FOS9.1.1d6RN-Fechado
- FOS9.2.0c3RN-fechado
- FOS9.2.1bRN-fechado
- FOS9.2.2aRN-Fechado
Additional Information
Analise a documentação:
Notas da versão do Fabric OS do Dell Connectrix série B