Connectrix B-Series: Errore irreversibile del kernel dello switch a causa dell'aumento dell'utilizzo della memoria del daemon Weblinker
Summary: Lo switch ha segnalato un problema di MEMORY_USAGE_STATE e dopo 30 minuti si è riavviato a causa di un errore irreversibile del kernel.
Symptoms
Dal comando errdump prodotto:
2025/07/22-22:50:19 (CST), [MAPS-1003], 293324, SLOT 2 | FID 128, WARNING, CC-MA001-SANX7-1, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-22:52:19 (CST), [MAPS-1003], 293331, SLOT 2 | FID 81, WARNING, CC-MA001-SANX7-1-81, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-23:10:09 (CST), [EM-1033], 156895, SLOT 1 | CHASSIS, ERROR, nevccsg31swb01, CP in Slot 2 set to faulty because CP ERROR asserted. 2025/07/22-23:10:09 (CST), [EM-1047], 156896, SLOT 1 | CHASSIS, INFO, nevccsg31swb01, CP in slot 2 not faulty, CP ERROR deasserted. 2025/07/22-23:11:19 (CST), [HAM-1004], 293376, SLOT 2 | CHASSIS, INFO, nevccsg31swb01, Processor rebooted - Software Fault:Kernel Panic
Cause
Lo switch ha rilevato FOS-863077 e questo difetto ha causato una perdita di memoria.
Sintomo:
Le weblinker daemon l'utilizzo della memoria continua ad aumentare durante il monitoraggio SANnav e attività come configupload inizia a fallire.
La versione corrente dello switch Fabric OS 9.2.2 non dispone della correzione. Anche il cliente sta utilizzando uno strumento di monitoraggio di terze parti, anch'esso interessato.
SRM-5011 mostra che ha raggiunto il 75% del limite a partire dal 21 luglio 2025, quindi è stato necessario 1 giorno per il failover:
2025/07/21-18:19:43:390633 (CST), [SRM-5011], 2330474/0, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, phy memory utilization meets or exceeds threshold of 75 percent. Current value is 76 percent., osmisc.c, line: 405, comp:osmiscd, ltime:2025/07/21-18:19:43:390406
Sono inoltre presenti numerosi messaggi di login LDAP non riusciti. Poiché tutti gli errori di accesso provengono da HTTPS, utilizzano il metodo weblinker . Stanno prosciugando le risorse disponibili weblinker memoria fino a quando non si esaurisce completamente e provoca un kernel panic per il ripristino.
2025/07/22-23:06:26:207115 (CST), [SEC-1347], 2336526/293364, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-23:06:26:206934 2025/07/22-23:06:26:207828 (CST), [SEC-1193], 2336527/293365, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, Security violation: Login failure attempt via HTTPS. IP Addr: 10.236.90.16., public.c, line: 4039, comp:weblinker, ltime:2025/07/22-23:06:26:207430 2025/07/22-23:07:12:879161 (CST), [SEC-1347], 2336528/293366, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-
Resolution
Per impostazione predefinita, nei sistemi Gen7, il monitoraggio del flusso è abilitato. Tuttavia, se uno switch che esegue FOS v9.1.0 o versioni successive disabilita il monitoraggio del flusso, questo problema potrebbe essere esposto. Questo problema può essere esposto anche sulle piattaforme Gen6 senza licenza Flow Vision installata.
Soluzione alternativa:
Attivare il monitoraggio del flusso:
flow --activate sys_flow_monitor
Nei sistemi Gen6 senza licenza Flow Vision, eseguire l'aggiornamento a una versione FOS con una correzione per questo problema.
- FOS9.1.1d6RN-Chiuso
- FOS9.2.0c3RN-Chiuso
- FOS9.2.1bRN-Chiuso
- FOS9.2.2aRN-Chiuso
Additional Information
Consultare la documentazione:
Note di rilascio di Dell Connectrix B-Series Fabric OS