Connectrix B-Serie: Switch-Kernel-Panik aufgrund steigender Speicherauslastung des Weblinker-Daemon
Summary: Der Switch meldete ein MEMORY_USAGE_STATE Problem und nach 30 Minuten wurde der Switch aufgrund eines Kernel-Fehlers neu gestartet.
Symptoms
von errdump Ausgabe:
2025/07/22-22:50:19 (CST), [MAPS-1003], 293324, SLOT 2 | FID 128, WARNING, CC-MA001-SANX7-1, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-22:52:19 (CST), [MAPS-1003], 293331, SLOT 2 | FID 81, WARNING, CC-MA001-SANX7-1-81, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-23:10:09 (CST), [EM-1033], 156895, SLOT 1 | CHASSIS, ERROR, nevccsg31swb01, CP in Slot 2 set to faulty because CP ERROR asserted. 2025/07/22-23:10:09 (CST), [EM-1047], 156896, SLOT 1 | CHASSIS, INFO, nevccsg31swb01, CP in slot 2 not faulty, CP ERROR deasserted. 2025/07/22-23:11:19 (CST), [HAM-1004], 293376, SLOT 2 | CHASSIS, INFO, nevccsg31swb01, Processor rebooted - Software Fault:Kernel Panic
Cause
Der Switch ist auf FOS-863077 gestoßen und dieser Fehler verursacht ein Speicherleck.
Symptom:
Das weblinker daemon Die Speicherauslastung nimmt während des SANnav-Monitorings weiter zu und Aktivitäten wie configupload anfangen zu scheitern.
Die aktuelle Switchversion Fabric OS 9.2.2 verfügt nicht über die Korrektur. Der Kunde verwendet ein Überwachungstool eines Drittanbieters, das ebenfalls betroffen ist.
Die SRM-5011-Fehler zeigen, dass 75 % des Limits ab dem 21. Juli 2025 erreicht wurden, sodass das Failover von dort aus 1 Tag dauerte:
2025/07/21-18:19:43:390633 (CST), [SRM-5011], 2330474/0, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, phy memory utilization meets or exceeds threshold of 75 percent. Current value is 76 percent., osmisc.c, line: 405, comp:osmiscd, ltime:2025/07/21-18:19:43:390406
Und es gibt viele Fehlermeldungen bei LDAP-Anmeldungen. Da alle fehlgeschlagenen Anmeldungen von HTTPS stammen, wird die weblinker an. Sie entladen die verfügbare weblinker Speicher, bis er vollständig aufgebraucht ist und eine Kernel-Panik ausgelöst wird.
2025/07/22-23:06:26:207115 (CST), [SEC-1347], 2336526/293364, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-23:06:26:206934 2025/07/22-23:06:26:207828 (CST), [SEC-1193], 2336527/293365, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, Security violation: Login failure attempt via HTTPS. IP Addr: 10.236.90.16., public.c, line: 4039, comp:weblinker, ltime:2025/07/22-23:06:26:207430 2025/07/22-23:07:12:879161 (CST), [SEC-1347], 2336528/293366, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-
Resolution
Auf Gen7-Systemen ist die Flussüberwachung standardmäßig aktiviert. Wenn jedoch ein Switch, auf dem FOS v9.1.0 oder höher ausgeführt wird, das Flow-Monitoring deaktiviert, kann dieses Problem auftreten. Dieses Problem kann auch auf Gen6-Plattformen ohne installierte Flow Vision-Lizenz auftreten.
Problemumgehung:
Aktivieren Sie den Flow-Monitor:
flow --activate sys_flow_monitor
Führen Sie auf Gen6-Systemen ohne Flow Vision-Lizenz ein Upgrade auf eine FOS-Version mit einer Korrektur für dieses Problem durch.
- FOS9.1.1d6RN-Geschlossen
- FOS9.2.0c3RN-Geschlossen
- FOS9.2.1bRN-geschlossen
- FOS9.2.2aRN-Geschlossen
Additional Information
Dokumentation überprüfen:
Dell Connectrix B-Series Fabric OS – Versionshinweise