Connectrix řady B: Panika jádra přepínače kvůli zvyšujícímu se využití paměti démona Weblinker
Summary: Přepínač nahlásil problém s MEMORY_USAGE_STATE a po 30 minutách se kvůli panice jádra restartoval.
Symptoms
Z příkazu errdump výstup:
2025/07/22-22:50:19 (CST), [MAPS-1003], 293324, SLOT 2 | FID 128, WARNING, CC-MA001-SANX7-1, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-22:52:19 (CST), [MAPS-1003], 293331, SLOT 2 | FID 81, WARNING, CC-MA001-SANX7-1-81, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-23:10:09 (CST), [EM-1033], 156895, SLOT 1 | CHASSIS, ERROR, nevccsg31swb01, CP in Slot 2 set to faulty because CP ERROR asserted. 2025/07/22-23:10:09 (CST), [EM-1047], 156896, SLOT 1 | CHASSIS, INFO, nevccsg31swb01, CP in slot 2 not faulty, CP ERROR deasserted. 2025/07/22-23:11:19 (CST), [HAM-1004], 293376, SLOT 2 | CHASSIS, INFO, nevccsg31swb01, Processor rebooted - Software Fault:Kernel Panic
Cause
V přepínači došlo k závadě FOS-863077 a způsobila nevrácení paměti.
Symptom:
Ten weblinker daemon Využití paměti se stále zvyšuje během monitorování SANnav a aktivit, jako je configupload začít selhávat.
Aktuální verze přepínače Fabric OS 9.2.2 tuto opravu nemá. Zákazník používá monitorovací nástroj třetí strany, který je také ovlivněn.
Chyby SRM-5011 ukazují, že od 21. července 2025 dosáhly 75 % limitu, takže převzetí služeb při selhání trvalo 1 den:
2025/07/21-18:19:43:390633 (CST), [SRM-5011], 2330474/0, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, phy memory utilization meets or exceeds threshold of 75 percent. Current value is 76 percent., osmisc.c, line: 405, comp:osmiscd, ltime:2025/07/21-18:19:43:390406
A vidíte, že existuje mnoho zpráv o selhání přihlášení LDAP. Vzhledem k tomu, že všechna selhání přihlášení jsou z protokolu HTTPS, používají weblinker . Vyčerpávají dostupné weblinker paměť, dokud se zcela nevyčerpá a nezpůsobí obnovení jádrové paniky.
2025/07/22-23:06:26:207115 (CST), [SEC-1347], 2336526/293364, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-23:06:26:206934 2025/07/22-23:06:26:207828 (CST), [SEC-1193], 2336527/293365, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, Security violation: Login failure attempt via HTTPS. IP Addr: 10.236.90.16., public.c, line: 4039, comp:weblinker, ltime:2025/07/22-23:06:26:207430 2025/07/22-23:07:12:879161 (CST), [SEC-1347], 2336528/293366, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-
Resolution
Ve výchozím nastavení je v systémech Gen7 povoleno monitorování toku. Pokud však jakýkoli přepínač se systémem FOS v9.1.0 nebo novějším zakáže monitorování toku, může k tomuto problému dojít. Tento problém může být také vystaven na platformách Gen6 bez nainstalované licence Flow Vision.
Alternativní řešení:
Aktivujte monitorování toku:
flow --activate sys_flow_monitor
V systémech Gen6 bez licence Flow Vision proveďte upgrade na verzi FOS s opravou tohoto problému.
- FOS9.1.1d6RN – uzavřeno
- FOS9.2.0c3RN – uzavřeno
- FOS9.2.1bRN – uzavřeno
- FOS9.2.2aRN – uzavřeno
Additional Information
Kontrola dokumentace:
Poznámky k verzi pro Dell Connectrix Fabric OS řady B