Серія Connectrix B: Паніка ядра комутатора через зростання використання пам'яті демонів Weblinker
Summary: Комутатор повідомив про MEMORY_USAGE_STATE проблему, і через 30 хвилин комутатор перезавантажився через паніку з боку ядра.
Symptoms
Від errdump вихід:
2025/07/22-22:50:19 (CST), [MAPS-1003], 293324, SLOT 2 | FID 128, WARNING, CC-MA001-SANX7-1, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-22:52:19 (CST), [MAPS-1003], 293331, SLOT 2 | FID 81, WARNING, CC-MA001-SANX7-1-81, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-23:10:09 (CST), [EM-1033], 156895, SLOT 1 | CHASSIS, ERROR, nevccsg31swb01, CP in Slot 2 set to faulty because CP ERROR asserted. 2025/07/22-23:10:09 (CST), [EM-1047], 156896, SLOT 1 | CHASSIS, INFO, nevccsg31swb01, CP in slot 2 not faulty, CP ERROR deasserted. 2025/07/22-23:11:19 (CST), [HAM-1004], 293376, SLOT 2 | CHASSIS, INFO, nevccsg31swb01, Processor rebooted - Software Fault:Kernel Panic
Cause
Комутатор зіткнувся з FOS-863077 , і цей дефект спричинив витік пам'яті.
Симптом:
The weblinker daemon Використання пам'яті продовжує зростати під час моніторингу SANnav та таких дій, як configupload Почати зазнавати невдач.
Поточна версія комутатора Fabric OS 9.2.2 не має цього рішення. Клієнт використовує сторонній інструмент моніторингу, який також зазнає впливу.
Помилки SRM-5011, які показали, що досягли 75% від ліміту починаючи з 21 липня 2025 року, тому після цього на відмовлення знадобився 1 день:
2025/07/21-18:19:43:390633 (CST), [SRM-5011], 2330474/0, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, phy memory utilization meets or exceeds threshold of 75 percent. Current value is 76 percent., osmisc.c, line: 405, comp:osmiscd, ltime:2025/07/21-18:19:43:390406
І бачу, що є багато повідомлень про невдачу входу в LDAP. Оскільки всі збої входу відбуваються через HTTPS, вони використовують weblinker процес. Вони виснажують доступне weblinker пам'ять, доки вона повністю не зникне і не спричинить відновлення паніки в ядрі.
2025/07/22-23:06:26:207115 (CST), [SEC-1347], 2336526/293364, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-23:06:26:206934 2025/07/22-23:06:26:207828 (CST), [SEC-1193], 2336527/293365, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, Security violation: Login failure attempt via HTTPS. IP Addr: 10.236.90.16., public.c, line: 4039, comp:weblinker, ltime:2025/07/22-23:06:26:207430 2025/07/22-23:07:12:879161 (CST), [SEC-1347], 2336528/293366, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-
Resolution
За замовчуванням у системах Gen7 монітор потоку увімкнений. Однак, якщо будь-який комутатор з FOS версією 9.1.0 або новішими вимикають моніторинг потоку, ця проблема може бути виявлена. Ця проблема також може бути виявлена на платформах Gen6 без встановленої ліцензії Flow Vision.
Обхідний шлях:
Активуйте монітор потоку:
flow --activate sys_flow_monitor
На системах Gen6 без ліцензії Flow Vision оновитися до версії FOS з виправленням цієї проблеми.
- FOS9.1.1d6RN — закрито
- FOS9.2.0c3RN — закрито
- FOS9.2.1bRN — закрито
- FOS9.2.2aRN-Закрито
Additional Information
Документація для перегляду:
Примітки до випуску Dell Connectrix B-Series Fabric OS