Connectrix B-Series: Weblinker 데몬 메모리 사용량 증가로 인한 스위치 커널 패닉
Summary: 스위치에서 MEMORY_USAGE_STATE 문제를 보고했으며 30분 후 커널 패닉으로 인해 스위치가 재부팅되었습니다.
Symptoms
시작 errdump 출력:
2025/07/22-22:50:19 (CST), [MAPS-1003], 293324, SLOT 2 | FID 128, WARNING, CC-MA001-SANX7-1, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-22:52:19 (CST), [MAPS-1003], 293331, SLOT 2 | FID 81, WARNING, CC-MA001-SANX7-1-81, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-23:10:09 (CST), [EM-1033], 156895, SLOT 1 | CHASSIS, ERROR, nevccsg31swb01, CP in Slot 2 set to faulty because CP ERROR asserted. 2025/07/22-23:10:09 (CST), [EM-1047], 156896, SLOT 1 | CHASSIS, INFO, nevccsg31swb01, CP in slot 2 not faulty, CP ERROR deasserted. 2025/07/22-23:11:19 (CST), [HAM-1004], 293376, SLOT 2 | CHASSIS, INFO, nevccsg31swb01, Processor rebooted - Software Fault:Kernel Panic
Cause
스위치에 FOS-863077 및 이 결함으로 인해 메모리 누수가 발생했습니다.
증상:
이 weblinker daemon SANnav 모니터링 및 다음과 같은 활동 중에 메모리 사용량이 계속 증가합니다. configupload 실패하기 시작합니다.
현재 스위치 버전 Fabric OS 9.2.2에는 수정 사항이 없습니다. 고객이 타사 모니터링 툴을 사용하고 있으며 이 툴도 영향을 받습니다.
SRM-5011 오류가 2025년 7월 21일부터 제한의 75%에 도달했음을 표시하므로 페일오버하는 데 1일이 걸렸습니다.
2025/07/21-18:19:43:390633 (CST), [SRM-5011], 2330474/0, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, phy memory utilization meets or exceeds threshold of 75 percent. Current value is 76 percent., osmisc.c, line: 405, comp:osmiscd, ltime:2025/07/21-18:19:43:390406
보시다시피 LDAP 로그인 실패 메시지가 많이 있습니다. 모든 로그인 실패는 HTTPS에서 발생하기 때문에 weblinker 프로세스에서 라이선스를 요청합니다. 그들은 사용 가능한 것을 고갈시키고 있습니다. weblinker 메모리가 완전히 고갈되어 커널 패닉이 복구될 때까지 메모리를 유지합니다.
2025/07/22-23:06:26:207115 (CST), [SEC-1347], 2336526/293364, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-23:06:26:206934 2025/07/22-23:06:26:207828 (CST), [SEC-1193], 2336527/293365, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, Security violation: Login failure attempt via HTTPS. IP Addr: 10.236.90.16., public.c, line: 4039, comp:weblinker, ltime:2025/07/22-23:06:26:207430 2025/07/22-23:07:12:879161 (CST), [SEC-1347], 2336528/293366, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-
Resolution
기본적으로 Gen7 시스템에서는 흐름 모니터가 활성화되어 있습니다. 그러나 FOS v9.1.0 이상을 실행하는 스위치가 흐름 모니터링을 비활성화하는 경우 이 문제가 노출될 수 있습니다. 이 문제는 Flow Vision 라이선스가 설치되지 않은 Gen6 플랫폼에서도 노출될 수 있습니다.
해결 방법:
유량 모니터 활성화:
flow --activate sys_flow_monitor
Flow Vision 라이선스가 없는 Gen6 시스템에서는 이 문제를 수정하여 FOS 버전으로 업그레이드하십시오.
- FOS9.1.1d6RN-닫힘
- FOS9.2.0c3RN-폐쇄
- FOS9.2.1bRN-폐쇄
- FOS9.2.2aRN-폐쇄
Additional Information
설명서를 검토합니다.
Dell Connectrix B-Series Fabric OS 릴리스 노트