「Connectrix B-Series:Weblinker デーモンのメモリ使用量の増加によるスイッチカーネルパニック
Summary: スイッチからMEMORY_USAGE_STATEの問題が報告され、カーネル パニックにより30分後にスイッチが再起動しました。
Symptoms
開始 errdump アウトプット:
2025/07/22-22:50:19 (CST), [MAPS-1003], 293324, SLOT 2 | FID 128, WARNING, CC-MA001-SANX7-1, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-22:52:19 (CST), [MAPS-1003], 293331, SLOT 2 | FID 81, WARNING, CC-MA001-SANX7-1-81, Chassis, Condition=CHASSIS(MEMORY_USAGE_STATE/NONE==WARNING), Current Value:[MEMORY_USAGE_STATE, WARNING], RuleName=defCHASSISMEMORY_USAGE_STATE_WARN, Dashboard Category=Switch Resource, Quiet Time=1 hour. 2025/07/22-23:10:09 (CST), [EM-1033], 156895, SLOT 1 | CHASSIS, ERROR, nevccsg31swb01, CP in Slot 2 set to faulty because CP ERROR asserted. 2025/07/22-23:10:09 (CST), [EM-1047], 156896, SLOT 1 | CHASSIS, INFO, nevccsg31swb01, CP in slot 2 not faulty, CP ERROR deasserted. 2025/07/22-23:11:19 (CST), [HAM-1004], 293376, SLOT 2 | CHASSIS, INFO, nevccsg31swb01, Processor rebooted - Software Fault:Kernel Panic
Cause
スイッチでFOS-863077 が発生し、この欠陥によりメモリー リークが発生しました。
症状:
ザ weblinker daemon SANnavのモニタリング中にメモリー使用量が増加し続け、 configupload 失敗し始めます。
現在のスイッチ バージョンのFabric OS 9.2.2にはこの修正がありません。お客様はサード パーティー製のモニタリング ツールを使用しており、これも影響を受けます。
2025年7月21日に開始されたSRM-5011エラーが制限の75%に達したため、そこからフェールオーバーに1日かかりました。
2025/07/21-18:19:43:390633 (CST), [SRM-5011], 2330474/0, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, phy memory utilization meets or exceeds threshold of 75 percent. Current value is 76 percent., osmisc.c, line: 405, comp:osmiscd, ltime:2025/07/21-18:19:43:390406
ご覧のとおり、LDAPログイン失敗メッセージが多数あります。すべてのログイン失敗はHTTPSによるものであるため、 weblinker プロセスにライセンスを要求します。それらは利用可能なものを枯渇させています weblinker メモリーを完全に使い果たし、カーネル パニックが回復するまで、メモリーを保管します。
2025/07/22-23:06:26:207115 (CST), [SEC-1347], 2336526/293364, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-23:06:26:206934 2025/07/22-23:06:26:207828 (CST), [SEC-1193], 2336527/293365, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, Security violation: Login failure attempt via HTTPS. IP Addr: 10.236.90.16., public.c, line: 4039, comp:weblinker, ltime:2025/07/22-23:06:26:207430 2025/07/22-23:07:12:879161 (CST), [SEC-1347], 2336528/293366, SLOT 2 | FID 128, INFO, CC-MA001-SANX7-1, LDAP server 10.236.91.139 reachable, but failed to validate or authorize the user account 'svc_bs_brocade_local'., ldap_config.c, line: 1237, comp:weblinker, ltime:2025/07/22-
Resolution
デフォルトでは、Gen7システムでは、フロー モニターが有効になっています。ただし、FOS v9.1.0以降を実行しているスイッチでフロー監視が無効になっている場合、この問題が発生する可能性があります。この問題は、Flow VisionライセンスがインストールされていないGen6プラットフォームでも発生する可能性があります
回避策:
フロー モニターをアクティブ化します。
flow --activate sys_flow_monitor
Flow VisionライセンスのないGen6システムでは、この問題が修正されたFOSバージョンにアップグレードしてください。
- FOS9.1.1d6RN-クローズド
- FOS9.2.0c3RN-クローズド
- FOS9.2.1bRN-クローズド
- FOS9.2.2aRN-クローズド
Additional Information
ドキュメントのレビュー:
Dell Connectrix BシリーズFabric OSリリース ノート