Connectrix:Cisco:FC 模块 f32mac hap 重置并显示错误 SYSMGR-SLOT2-2-SERVICE_CRASHED

摘要: Cisco MDS 9700 此问题是由于以太网带外通道 (EOBC) 用于管理程序(活动和备用)与线卡之间的连接。有一种心跳机制可从两个监控程序监控线卡的状态。如果线卡 CPU 没有响应,高可用性策略中的预期作是重置线卡以使其恢复。这主要是由于线卡 CPU 中的硬件问题造成的。FC 模块 f32mac hap 重置并显示错误 SYSMGR-SLOT2-2-SERVICE_CRASHED:服务“f32mac”(PID 1515) 未捕获信号 6 ...

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

例如:在此场景中重新加载了模块 2:
 

  1.  
show system reset-reason module 2
*************** module reset reason (2) *************
Time stamp   : At 770092 usecs after Tue Jun 13 01:09:33 2023

Service name : System manager
Reset reason : f32mac hap reset => [Failures < MAX] : powercycle
Serial number: JAE22130B20
Error code   : 1075708042
  1. 显示日志记录日志:
2023 Jun 13 01:08:51 MDS9706-ALD-B401 %MODULE-4-MOD_WARNING: Module 2 (Serial number: JAE22130B20) reported warning 2/1-2/0 due to EOBC heartbeat failure on standby sup in device DEV_EOBC_MAC (device error 0xc0a0404f)
2023 Jun 13 01:08:51 MDS9706-ALD-B401 %MODULE-4-MOD_WARNING: Module 2 (Serial number: JAE22130B20) reported warning 2/1-2/0 due to EOBC heartbeat failure in device DEV_EOBC_MAC (device error 0xc0a0414d)
2023 Jun 13 01:08:58 MDS9706-ALD-B401 %MODULE-4-MOD_WARNING: Module 2 (Serial number: JAE22130B20) reported warning 2/1-2/0 due to LC CPU not responding in device DEV_EOBC_MAC (device error 0xc0a0405c)
2023 Jun 13 01:08:58 MDS9706-ALD-B401 %KERN-2-SYSTEM_MSG: [83387768.461104] LC [slot:2] CPU not responding... LC Status 0xf8 - kernel
2023 Jun 13 01:09:11 MDS9706-ALD-B401 %SYSMGR-SLOT2-2-SERVICE_CRASHED: Service "f32mac" (PID 1515) hasn't caught signal 6 (core will be saved).
2023 Jun 13 01:09:19 MDS9706-ALD-B401 %MODULE-2-MOD_DIAG_FAIL: Module 2 (Serial number: JAE22130B20) reported failure 2/1-2/0due to Service on line card had a hap-reset in device DEV_SYSMGR (device error 0xa1a)
  1. 检查以下命令的输出: show hardware internal ipc-channel event-log
     
[Jun 13 01:08:51.968971 2023]  31) Event:HB_RX_TIMEOUT, length:8, at 968971 usecs after Tue Jun 13 01:08:51 2023

原因

  • 此问题是由于以太网带外通道 (EOBC) 用于管理程序(活动和备用)与线卡之间的连接。
  • 有一种心跳机制可从两个监控程序监控线卡的状态。如果线卡 CPU 没有响应,高可用性策略中的预期作是重置线卡以使其恢复。
  • 这主要是由于线卡 CPU 中的硬件问题造成的。

解决方案

  1. 重新加载后检查模块状态,并使用命令确认其是否联机 #show module
  2. 如果模块联机,则无需执行进一步作 
  3. 如果模块关闭或卡在关闭状态,请更换 FC 模块。 

受影响的产品

Connectrix MDS-9706, Connectrix MDS-9706-V2, Connectrix MDS-9710, Connectrix MDS-9710-V2, Connectrix MDS-9718, Connectrix MDS-9718-V3, Connectrix MDS-Series Hardware
文章属性
文章编号: 000215059
文章类型: Solution
上次修改时间: 03 6月 2025
版本:  2
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。