PowerEdge: Qué es un evento CTL137 y cómo solucionarlo
Resumen: El evento CTL137 es nuevo en el código iDRAC 4.xx.xx.xx. El evento CTL137 existe para notificar al usuario final que iDRAC perdió la comunicación con un dispositivo terminal dentro del sistema. ...
Síntomas
¿Qué es un CTL137 ¿Evento?
El CTL137 El evento es nuevo para el código iDRAC 4.xx.xx.xx. La variable CTL137 para notificar al usuario final que iDRAC perdió la comunicación con un dispositivo terminal dentro del sistema.
Ejemplo:
" La controladora de almacenamiento SSD PCIe en la ranura X de la bahía X no puede comunicarse con el BMC ya sea porque la controladora de almacenamiento o BMC no responde a los comandos debido a un error interno o el bus se encuentra en un estado de error".
Causa
¿Qué desencadena una CTL137 Evento.
La iDRAC sondea continuamente los dispositivos de punto final (unidades NVMe, PERC, etc.) en i2C canal dentro del sistema por diversas razones (cambios de estado, temperatura, etc.). Si un dispositivo terminal no responde a 10 i2C sondeos, entonces el iDRAC registra un CTL137 evento. Para notificar al usuario final que iDRAC perdió la comunicación con el dispositivo terminal.
¿Le notificará iDRAC cuando se restablezca la comunicación?
Si la comunicación i2C con el dispositivo terminal se restablece después de un CTL137 se genera. Observar un CTL138 Notifica al usuario que se ha restaurado la comunicación con el dispositivo de extremo.
Ejemplo:
"CTL138 Se restaura la comunicación entre la controladora de almacenamiento SSD PCIe en la ranura X de la bahía X y la BMC"¿
Por qué un restablecimiento de iDRAC resuelve temporalmente el problema?
Al realizar un restablecimiento de iDRAC, está forzando al sistema a volver a realizar un inventario de los dispositivos terminales conectados. Además, en el proceso, el contador fallido del comando de iDRAC para cada dispositivo terminal se restablece a 0 para cada dispositivo terminal. Una vez que el dispositivo terminal no responde a 10 i2C sondeos, entonces el iDRAC registra un CTL137 contra ese dispositivo de extremo.
¿Por qué veo un CTL137 evento y la unidad sigue en línea dentro del sistema operativo.
En algunas situaciones, es posible que vea que la unidad aún está en línea dentro del sistema operativo, pero ve un CTL137 evento. Esto se debe a que el i2C La comunicación con las unidades no pasa por los cables de datos. La iDRAC envía todas las comunicaciones SMBus mediante un único SIG Cable que va desde la placa madre hasta el backplane. Es posible que su problema esté relacionado con estos componentes.
Resolución
Lo que hay que tener en cuenta cuando se ve un CTL137 evento.
- Busque las razones obvias por las que la unidad puede no haber respondido a una
i2Csondeo desde iDRAC.- ¿Falló una unidad?
- Falla en la capacitación del enlace PCIe
- Errores de degradación de PCI
- Verifique que todos los componentes dentro de la unidad NVMe, el backplane y la iDRAC del sistema tengan el código más reciente.
- Después de realizar los pasos 1 y 2 y si aún ve eventos CTL137 repetidos seguidos de
CTL138eventos. Entonces, es probable que vea un problema de señal intermitente entre iDRAC y el dispositivo terminal.- Intente volver a insertar los cables de la unidad o del backplane en la cepilladora.