PowerEdge: Che cos'è un evento CTL137 e come risolverlo
Riepilogo: L'evento CTL137 è nuovo per il codice iDRAC 4.xx.xx.xx. L'evento CTL137 serve a notificare all'utente finale che iDRAC ha perso la comunicazione con un dispositivo endpoint all'interno del sistema. ...
Sintomi
Che cos'è un CTL137 Evento?
Le CTL137 l'evento è nuovo per il codice iDRAC 4.xx.xx.xx. La colonna CTL137 per notificare all'utente finale che l'iDRAC ha perso la comunicazione con un dispositivo endpoint all'interno del sistema.
Esempio:
" L SSD PCIe del controller di storage nello slot X dell'alloggiamento X non è in grado di comunicare con BMC perché il controller di storage o BMC non risponde ai comandi a causa di un errore interno o il bus è in uno stato di errore."
Causa
Cosa attiva un CTL137 Evento.
iDRAC esegue continuamente il polling dei dispositivi endpoint (unità NVMe, PERC e così via) su i2C all'interno del sistema per vari motivi (modifiche dello stato di integrità, temperatura e così via). Se un dispositivo endpoint non risponde a 10 consecutivi i2C esegue il polling, quindi iDRAC registra un CTL137 Evento. Per notificare all'utente finale che iDRAC ha perso la comunicazione con il dispositivo endpoint.
iDRAC invierà una notifica quando viene ripristinata la comunicazione?
Se la comunicazione i2C con il dispositivo endpoint viene ripristinata dopo un CTL137 viene generato. L'osservazione di un CTL138 L'evento informa l'utente che la comunicazione con il dispositivo endpoint è stata ripristinata.
Esempio:
"CTL138 Viene ripristinata la comunicazione tra l SSD PCIe del controller di storage nello slot X dell'alloggiamento X e il BMC"
Perché un ripristino dell'iDRAC risolve temporaneamente il problema.
Eseguendo un ripristino di iDRAC, si forza il sistema a effettuare nuovamente l'inventario dei dispositivi endpoint collegati. Inoltre, il contatore dell'errore del comando iDRAC per ogni dispositivo endpoint viene reimpostato su 0 per ogni dispositivo endpoint. Se il dispositivo endpoint non riesce a rispondere a 10 i2C esegue il polling, quindi iDRAC registra un CTL137 l'evento relativo a tale dispositivo endpoint.
Perché vedo un CTL137 e l'unità è ancora online all'interno del sistema operativo.
In alcune situazioni è possibile che l'unità sia ancora online all'interno del sistema operativo, ma viene visualizzato un errore CTL137 Evento. Ciò è dovuto al fatto che l'opzione i2C La comunicazione con le unità non passa attraverso i cavi dati. iDRAC invia tutte le comunicazioni SMBus utilizzando un singolo SIG Cavo che va dal planare al backplane. Il problema potrebbe riguardare questi componenti.
Risoluzione
Cosa cercare quando vedi un CTL137 Evento.
- Cercare i motivi ovvi per cui l'unità potrebbe non essere riuscita a rispondere a un
i2Csondaggio dell'iDRAC.- Un'unità si è guastata?
- Errore di formazione sul collegamento PCIe
- Errori di downtrain PCI
- Verificare che tutti i componenti all'interno dell'unità NVMe, del backplane e dell'iDRAC del sistema siano nel codice più recente.
- Dopo aver eseguito i passaggi 1 e 2 e se vengono ancora visualizzati eventi CTL137 ripetuti seguiti da
CTL138Eventi. È probabile che si verifichi un problema di segnale intermittente tra l'iDRAC e il dispositivo endpoint.- Tentare di riposizionare i cavi dell'unità e/o del backplane sulla pialla.