Data Domain: Le interfacce Intel si collegano con tx_timeout
Summary: I domini dei dati con i link di interfaccia delle schede Intel potrebbero smettere di funzionare con tx_timeout ripristino non riuscito o dispositivo irrecuperabile.
Symptoms
In kern.info sono presenti i seguenti registri di errore.
kernel: [13023278.800638][T14886] (E4)irdma: probe of ice.roce.5 failed with error -110
kernel: [13023278.800833][ C9] (E4)ice 0000:ae:00.0 eth8a: tx_timeout: VSI_num: 8, Q 41, NTC: 0x1bd, HW_HEAD: 0x1cb, NTU: 0x1cc, INT: 0x4000000
kernel: [13023278.800834][ C9] (E4)ice 0000:ae:00.0 eth8a: tx_timeout recovery level 1, txqueue 41
kernel: [13022896.344077][ C7] (E4)ice 0000:0b:00.0 eth2a: tx_timeout recovery unsuccessful, device is in unrecoverable state.
È possibile visualizzare i registri kern.info con il seguente comando:
log view debug/platform/kern.info
È inoltre possibile archiviare il pacchetto di supporto accedendo alla piattaforma e grepping dei registri degli errori riportati sopra.
Cause
Si è verificato un problema nella irdma conducente all'interno del irdma_wait_pe_ready . Quando RDMA è disabilitato nel BIOS, la funzione esegue un'attesa di rotazione per un massimo di 15 secondi. Questa attesa di rotazione prolungata può attivare lo stallo della RCU, impedendo la pianificazione di alcune CPU per la gestione degli interrupt TX e RX. Di conseguenza, potrebbe verificarsi il timeout delle operazioni di trasmissione e ricezione della scheda di rete. Questo problema si verifica durante la fase di riavvio del sistema.
Resolution
Eseguire l'upgrade a DDOS 8.4 o versioni successive.
La correzione riduce la durata dell'attesa di rotazione da 15 a 1,5 secondi, eliminando il problema.