Data Domain: Intel Interfaces koppelen uit tx_timeout
Riepilogo: Datadomeinen met interfacekoppelingen van Intel kaarten kunnen uitvallen en tx_timeout herstel mislukt, apparaat bevindt zich in een onherstelbare staat.
Sintomi
De volgende foutlogbestanden zijn te vinden in kern.info.
kernel: [13023278.800638][T14886] (E4)irdma: probe of ice.roce.5 failed with error -110
kernel: [13023278.800833][ C9] (E4)ice 0000:ae:00.0 eth8a: tx_timeout: VSI_num: 8, Q 41, NTC: 0x1bd, HW_HEAD: 0x1cb, NTU: 0x1cc, INT: 0x4000000
kernel: [13023278.800834][ C9] (E4)ice 0000:ae:00.0 eth8a: tx_timeout recovery level 1, txqueue 41
kernel: [13022896.344077][ C7] (E4)ice 0000:0b:00.0 eth2a: tx_timeout recovery unsuccessful, device is in unrecoverable state.
U kunt de kern.info logboeken bekijken met de volgende opdracht:
log view debug/platform/kern.info
U kunt de supportbundel ook controleren door naar het platform te navigeren en de bovenstaande foutlogboeken te bekijken.
Causa
Er is een probleem met de Intel irdma bestuurder binnen de irdma_wait_pe_ready Functie. Wanneer RDMA is uitgeschakeld in het BIOS, voert de functie een spin-wait uit van maximaal 15 seconden. Deze langdurige spin-wait kan ervoor zorgen dat RCU vastloopt, waardoor sommige CPU's niet kunnen worden gepland voor het verwerken van TX- en RX-onderbrekingen. Als gevolg hiervan kunnen er een time-out optreden bij NIC-verzend- en ontvangstbewerkingen. Dit probleem doet zich voor tijdens de herstartfase van het systeem.
Risoluzione
Upgrade naar DDOS 8.4 of hoger.
De oplossing verkort de spin-wachttijd van 15 naar 1,5 seconden, waardoor het probleem wordt geëlimineerd.