Data Domain: Intel Interfaces linkes sammen med tx_timeout
Summary: Datadomæner med Intel-kortgrænsefladelinks kan gå ned, tx_timeout gendannelse mislykkes, enheden er i en uoprettelig tilstand.
Symptoms
Følgende fejllogfiler findes i kern.info.
kernel: [13023278.800638][T14886] (E4)irdma: probe of ice.roce.5 failed with error -110
kernel: [13023278.800833][ C9] (E4)ice 0000:ae:00.0 eth8a: tx_timeout: VSI_num: 8, Q 41, NTC: 0x1bd, HW_HEAD: 0x1cb, NTU: 0x1cc, INT: 0x4000000
kernel: [13023278.800834][ C9] (E4)ice 0000:ae:00.0 eth8a: tx_timeout recovery level 1, txqueue 41
kernel: [13022896.344077][ C7] (E4)ice 0000:0b:00.0 eth2a: tx_timeout recovery unsuccessful, device is in unrecoverable state.
Du kan få vist de kern.info logfiler med følgende kommando:
log view debug/platform/kern.info
Du kan også tjekke supportpakken ind ved at gå til platformen og samle fejlloggene ovenfor.
Cause
Der er et problem i Intel irdma Føreren inden for irdma_wait_pe_ready Funktion. Når RDMA er deaktiveret i BIOS, udfører funktionen en spin-vent i op til 15 sekunder. Denne langvarige centrifugeringsventetid kan udløse RCU-stalls, hvilket forhindrer nogle CPU'er i at blive planlagt til at håndtere TX- og RX-afbrydelser. Som følge heraf kan der opstå timeout for netværkskortsende- og modtagelseshandlinger. Dette problem opstår under systemgenstartsfasen.
Resolution
Opgrader til DDOS 8.4 eller nyere versioner.
Rettelsen reducerer varigheden af spin-ventetiden fra 15 til 1,5 sekunder, hvilket eliminerer problemet.