Data Domain: Intel-gränssnittlänk med tx_timeout
Summary: Data Domains med Intel-korts gränssnittslänkar kan sluta fungera och tx_timeout återställningen misslyckas och enheten är i ett oåterkalleligt tillstånd.
Symptoms
Följande felloggar finns i kern.info.
kernel: [13023278.800638][T14886] (E4)irdma: probe of ice.roce.5 failed with error -110
kernel: [13023278.800833][ C9] (E4)ice 0000:ae:00.0 eth8a: tx_timeout: VSI_num: 8, Q 41, NTC: 0x1bd, HW_HEAD: 0x1cb, NTU: 0x1cc, INT: 0x4000000
kernel: [13023278.800834][ C9] (E4)ice 0000:ae:00.0 eth8a: tx_timeout recovery level 1, txqueue 41
kernel: [13022896.344077][ C7] (E4)ice 0000:0b:00.0 eth2a: tx_timeout recovery unsuccessful, device is in unrecoverable state.
Du kan visa kern.info-loggarna med följande kommando:
log view debug/platform/kern.info
Du kan också checka in supportpaketet genom att gå till plattform och hantera felloggarna ovan.
Cause
Det finns ett problem i Intel irdma föraren i den mening som avses i irdma_wait_pe_ready Funktion. När RDMA är inaktiverat i BIOS centrifugerar funktionen i upp till 15 sekunder. Den här utdragna spinnväntetiden kan utlösa RCU-stopp, vilket förhindrar att vissa processorer schemaläggs att hantera TX- och RX-avbrott. Därför kan NIC-överförings- och mottagningsåtgärder överskrida tidsgränsen. Problemet uppstår under omstart av systemet.
Resolution
Uppgradera till DDOS 8.4 eller senare versioner.
Korrigeringen minskar centrifugeringstiden från 15 till 1,5 sekunder, vilket eliminerar problemet.