Data Domain: Łącze interfejsu Intel z tx_timeout
Riepilogo: Domeny danych z kartami Intel Łącza interfejsu mogą przestać działać z powodu niepowodzenia odzyskiwania tx_timeout — urządzenie jest w stanie niemożliwym do odzyskania.
Sintomi
W kern.info znajdują się następujące dzienniki błędów.
kernel: [13023278.800638][T14886] (E4)irdma: probe of ice.roce.5 failed with error -110
kernel: [13023278.800833][ C9] (E4)ice 0000:ae:00.0 eth8a: tx_timeout: VSI_num: 8, Q 41, NTC: 0x1bd, HW_HEAD: 0x1cb, NTU: 0x1cc, INT: 0x4000000
kernel: [13023278.800834][ C9] (E4)ice 0000:ae:00.0 eth8a: tx_timeout recovery level 1, txqueue 41
kernel: [13022896.344077][ C7] (E4)ice 0000:0b:00.0 eth2a: tx_timeout recovery unsuccessful, device is in unrecoverable state.
Dzienniki kern.info można wyświetlić za pomocą następującego polecenia:
log view debug/platform/kern.info
Możesz również sprawdzić pakiet pomocy technicznej, przechodząc do platformy i grepping dzienników błędów powyżej.
Causa
Wystąpił problem z procesorem Intel irdma sterownik w obrębie irdma_wait_pe_ready . Po wyłączeniu funkcji RDMA w systemie BIOS funkcja ta wykonuje wirowanie przez maksymalnie 15 sekund. To wydłużone oczekiwanie na obrót może wywołać zatrzymanie RCU, uniemożliwiając niektórym procesorom zaplanowanie obsługi przerwań TX i RX. W rezultacie operacje nadawania i odbierania kart sieciowych mogą przekroczyć limit czasu. Ten problem występuje w trakcie fazy ponownego uruchamiania systemu.
Risoluzione
Uaktualnij do wersji DDOS 8.4 lub nowszej.
Poprawka skraca czas oczekiwania na wirowanie z 15 do 1,5 sekundy, eliminując problem.