Data Domain : Les interfaces Intel établissent une liaison avec tx_timeout
Summary: Les domaines de données avec cartes Intel, les liaisons d’interface peuvent tomber en panne avec tx_timeout restauration infructueuse, l’appareil est dans un état irrécupérable.
Symptoms
Les journaux d’erreurs suivants se trouvent dans kern.info.
kernel: [13023278.800638][T14886] (E4)irdma: probe of ice.roce.5 failed with error -110
kernel: [13023278.800833][ C9] (E4)ice 0000:ae:00.0 eth8a: tx_timeout: VSI_num: 8, Q 41, NTC: 0x1bd, HW_HEAD: 0x1cb, NTU: 0x1cc, INT: 0x4000000
kernel: [13023278.800834][ C9] (E4)ice 0000:ae:00.0 eth8a: tx_timeout recovery level 1, txqueue 41
kernel: [13022896.344077][ C7] (E4)ice 0000:0b:00.0 eth2a: tx_timeout recovery unsuccessful, device is in unrecoverable state.
Vous pouvez afficher les journaux kern.info à l’aide de la commande suivante :
log view debug/platform/kern.info
Vous pouvez également archiver le bundle de support en accédant à la plate-forme et en prenant en charge les logs d’erreurs ci-dessus.
Cause
Il y a un problème dans le irdma pilote dans le irdma_wait_pe_ready . Lorsque RDMA est désactivé dans le BIOS, la fonction effectue un spin-wait pendant un maximum de 15 secondes. Cette attente prolongée peut déclencher des blocages de la RCU, empêchant ainsi la planification de certains processeurs pour gérer les interruptions d’émission et de réception. Par conséquent, les opérations de transmission et de réception de la carte NIC peuvent expirer. Ce problème se produit lors de la phase de redémarrage du système.
Resolution
Effectuez une mise à niveau vers DDOS 8.4 ou versions supérieures.
Le correctif réduit la durée d’attente de rotation de 15 à 1,5 seconde, éliminant ainsi le problème.