PowerEdge: Problemi di instabilità della scheda di rete Intel e dell'interfaccia SONiC
Riepilogo: I clienti hanno riscontrato problemi di instabilità dell'interfaccia con la scheda di rete Intel X710 e il ricetrasmettitore PKR0R sugli switch SONiC 4.4.0.
Sintomi
Lo instabilità dell'interfaccia si verifica durante i riavvii del server o i test OIR, causando interruzioni operative. Il problema persisteva anche dopo la sostituzione della scheda di rete Intel X550 con Intel X710.
Versioni del firmware, dei driver e del sistema operativo:
- Versione firmware Intel X710 NIC:
22.5.7 - Versione driver scheda di rete Intel X710:
2.5.11.0 - Versione firmware Intel E810 NIC:
23.0.8 - Versione driver Intel E810 NIC:
2.5.11.0 - Versione sistema operativo:
SONiC 4.4.0
Per identificare il problema di instabilità dell'interfaccia nei registri degli switch, cercare messaggi ripetuti che indicano che lo stato operativo della porta cambia frequentemente. Ad esempio:
NOTICE swss#orchagent: :- updatePortOperStatus: Port Eth1/1 oper state set from up to down
NOTICE swss#orchagent: :- updatePortOperStatus: Port Eth1/1 oper state set from down to up
Numeri parte Dell per NIC:
- Scheda di rete Intel X710: Dell P/N
K5V44 - Scheda di rete Intel E810: Dell P/N
VK88G - Broadcom BCM57416 scheda di rete: Dell P/N
3TM39
Tempo stimato per il nuovo codice: Non è richiesto alcun nuovo codice poiché il problema è stato risolto tramite la sostituzione dell hardware.
Causa
Requisiti del ricetrasmettitore PKR0R: I ricetrasmettitori PKR0R richiedono due W di potenza per funzionare efficacemente.
La scheda di rete Intel X710 fornisce fino a 1,5 W di potenza, insufficiente per i ricetrasmettitori PKR0R, con conseguenti problemi di instabilità dell'interfaccia.
Risoluzione
Il problema è stato risolto sostituendo la scheda di rete Intel X710 con una scheda di rete Intel E810, eliminando con successo lo sfarfallio dell'interfaccia.
Soluzioni alternative:
arresto e riabilitazione dell'interfaccia sul lato switch dopo il riavvio del server o la sostituzione del cavo.
Utilizzo di schede di rete alternative, come Broadcom BCM57416, che non hanno mostrato problemi di instabilità durante i test di laboratorio.
Schede OCP: Le schede OCP non sono interessate da questo problema di instabilità perché utilizzano un'architettura diversa che non è soggetta agli stessi problemi di compatibilità riscontrati con la scheda di rete Intel X710 e il ricetrasmettitore PKR0R.