PowerEdge: Problemas de oscilação da interface do SONiC e da NIC Intel
Riepilogo: Os clientes enfrentaram problemas de oscilação de interface com a NIC Intel X710 e o transceptor PKR0R nos switches SONiC 4.4.0.
Sintomi
O oscilamento da interface ocorre durante reinicializações do servidor ou testes OIR, causando disrupções operacionais. O problema persistiu mesmo após a substituição da NIC do Intel X550 pelo Intel X710.
Firmware, drivers e versões do sistema operacional:
- Versão do firmware da NIC Intel X710:
22.5.7 - Versão do driver de NIC do Intel X710:
2.5.11.0 - Versão do firmware do NIC Intel E810:
23.0.8 - Versão do driver do NIC Intel E810:
2.5.11.0 - Versão do sistema operacional:
SONiC 4.4.0
Para identificar o problema de oscilação da interface nos registros do switch, procure mensagens repetidas indicando que o status operacional da porta muda com frequência. Por exemplo:
NOTICE swss#orchagent: :- updatePortOperStatus: Port Eth1/1 oper state set from up to down
NOTICE swss#orchagent: :- updatePortOperStatus: Port Eth1/1 oper state set from down to up
Números de peça da Dell para NICs:
- NIC do Intel X710: Dell P/N
K5V44 - NIC Intel E810: Dell P/N
VK88G - NIC do BCM57416 Broadcom: Dell P/N
3TM39
Tempo estimado para o novo código: Nenhum código novo é necessário, pois o problema foi resolvido por meio da substituição de hardware.
Causa
Requisitos do transceptor PKR0R: Os transceptores PKR0R exigem dois W de energia para funcionar com eficiência.
A NIC Intel X710 fornece até 1,5 W de energia, o que é insuficiente para os transceptores PKR0R, levando a problemas de oscilação da interface.
Risoluzione
O problema foi resolvido substituindo a NIC Intel X710 por uma NIC Intel E810, o que eliminou com sucesso a interface oscilando.
Soluções temporárias:
desligar e reativar a interface no lado do switch após uma reinicialização do servidor ou substituição do cabo.
Usando NICs alternativos, como a Broadcom BCM57416, que também não mostrou problemas de oscilação durante os testes de laboratório.
Placas OCP: As placas OCP não são afetadas por esse problema de oscilação porque usam uma arquitetura diferente que não é suscetível aos mesmos problemas de compatibilidade observados com o NIC Intel X710 e o transceptor PKR0R.