PowerEdge. Проблемы с отказами сетевых плат Intel и интерфейсов SONiC
Riepilogo: Заказчики испытывали проблемы с перебоями интерфейсов при использовании сетевых плат Intel X710 и приемопередатчика PKR0R на коммутаторах SONiC 4.4.0.
Sintomi
Во время перезагрузки сервера или тестов OIR происходит смена интерфейса, что приводит к прерыванию работы. Эта проблема сохранялась даже после замены сетевой платы Intel X550 на Intel X710.
Версии микропрограммы, драйверов и ОС:
- Версия микропрограммы Intel X710 NIC:
22.5.7 - Версия драйвера сетевой платы Intel X710:
2.5.11.0 - Версия микропрограммы Intel E810 NIC:
23.0.8 - Версия драйвера сетевой платы Intel E810:
2.5.11.0 - Версия операционной системы
SONiC 4.4.0
Чтобы определить проблему с прерыванием интерфейса в журналах коммутатора, поищите повторяющиеся сообщения, указывающие на частую смену рабочего состояния порта. Пример.
NOTICE swss#orchagent: :- updatePortOperStatus: Port Eth1/1 oper state set from up to down
NOTICE swss#orchagent: :- updatePortOperStatus: Port Eth1/1 oper state set from down to up
Номера по каталогу Dell для сетевых карт:
- Сетевая плата Intel X710: Dell P/N
K5V44 - Сетевая плата Intel E810: Dell P/N
VK88G - Сетевая плата Broadcom BCM57416: Dell P/N
3TM39
Расчетное время для нового кода: Новый код не требуется, так как проблема была устранена путем замены оборудования.
Causa
Требования к приемопередатчику PKR0R: Для эффективной работы приемопередатчикам PKR0R требуется два Вт мощности.
Сетевая плата Intel X710 обеспечивает мощность до 1,5 Вт, чего недостаточно для приемопередатчиков PKR0R, что приводит к проблемам с прерыванием интерфейса.
Risoluzione
Проблема устранена путем замены сетевой платы Intel X710 на сетевую плату Intel E810, которая успешно устранила разрывы интерфейса.
Временные решения:
Выключение и повторное включение интерфейса на стороне коммутатора после перезагрузки сервера или замены кабеля.
Использование альтернативных сетевых плат, таких как Broadcom BCM57416, которые также не показали проблем с вздутием во время лабораторных тестов.
Платы OCP: Платы OCP не подвержены этой проблеме, поскольку в них используется другая архитектура, которая не подвержена тем же проблемам совместимости, что и сетевая плата Intel X710 и приемопередатчик PKR0R.