PowerEdge:当 Mellanox 25 Gb NIC 端口总数超过 8 个时,nmlx5_core驱动程序将停用端口

摘要: 当 Mellanox 25 Gb 网络接口控制器 (NIC) 端口总数超过 8 个时,ESXi 8.0 U2 中的 nmlx5_core 驱动程序将停用网络端口。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

如果向 ESXi 8.0 U2 提供超过 8 个 Mellanox 25 Gb NIC 端口,系统最多可识别 8 个 Mellanox 25 Gb 端口。
ESXi 8.0 U2 最多只能识别八个 Mellanox 25 Gb 端口。
或者,在升级到 ESXi 8.0 U2 后,Mellanox 驱动程序会停用服务器上超过 8 个的任何 Mellanox 25 Gb 端口。

 

日志片段:

2024-04-22T16:06:29.514Z In(182) vmkernel: cpu7:2097654)<NMLX_ERR> nmlx5_core: 0000:b1:00.0: nmlx5_core_PfAttach - (nmlx5_core_main.c:3040) done, status: Failure
2024-04-22T16:06:29.514Z In(182) vmkernel: cpu7:2097654)<NMLX_ERR> nmlx5_core: core: nmlx5_core_AttachLocked - (nmlx5_core_main.c:3293) nmlx5_core_PfAttach failed: Failure
2024-04-22T16:06:29.514Z Wa(180) vmkwarning: cpu7:2097654)WARNING: <NMLX_ERR> vmk_HashRelease failed - Busy
2024-04-22T16:06:30.529Z Al(177) vmkalert: cpu0:2097654)ALERT: <NMLX_ERR> WARN ON: [1] FW resources leak detected
2024-04-22T16:06:30.529Z Wa(180) vmkwarning: cpu0:2097654)WARNING: <NMLX_WRN> 0000:b1:00.0: Device's health is compromized: NIC deactivated
2024-04-22T16:06:30.529Z Wa(180) vmkwarning: cpu0:2097654)WARNING: <NMLX_WRN> FW CMD ent 31 has been released with timeout MANAGE_PAGES (0x108)
2024-04-22T16:06:30.529Z Wa(180) vmkwarning: cpu0:2097654)WARNING: <NMLX_WRN> 0000:b1:00.0: MANAGE_PAGES(0x108) timeout. Will cause a leak of a command resource
2024-04-22T16:06:30.529Z Wa(180) vmkwarning: cpu0:2097654)WARNING: <NMLX_ERR> failed reclaiming pages
2024-04-22T16:06:30.529Z Wa(180) vmkwarning: cpu0:2097654)WARNING: <NMLX_WRN> Failed reclaiming pages (195887137)
2024-04-22T16:06:30.529Z Wa(180) vmkwarning: cpu0:2097654)WARNING: <NMLX_WRN> Time limit expired to reclaim startup pages
2024-04-22T16:06:30.529Z Wa(180) vmkwarning: cpu0:2097654)WARNING: <NMLX_WRN> Unclaimed FW pages: peerPF 0, VFs 0, PF/ECPF 4773. Trying fast teardown
2024-04-22T16:06:30.529Z Wa(180) vmkwarning: cpu22:2097927)WARNING: <NMLX_WRN> 0000:b1:00.0: Device's health is compromized: NIC deactivated

原因

ESXi 8.0 U2 中的特定问题触发了此行为。

解决方案

修复
修复已合并到 ESXi 8.0 U3 驱动程序版本 4.23.6.2 中。
戴尔自定义的 ESXi 8.0 U3 映像于 2024 年 6 月发布。

对于 VxRail 解决方案,ESXi 8.0 U3 将于 2024 年 9 月之后推出。
有关 VxRail 解决方案的详细陈述,请查看:VxRail:当 Mellanox 25 Gb NIC 端口总数超过 8

个时,nmlx5_core驱动程序将停用端口解决方法
将 ESXi 降级到版本 8.0 U1 以避免此问题。

受影响的产品

Mellanox Family of Adapters, VMware ESXi 8.x

产品

PowerFlex rack, C Series, Modular Infrastructure, Rack Servers, Tower Servers, XR Servers, PowerFlex appliance R650, PowerFlex appliance R6525, PowerFlex appliance R660, PowerFlex appliance R6625, Powerflex appliance R750, PowerFlex appliance R760 , PowerFlex appliance R7625, PowerFlex appliance R640, PowerFlex appliance R740XD, PowerFlex appliance R7525, PowerFlex appliance R840 ...
文章属性
文章编号: 000224354
文章类型: Solution
上次修改时间: 02 5月 2025
版本:  6
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。