IO 负载高时 ESXi 紫屏

摘要: 当 I/O 负载较高时,随机出现紫色屏幕。没有明显的 SAN 问题或与阵列相关的问题。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

环境:硬件戴尔 9116 交换机
VMware OS:ESXi 任何版本(首次在 ESXi 7.0.3 中出现)

紫屏前出现大量“路径失败”和“路径有疑问”:

紫屏屏幕截图:
VMware ESXi 7.0.3 [Releasebuild-21313628 x86_64]
#PF Exception 14 in world 2496356:vmm1:VA1PWCS IP 0x420023bf41db addr 0x28
PTEs:0x0;
cr0=0x80050031 cr2=0x28 cr3=0x815439b000 cr4=0x152668
FMS=06/55/7 uCode=0x5003302
frame=0x453a3061b730 ip=0x420023bf41db err=0x0 rflags=0x10206
rax=0x0 rbx=0x431655444ec0 rcx=0x76
rdx=0x49 rbp=0xc rsi=0x420023c91d46
rdi=0x4309a8b1da20 r8=0x1 r9=0x78a78c
r10=0xd78a78c r11=0x453a3061b640 r12=0x5fc
r13=0x43165559f160 r14=0x0 r15=0x1
*PCPU11:2496356/vmm1:VA1PWCSQL840
PCPU  0: SVVVVVVVVVVVVVVVSVSVVSVVVSVSVSSV
Code start: 0x420022c00000 VMC uptime: 22:18:04:37:412
0x453a3061b7f0:[0x420023bf41db]qedfc_process_error_detect@(qedf)#<None>+0x537 stack: 0x41ffe2ceb830
0x453a3061b840:[0x420023bd01da]qedfc_fp_process_cqes@(qedf)#<None>+0x47f stack: 0x420022cddf68
0x453a3061b890:[0x420023bd08a3]qed_msix_fp_int@(qedf)#<None>+0x18 stack: 0x4302b5832580
0x453a3061b8b0:[0x420022cde0e3]IntrCookieBH@vmkernel#nover+0x17c stack: 0x453a3061b8d0
0x453a3061b940:[0x420022cc0367]BH_DrainAndDisableInterrupts@vmkernel#nover+0x170 stack: 0x0
0x453a3061b9c0:[0x420022cdfce6]IntrCookie_VmkernelInterrupt@vmkernel#nover+0xb3 stack: 0xffffffffffffff8a
0x453a3061b9e0:[0x420022d55aac]IDT_IntrHandler@vmkernel#nover+0x9d stack: 0x0
0x453a3061ba00:[0x420022d4e067]gate_entry@vmkernel#nover+0x68 stack: 0x0
0x453a3061bac8:[0x420022c84608]Power_ArchPerformWait@vmkernel#nover+0x70 stack: 0x420042c00980
0x453a3061bad0:[0x420022c84776]Power_ArchSetCState@vmkernel#nover+0x8f stack: 0x0
0x453a3061bb20:[0x420022fae43c]CpuSchedIdleLoopInt@vmkernel#nover+0x275 stack: 0x420042c00100
0x453a3061bb90:[0x420022fb2502]CpuSchedDispatch@vmkernel#nover+0x1aff stack: 0x420042c00140
0x453a3061bdd0:[0x420022fb3257]CpuSchedWait@vmkernel#nover+0x2f4 stack: 0x7
0x453a3061bf50:[0x420022fb37ee]CpuSched_VcpuHalt@vmkernel#nover+0x13f stack: 0x453a3061f000
0x453a3061bfa0:[0x420022d2d313]VMMVMKCall_Call@vmkernel#nover+0x108 stack: 0x0
0x453a3061bfe0:[0x420022d59489]VMKVMM_ArchEnterVMKernel@vmkernel#nover+0xe stack: 0x420022d5947c
base fs=0x0 gs=0x420042c00000 Kgs=0x0

原因

该问题被确定为 9116 交换机问题(每组机箱中有两个这样的交换机),该问题使 FCoE 数据混乱。

解决方案

如果您遇到此问题,请将 MX7000 机箱、交换机和刀片式服务器上的固件升级到最新的合格版本。

受影响的产品

PowerEdge MX7000

产品

VMware
文章属性
文章编号: 000214640
文章类型: Solution
上次修改时间: 13 5月 2025
版本:  5
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。