Dell EMC Unity:ESX 主机间歇性失去与阵列的连接。(用户可纠正)

Summary: ESX 主机间歇性连接问题

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms



ESX 主机间歇性断开与 Unity 存储平台的连接。

告警定义:
([事件告警表达式:存储连接中断] 或 [事件警报表达式:失去存储路径冗余] 或 [事件警报表达式:降级存储路径冗余] 或 [事件警报表达式:失去与 NFS 服务器的连接])

事件详细信息:
存储设备 naa.6006016025204100706def5772e9095f 的路径冗余已降级。路径 vmhba3:C0:T5:L21 关闭。受影响的数据存储区:Unity500_LUN21。

Cause

在日志中找到 SCSi 错误:

=============================================================
H:0x1:如果与 LUN 的连接丢失,则返回此状态。如果 LUN 不再对主机从阵列端可见,或者与阵列的物理连接已被移除,则可能会发生这种情况。
-----------------------------------------------------------------------------------------------------------------
2016-10-10T01:10:49.806Z cpu11:33575)WARNING:NMP: nmpCompleteRetryForPath:352:在路径“vmhba1:C0:T5:L84”H:0x1 D:0x0 P:0x0 可能的检测数据上重试 0x413685483f40 0x28 dev “naa.60060160252041004864f657ca48a0e5” 失败 H: D: P: 可能的检测数据:0x5 0x0 0x0。
2016-10-10T01:10:49.808Z cpu11:33575)WARNING:NMP: nmpCompleteRetryForPath:352:在路径“vmhba1:C0:T5:L82”H:0x1 D:0x0 P:0x0 上重试 dev 0x412e803fc6c0 0x28“naa.6006016025204100b74df657aa54a7bd” 失败 可能的检测数据:0x5 0x25 0x0。
2016-10-10T01:10:50.809Z cpu5:33575)NMP: nmp_ThrottleLogForDevice:2458:Cmd 0x28 (0x413685364040, 32840) to dev “naa.60060160252041002ba1f4577351fc3c” on path “vmhba1:C0:T5:L80”失败:H:0x1 D:0x0 P:0x0可能的检测数据:0x5 0x25 0x0.Act:FAILOVER



=============================================================H:0x2:当 HBA 驱动程序无法向设备发出命令时,将返回此状态。出现此状态的原因是环境中丢弃了 FCP 帧。
-----------------------------------------------------------------------------------------------------------------
2016-10-10T10:17:51.136Z cpu15:33575)ScsiDeviceIO:2331: Cmd(0x412e8315c000) 0x2a,CmdSN 从世界2262944 0x800e0036到开发“naa.6006016002302f00de17ed6898bde411”失败 H:0x2 D:0x0 P:0x0 可能的检测数据:0x0 0x0 0x0。
2016-10-10T10:17:51.136Z cpu15:33575)ScsiDeviceIO:2331: Cmd(0x412e8ae66100) 0x2a,CmdSN 从世界2262944 0x800e0054到开发“naa.6006016002302f00de17ed6898bde411”失败 H:0x2 D:0x0 P:0x0 可能的检测数据:0x0 0x0 0x0。
2016-10-10T10:17:51.743Z cpu0:33575)ScsiDeviceIO:2331: Cmd(0x412e88a0b640) 0x8a,CmdSN 从世界2262944 0x800e0056到开发“naa.6006016002302f00de17ed6898bde411”失败 H:0x2 D:0x0 P:0x0 可能的检测数据:0x0 0x0 0x0。

=============================================================
H:0x3:当传输到阵列的命令超时时,将返回此状态。
-----------------------------------------------------------------------------------------------------------------
2016-10-10T08:13:32.998Z cpu21:33002)VMW_SATP_ALUA: satp_alua_issueCommandOnPath:656:路径“vmhba1:C0:T4:L212”(UP)命令0xa3失败,状态为“超时”。H:0x3 D:0x0 P:0x0 可能的检测数据:0x0 0x0 0x0。
2016-10-10T09:03:11.383Z cpu20:33000)VMW_SATP_ALUA: satp_alua_issueCommandOnPath:656:路径“vmhba1:C0:T5:L80”(UP)命令0xa3失败,状态为超时。H:0x3 D:0x0 P:0x0 可能的检测数据:0x5 0x0 0x0。
2016-10-10T09:45:52.051Z cpu0:33001)VMW_SATP_ALUA: satp_alua_issueCommandOnPath:656:路径“vmhba1:C0:T5:L20”(UP)命令0xa3失败,状态为超时。H:0x3 D:0x0 P:0x0 可能的检测数据:0x0 0x0 0x0。

=============================================================
H:0x5:如果驱动程序在传输到目标的过程中中止命令,则返回此状态。这是由于帧中的命令超时或奇偶校验错误造成的。
------------------------------------------------------------------------------------------------------------------
2016-10-10T01:10:44.805Z cpu18:32823)ScsiDeviceIO:2369: Cmd(0x41368544c3c0) 0xfe、CmdSN 0x320b4 从 world 32797 到 dev “naa.60060160252041004864f657ca48a0e5” 失败 H:0x5 D:0x0 P:0x0 可能的检测数据:0x5 0x0 0x0。
2016-10-10T01:10:44.807Z cpu18:32823)ScsiDeviceIO:2369: Cmd(0x41368c890900) 0xfe、CmdSN 从 world 32797 0x44fe4到 dev “naa.60060160252041002ba1f4577351fc3c” 失败 H:0x5 D:0x0 P:0x0 可能的检测数据:0x5 0x0 0x0。
2016-10-10T01:10:44.807Z cpu18:32823)ScsiDeviceIO:2369: Cmd(0x412e88a0b280) 0xfe、CmdSN 0x484ae 从 world 32797 到 dev “naa.60060160252041003a25ee57beb061a2” failed H:0x5 D:0x0 P:0x0 可能的检测数据:0x0 0x0 0x0。

=============================================================
H:0x7:当由于存储启动器错误而重置设备时,将返回此状态。这通常是由于 HBA 固件过时,或者可能是(但很少)由于 HBA 损坏所致。
------------------------------------------------------------------------------------------------------------------
2016-10-10T10:12:31.471Z cpu22:33575)ScsiDeviceIO:2369: Cmd(0x412e82926d40) 0x8a,CmdSN 从世界2084335 0x80000055到开发“naa.6c81f66000cbf667000002865436a015”失败 H:0x7 D:0x0 P:0x0 可能的检测数据:0x0 0x0 0x0。
2016-10-10T10:17:32.475Z cpu14:33575)NMP: nmp_ThrottleLogForDevice:2458:命令0x8a(0x412e800334c0,2084335)到路径“vmhba1:C0:T0:L3”上的开发“naa.6c81f66000cbf667000002865436a015”失败:H:0x7 D:0x0 P:0x0 可能的检测数据:0x0 0x0 0x0。Act:EVAL
2016-10-10T10:17:32.475Z cpu14:33575)ScsiDeviceIO:2369: Cmd(0x412e800334c0) 0x8a,CmdSN 从世界2084335 0x8000004e到开发“naa.6c81f66000cbf667000002865436a015”失败 H:0x7 D:0x0 P:0x0 可能的检测数据:0x0 0x0 0x0。

===============================================================
H:0x8:当 HBA 驱动程序中止 I/O 时,将返回此状态。如果 HBA 重置目标,也会发生这种情况。
----------------------------------------------------------------------------------------------------------------------
2016-10-10T10:18:02.052Z cpu18:33575)ScsiDeviceIO:2369: Cmd(0x4136864a87c0) 0xfe、CmdSN 从 world 32797 0x4ae1c到 dev “naa.60060160252041002ba1f4577351fc3c” 失败 H:0x8 D:0x0 P:0x0 可能的检测数据:0x0 0x0 0x0。
2016-10-10T10:18:04.126Z cpu14:33575)ScsiDeviceIO:2313: Cmd(0x413689303d80) 0x28, CmdSN 0x4ae1b from world 34044 to dev “naa.60060160252041002ba1f4577351fc3c” failed H:0x8 D:0x0 P:0x0
2016-10-10T10:18:04.126Z cpu14:33575)ScsiDeviceIO:2313: Cmd(0x412e809d33c0) 0x28、CmdSN 从世界2448210 0x4ae1d到开发“naa.60060160252041002ba1f4577351fc3c”失败 H:0x8 D:0x0 P:0x0

===============================================================
State in Doubt错误 - 这些消息显示为主机总线适配器 (HBA) 驱动程序中止命令,因为该命令完成的时间超过 5 秒的超时期限。请参阅以下 vmware kb - https://kb.vmware.com/kb/1022026
---------------------------------------------------------------------------------------------------------------------
2016-10-10T10:54:06.947Z cpu0:33569)WARNING:NMP: nmp_DeviceRequestFastDeviceProbe:237:NMP 设备“naa.60060160252041001b77f7577dc86804”状态存疑;已请求快速路径状态更新...
2016-10-10T10:56:25.641Z cpu23:33569)WARNING:NMP: nmp_DeviceRequestFastDeviceProbe:237:NMP 设备“naa.6006016025204100d8f1f55717242522”状态存疑;已请求快速路径状态更新...
2016-10-10T10:56:30.602Z cpu12:33569)WARNING:NMP: nmp_DeviceRequestFastDeviceProbe:237:NMP 设备“naa.6006016025204100a85bf657846d3209”状态存疑;已请求快速路径状态更新...

Resolution

更改 SAN 交换机端口解决了问题。

Affected Products

Dell EMC Unity 500

Products

Dell Unity 300, Dell EMC Unity 400, Dell EMC Unity 500, Dell EMC Unity 600
Article Properties
Article Number: 000054771
Article Type: Solution
Last Modified: 12 ديسمبر 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.