Data Domain:DDVE 文件系统关闭/无法启用 DDVE 文件系统
Summary: 无法启动 DDVE 文件系统。
Symptoms
DDVE 文件系统关闭。
活动层磁盘不可用。
活动层显示:
sysadmin@DD1# filesys show space
Active Tier:
Resource Size GiB Used GiB Avail GiB Use% Cleanable GiB*
---------------- -------- -------- --------- ---- --------------
/data: pre-comp - - - - -
/data: post-comp - - - - - -
/ddvar 49.2 10.0 36.7 21% -
/ddvar/core 158.5 7.0 143.5 5% -
---------------- -------- -------- --------- ---- --------------
文件系统目前不可用。
Cause
在与外部存储设备连接的 ESX 上配置 DDVE 的系统环境。
当外部存储设备失去与 ESXi 主机的连接时,就会发生上述问题。
ESX 服务器 vmkernel 日志中报告以下错误
日志位置 #cd /var/log/vmkernel.log
cpu4:2098003)ScsiDeviceIO:3032: Cmd(0x45a2c0b7ca80) 0x2a,CmdSN 从世界2305853 0x3bf到开发“naa.6006016001f049003b705c5cde10cdfc”(vmhba5:C0:T5:L1) 失败 H:0x8 D:0x0 P:0x0
cpu8:2098003)ScsiDeviceIO:3032: Cmd(0x459ac13b9340) 0x28,CmdSN 0x2e7 从 world 2305853 到 dev “naa.6006016001f0490045705c5c730bd671” (vmhba5:C0:T5:L7) failed H:0x8 D:0x0 P:0x0
cpu7:2098003)ScsiDeviceIO:3032: Cmd(0x45a2c0a2a380) 0x88,CmdSN 从世界2305853 0x368到开发“naa.6006016001f049003d705c5ccf627f86”(vmhba5:C0:T5:L3) 失败 H:0x8 D:0x0 P:0x0
cpu8:2098003)ScsiDeviceIO:3032: Cmd(0x45a319d16c00) 0x8a,CmdSN 0x33e 从 world 2305853 到 dev “naa.6006016001f049003f705c5c47140d37” (vmhba5:C0:T5:L5) failed H:0x8 D:0x0 P:0x0
cpu5:2098003)ScsiDeviceIO:3047: Cmd(0x45a31708cb00) 0x2a,CmdSN 从世界2305853 0x39a到开发“naa.6006016007f04900c272965b8bff4a05”(vmhba5:C0:T5:L11) 失败 H:0x8 D:0x0 P:0x0 无效的检测数据:
0x0 0x0 0x0 cpu0:66299)ScsiDeviceIO:2954: Cmd(0x4397ba4ea9c0) 0x4d,CmdSN 0x88555a从世界613487900到开发“naa.500003981809326d”失败 H:0x0D:0x2 P:0x0 有效检测数据:0x5 0x24 0x0。
CPU10:615767554)<6>USB USB2:恢复
CPU20:615767554)<6>USB 2-1:恢复
CPU1:66060)<6>USB 2-1:暂停
CPU3:66074)<6>USB USB2:暂停
CPU10:613606886 opID=9b42f169)World:12235: VC opID esxcli-4e-1f1a 映射到 vmkernel opID 9b42f169
cpu10:613606886 opID=9b42f169)vmw_ahci[00000011]: scsiDiscover:channel=0, target=0, lun=0, action=0
cpu10:613606886 opID=9b42f169)vmw_ahci[00000011]: scsiDiscover:No media
cpu10:613606886 opID=9b42f169)vmw_ahci[00000011]: scsiDiscover:channel=0, target=1, lun=0, action=0
cpu10:613606886 opID=9b42f169)vmw_ahci[00000011]: scsiDiscover:无介质
cpu10:613606886 opID=9b42f169)vmw_ahci[0000001f]: scsiDiscover:channel=0, target=0, lun=0, action=0
cpu10:613606886 opID=9b42f169)vmw_ahci[0000001f]: scsiDiscover:端口初始化未完成
cpu10:613606886 opID=9b42f169)vmw_ahci[0000001f]: scsiDiscover:channel=0, target=1, lun=0, action=0
从日志中,您可以看到以下设备出现故障:
naa.6006016001f049003b705c5cde10cdfc
naa.6006016001f0490045705c5c730bd671 naa.6006016001f049003d705c5ccf627f86
naa.6006016001f049003f705c5c47140d37
naa.6006016007f04900c272965b8bff4a05
naa.500003981809326d
除上述内容外,还将发布以下警报:
cpu13:2097909)ALERT:PowerPath:Path vmhba5:C0:T5:L3 至 APM00183214618 无效。
cpu13:2097909)ALERT:PowerPath:Path vmhba5:C0:T5:L0 至 APM00183214618 无效。
cpu13:2097909)ALERT:PowerPath:Path vmhba5:C0:T5:L7 到APM00183214618无效。
cpu13:2097909)ALERT:PowerPath:Path vmhba5:C0:T5:L5 到APM00183214618无效。
cpu13:2097909)ALERT:PowerPath:Path vmhba5:C0:T5:L9 到APM00183214618无效。
cpu13:2097909)ALERT:PowerPath:Path vmhba5:C0:T5:L11 到APM00183214618无效。
cpu13:2097909)ALERT:PowerPath:Path vmhba5:C0:T5:L6 到APM00183214618无效。
cpu13:2097909)ALERT:PowerPath:Path vmhba5:C0:T5:L4 至 APM00183214618 无效。
cpu13:2097909)ALERT:PowerPath:Path vmhba5:C0:T5:L2 至 APM00183214618 无效。
cpu13:2097909)ALERT:PowerPath:Path vmhba5:C0:T5:L8 到APM00183214618无效。
cpu13:2097909)ALERT:PowerPath:Path vmhba5:C0:T5:L10 到APM00183214618无效。
cpu13:2097909)ALERT:PowerPath:Path vmhba5:C0:T5:L1 至 APM00183214618 无效。
此外,vmhbaX 上还会出现丢帧事件:
vmhba5:观察到的 FRAME DROP 事件表明光纤通道链路/交换机存在问题!
Resolution
- 检查连接路径 (vmhbaX:C0:T5:LX),并在交换机和外部存储设备之间重新建立连接。
- 建立连接后,确认“vmkernel.log”中不再报告发生故障的设备。
- 重新启动 DDVE。
如果在上述任务完成后问题仍然存在,请收集以下信息并联系 DELL EMC DD 支持:
- DDVE 的支持捆绑包。
- 从 ESXi 服务器生成捆绑包。
- 来自连接交换机的日志。