Data Domain:DDVE 檔案系統關閉/無法啟用 DDVE 檔案系統
Summary: 無法啟動 DDVE 檔案系統。
Symptoms
DDVE 檔案系統關閉。
作用層磁碟無法使用。
作用層顯示:
sysadmin@DD1# filesys show space
使用層:
資源大小 GiB 已使用 GiB Avail GiB Use% 可清理 GiB*
---------------- -------- -------- --------- ---- --------------
/data: pre-comp - - - -
- /data: post-comp - - - - - -
/ddvar 49.2 10.0 36.7 21% -
/ddvar/core 158.5 7.0 143.5 5% -
---------------- -------- -------- --------- ---- --------------
檔案系統目前無法使用。
Cause
在與外部儲存裝置連接的 ESX 上設定 DDVE 的系統環境。
當外部儲存裝置失去與 ESXi 主機的連線能力時,就會發生上述問題。
ESX 伺服器 vmkernel 記錄中回報下列錯誤
記錄位置 #cd /var/log/vmkernel.log
cpu4:2098003)ScsiDeviceIO:3032: Cmd(0x45a2c0b7ca80) 0x2a,CmdSN 0x3bf從世界2305853到開發「naa.6006016001f049003b705c5cde10cdfc」(vmhba5:C0:T5:L1) 失敗 H:0x8 D:0x0 P:0x0
cpu8:2098003)ScsiDeviceIO:3032: Cmd(0x459ac13b9340) 0x28,CmdSN 0x2e7從世界2305853到開發「naa.6006016001f0490045705c5c730bd671」(vmhba5:C0:T5:L7) 失敗 H:0x8 D:0x0 P:0x0
cpu7:2098003)ScsiDeviceIO:3032: Cmd(0x45a2c0a2a380) 0x88,CmdSN 0x368從世界2305853到開發「naa.6006016001f049003d705c5ccf627f86」(vmhba5:C0:T5:L3) 失敗 H:0x8 D:0x0 P:0x0
cpu8:2098003)ScsiDeviceIO:3032: Cmd(0x45a319d16c00) 0x8a,CmdSN 0x33e從世界2305853到開發「naa.6006016001f049003f705c5c47140d37」(vmhba5:C0:T5:L5) 失敗 H:0x8 D:0x0 P:0x0
cpu5:2098003)ScsiDeviceIO:3047: Cmd(0x45a31708cb00) 0x2a,CmdSN 0x39a從世界2305853到開發「naa.6006016007f04900c272965b8bff4a05」(vmhba5:C0:T5:L11) 失敗 H:0x8 D:0x0 P:0x0 無效感應資料:
0x0 0x0 0x0 CPU0:66299)ScsiDeviceIO:2954: Cmd(0x4397ba4ea9c0) 0x4d,CmdSN 0x88555a從世界613487900到開發「naa.500003981809326d」失敗 H:0x0D:0x2 P:0x0 有效感應資料:0x5 0x24 0x0。
CPU10:615767554)<6>USB USB2:恢復
的CPU20:615767554)<6>USB 2-1:恢復
的CPU1:66060)<6>USB 2-1:暫停的
CPU3:66074)<6>USB USB2:暫停
的CPU10:613606886 opID=9b42f169)世界:12235: VC opID esxcli-4e-1f1a 對應至 vmkernel opID 9b42f169
cpu10:613606886 opID=9b42f169)vmw_ahci[00000011]: scsiDiscover:channel=0, target=0, lun=0, action = 0
cpu10:613606886 opID=9b42f169)vmw_ahci[00000011]: scsiDiscover:No media
cpu10:613606886 opID=9b42f169)vmw_ahci[00000011]: scsiDiscover:channel=0, target=1, lun=0, action=0
cpu10:613606886 opID=9b42f169)vmw_ahci[00000011]: scsiDiscover:無媒體
cpu10:613606886 opID=9b42f169)vmw_ahci[0000001f]: scsiDiscover:channel=0, target=0, lun=0, action = 0
cpu10:613606886 opID=9b42f169)vmw_ahci[0000001f]: scsiDiscover:連接埠初始化未完成
cpu10:613606886 opID=9b42f169)vmw_ahci[0000001f]: scsiDiscover:channel=0, target=1, lun=0, action=0
從記錄中,您可以看到下列裝置已故障:
naa.6006016001f049003b705c5cde10cdfc
naa.6006016001f0490045705c5c5c730bd671 naa.6006016001f049003d705c5ccf627f86
naa.6006016001f049003f705c5c47140d37
naa.6006016007f04900c272965b8bff4a05
naa.500003981809326d
除上述內容外,還將發佈以下警報:
cpu13:2097909)警示:PowerPath:路徑 vmhba5:C0:T5:L3 至 APM00183214618 已失效。
cpu13:2097909)警示:PowerPath:路徑 vmhba5:C0:T5:L0 至 APM00183214618 已失效。
cpu13:2097909)警示:PowerPath:路徑 vmhba5:C0:T5:L7 至 APM00183214618 已失效。
cpu13:2097909)警示:PowerPath:路徑 vmhba5:C0:T5:L5 至 APM00183214618 已失效。
cpu13:2097909)警示:PowerPath:路徑 vmhba5:C0:T5:L9 至 APM00183214618 已失效。
cpu13:2097909)警示:PowerPath:路徑 vmhba5:C0:T5:L11 至 APM00183214618 已失效。
cpu13:2097909)警示:PowerPath:路徑 vmhba5:C0:T5:L6 至 APM00183214618 已失效。
cpu13:2097909)警示:PowerPath:路徑 vmhba5:C0:T5:L4 至 APM00183214618 已失效。
cpu13:2097909)警示:PowerPath:路徑 vmhba5:C0:T5:L2 至 APM00183214618 已失效。
cpu13:2097909)警示:PowerPath:路徑 vmhba5:C0:T5:L8 至 APM00183214618 已失效。
cpu13:2097909)警示:PowerPath:路徑 vmhba5:C0:T5:L10 至 APM00183214618 已失效。
cpu13:2097909)警示:PowerPath:路徑 vmhba5:C0:T5:L1 至 APM00183214618 已失效。
此外,還注意到 vmhbaX 上會有丟幀事件:
VMHBA5:觀察到的丟幀事件表示光纖通道鏈路/交換機有問題!
Resolution
- 檢查連線路徑 (vmhbaX:C0:T5:LX),並重新建立交換器和外部儲存裝置之間的連線。
- 建立連線後,「vmkernel.log」中會確認沒有其他故障的裝置報告。
- 重新開機 DDVE。
如果在完成上述工作後問題仍然存在,請收集下列項目並聯絡 DELL EMC DD 支援:
- DDVE 的支援套裝。
- 從 ESXi 伺服器產生套裝。
- 來自連線交換器的記錄。