「Data Domain:DDVEファイルシステムがダウンしています/DDVEファイルシステムを有効にできません
Summary: DDVEファイル システムを起動できません。
Symptoms
DDVEファイルシステムがダウンしています。
アクティブ階層ディスクが使用できません。
アクティブ階層には次の情報が表示されます。
sysadmin@DD1# filesys show space
Active Tier:
Resource Size GiB Used GiB Avail GiB Use% Cleanable GiB*
---------------- -------- -------- --------- ---- --------------
/data: pre-comp - - - - -
/data: post-comp - - - - -
/ddvar 49.2 10.0 36.7 21% -
/ddvar/core 158.5 7.0 143.5 5% -
---------------- -------- -------- --------- ---- --------------
現在、ファイルシステムは使用できません。
Cause
外部ストレージ デバイスに接続されているESX上でDDVEが構成されているシステム環境。
上記の問題は、外部ストレージ デバイスがESXiホストとの接続を失った場合に発生します。
ESXサーバーのvmkernelログに次のエラーが報告されました
ログの場所 #cd/var/log/vmkernel.log
cpu4:2098003)ScsiDeviceIO: 3032: World 2305853 から dev "naa.6006016001f049003b705c5cde10cdfc" (vmhba5: C0: T5: L1) への Cmd (0x45a2c0b7ca80) 0x2a 0x3bf、CmdSN が失敗しました H: 0x8 D: 0x0 P: 0x0
cpu8: 2098003)ScsiDeviceIO: 3032: Cmd(0x459ac13b9340)0x28、CmdSN 0x2e7 from world 2305853 to dev "naa.6006016001f0490045705c5c730bd671" (vmhba5: C0: T5: L7) failed H: 0x8 D: 0x0 P: 0x0
cpu7:2098003)ScsiDeviceIO: 3032: Cmd(0x45a2c0a2a380)0x88、CmdSN 0x368がワールド 2305853からdev "naa.6006016001f049003d705c5ccf627f86"(vmhba5:C0:T5:L3)に失敗しましたH:0x8 D:0x0 P:0x0
cpu8:2098003)ScsiDeviceIO: 3032: Cmd(0x45a319d16c00)0x8a、CmdSN 0x33eがワールド 2305853からdev "naa.6006016001f049003f705c5c47140d37"(vmhba5:C0:T5:L5)に失敗しましたH:0x8 D:0x0 P:0x0
cpu5:2098003)ScsiDeviceIO: 3047: ワールド 2305853 から dev "naa.6006016007f04900c272965b8bff4a05" (vmhba5:C0:T5:L11) への Cmd(0x45a31708cb00) 0x2a、CmdSN 0x39a が失敗しました H: 0x8 D: 0x0 P: 0x0 無効なセンス データ: 0x0 0x0 0x0
cpu0:66299)ScsiDeviceIO: 2954: Cmd(0x4397ba4ea9c0) 0x4d、CmdSN 0x88555a from world 613487900 to dev "naa.500003981809326d" failed H: 0x0D:0x2 P: 0x0 有効なセンス データ: 0x5 0x24 0x0.
CPU10:615767554)<6>USB USB2:再開
CPU20:615767554)<6>USB 2-1:再開
CPU1:66060)<6>USB 2-1:中断
CPU3:66074)<6>USB USB2:中断
CPU10:613606886 opID = 9b42f169)World: 12235: VC opID esxcli-4e-1f1aはvmkernel opID 9b42f169
cpu10:613606886 opID=9b42f169)vmw_ahci[00000011]:scsiDiscover:channel=0、target=0、lun=0、action=0
cpu10:613606886 opID=9b42f169)vmw_ahci[00000011]:scsiDiscover:No media
cpu10:613606886 opID=9b42f169)vmw_ahci[00000011]:scsiDiscover:channel=0、target=1、lun=0、action=0
cpu10:613606886 opID=9b42f169)vmw_ahci[00000011]: scsiDiscover: メディアなし
cpu10: 613606886 opID=9b42f169)vmw_ahci[0000001f]: scsiDiscover: channel=0, target=0, lun=0, action=0
cpu10: 613606886 opID=9b42f169)vmw_ahci[0000001f]: scsiDiscover: ポートの初期化が完了していません
cpu10: 613606886 opID=9b42f169)vmw_ahci[0000001f]: scsiDiscover: channel=0, target=1, lun=0, action=0
ログから、次のデバイスに障害が発生したことを確認できます。
naa.6006016001f049003b705c5cde10cdfc
naa.6006016001f0490045705c5c730bd671
naa.6006016001f049003d705c5ccf627f86
naa.6006016001f049003f705c5c47140d37
naa.6006016007f04900c272965b8bff4a05
naa.500003981809326d
上記に加えて、次のアラートが表示されます。
cpu13:2097909)アラート: PowerPath:vmhba5:C0:T5:L3からAPM00183214618へのパスが停止しています。
cpu13:2097909)アラート: PowerPath:vmhba5:C0:T5:L0からAPM00183214618へのパスが無効です。
cpu13:2097909)アラート: PowerPath:vmhba5:C0:T5:L7からAPM00183214618へのパスが停止しています。
cpu13:2097909)アラート: PowerPath:vmhba5:C0:T5:L5からAPM00183214618へのパスが停止しています。
cpu13:2097909)アラート: PowerPath:vmhba5:C0:T5:L9からAPM00183214618へのパスが停止しています。
cpu13:2097909)アラート: PowerPath:vmhba5:C0:T5:L11からAPM00183214618へのパスが停止しています。
cpu13:2097909)アラート: PowerPath:vmhba5:C0:T5:L6からAPM00183214618へのパスが停止しています。
cpu13:2097909)アラート: PowerPath:vmhba5:C0:T5:L4からAPM00183214618へのパスが停止しています。
cpu13:2097909)アラート: PowerPath:vmhba5:C0:T5:L2からAPM00183214618へのパスが無効です。
cpu13:2097909)アラート: PowerPath:vmhba5:C0:T5:L8からAPM00183214618へのパスが停止しています。
cpu13:2097909)アラート: PowerPath:vmhba5:C0:T5:L10からAPM00183214618へのパスが停止しています。
cpu13:2097909)アラート: PowerPath:vmhba5:C0:T5:L1からAPM00183214618へのパスが停止しています。
さらに、vmhbaXでフレーム ドロップ イベントが発生します。
VMHBA5: 観察されたFRAME DROPイベントは、Fibre Channelリンク/スイッチに問題があることを示唆しています。
Resolution
- 接続パス(vmhbaX:C0:T5:LX)を確認し、スイッチと外部ストレージ デバイス間の接続を再確立します。
- 接続が確立されたら、障害が発生したデバイスが「vmkernel.log」でこれ以上報告されていないことを確認します。
- DDVEを再起動します。
上記のタスクが完了しても問題が解決しない場合は、以下を収集してDell EMC DDサポートにお問い合わせください。
- DDVEからのサポート バンドル。
- ESXiサーバーからバンドルを生成します。
- 接続スイッチからのログ。