VPLEX: O componente Extent e Distributed Device entrou no estado de falha crítica após a criação de um dispositivo distribuído
Resumo: Este artigo fala sobre quando um Virtual Volume e um dispositivo distribuído (DD) mostram uma falha grave, enquanto a extensão e o componente DD entraram no estado de falha crítica e o que fazer. ...
Sintomas
Depois de criar um dispositivo distribuído, o componente de dispositivo distribuído e de extensão do dispositivo conectado passou para o estado de "falha crítica".
Exemplo de resultado:
VPlexcli:/> show-use-hierarchy clusters/cluster-*/virtual-volumes/S_OSL_V1V2-PROD_12 storage-view: OSL-V1V2-TEST_Y3 (cluster-2-Y3) storage-view: OSL-V1V2-TEST_D1 (cluster-1-D1) consistency-group: cg_D1 (synchronous) virtual-volume: S_OSL_V1V2-PROD_12 (2T, minor-failure, distributed @ cluster-1-D1, running) distributed-device: dd_VNX_0914_206_1_vol_1 (2T, raid-1, minor-failure) distributed-device-component: device_VNX_0914_206_1_vol_12019Jun06_095143 (2T, raid-0, cluster-1-D1) extent: extent_VNX_0914_206_1_vol_1 (2T) storage-volume: VNX_0914_206_1_vol (2T) logical-unit: VPD83T3:600601601e203900ec02e3ae3f88e911 storage-array: EMC-CLARiiON-CKM00142500914 distributed-device-component: device_VNX_1278_111_1_vol_1 (2T, raid-0, critical-failure, cluster-2-Y3) <<<<< extent: extent_VNX_1278_111_1_vol_1 (2T, critical-failure) <<<<< storage-volume: VNX_1278_111_1_vol (2T) logical-unit: VPD83T3:6006016013c03900a73fc8313f88e911 storage-array: EMC-CLARiiON-CKM00143801278
Causa
Depois de conectar um trecho espelhado a um dispositivo existente, a extensão do dispositivo conectado atingiu uma falha crítica. Isso pode ocorrer porque uma recriação foi inicializada e o dispositivo está sendo recriado.
Isso pode ser verificado nos logs do firmware:
128.221.253.37/cpu0/log:5988:W/"0060165465f564526-2":48947:<6>2019/06/06 09:51:46.55: amf/7 Added mirror to amf "device_VNX_0914_206_1_vol_1": added amf "device_VNX_1278_111_1_vol_1" into slot 1 128.221.253.36/cpu0/log:5988:W/"0060165468b17011-2":46412:<6>2019/06/06 09:51:46.56: amf/7 Added mirror to amf "device_VNX_0914_206_1_vol_1": added amf "device_VNX_1278_111_1_vol_1" into slot 1 128.221.252.37/cpu0/log:5988:W/"0060165465f564526-2":48961:<5>2019/06/06 09:59:17.53: amf/21 raid 1 rebuild: device_VNX_0914_206_1_vol_1: child node 1 (device_VNX_1278_111_1_vol_1) rebuild started (full rebuild, rebuild line 2475072 blocks)
Verifique o status da extensão. A extensão pode ser marcada como desatualizada desde a recriação:
VPlexcli:/> ll /clusters/cluster-2-Y3/storage-elements/extents/extent_VNX_1278_111_1_vol_1 /clusters/cluster-2-Y3/storage-elements/extents/extent_VNX_1278_111_1_vol_1: Name Value ----------------------------- ------------------------------------------------ application-consistent false block-count 536870912 block-offset 0 block-size 4K capacity 2T description - health-indications [out of date] <<<<< health-state critical-failure <<<<< io-status alive itls 0x50001442906ca510/0x500601610860538d/9, 0x50001442906ca511/0x500601600860538d/9, 0x50001442906ca510/0x500601680860538d/9, 0x50001442906ca511/0x500601690860538d/9, 0x50001442806c8d11/0x500601600860538d/9, 0x50001442806c8d10/0x500601610860538d/9, 0x50001442806c8d10/0x500601680860538d/9, 0x50001442806c8d11/0x500601690860538d/9, 0x50001442906c8d11/0x500601690860538d/9, 0x50001442906c8d10/0x500601610860538d/9, ... (16 total) locality - operational-status error storage-volume VNX_1278_111_1_vol storage-volumetype normal system-id SLICE:206c8db5c53ed089 thin-capable false underlying-storage-block-size 512 use used used-by [device_VNX_0914_206_1_vol_1] vendor-specific-name DGC
Resolução
-
Verifique o status da recriação para verificar se a recriação ainda está em execução no dispositivo:
VPlexcli:/> rebuild status [1] storage_volumes marked for rebuild Global rebuilds: device rebuild type rebuilder director rebuilt/total percent finished throughput ETA --------------------------- ------------ ------------------ ------------- ---------------- ---------- --------- device_VNX_0914_206_1_vol_1 full s1_6985_spa 1.44T/2T 72.13% 171M/s 57.1min
-
Você deve aguardar até que a recriação seja concluída para fazer isso, execute o comando na etapa 1 novamente após o tempo alocado mostrado para o ETA para ver se a recriação foi concluída:
VPlexcli:/> rebuild status Global rebuilds: No active global rebuilds. Local rebuilds: No active local rebuilds.
-
Depois de ver que a recriação foi concluída, execute o seguinte comando novamente para garantir que o estado de falha crítica tenha sido removido:
show-use-hierarchyVPlexcli:/> show-use-hierarchy clusters/cluster-*/virtual-volumes/S_OSL_V1V2-PROD_12 storage-view: OSL-V1V2-TEST_Y3 (cluster-2-Y3) storage-view: OSL-V1V2-TEST_D1 (cluster-1-D1) consistency-group: cg_D1 (synchronous) virtual-volume: S_OSL_V1V2-PROD_12 (2T, distributed @ cluster-2-Y3, running) distributed-device: dd_VNX_0914_206_1_vol_1 (2T, raid-1) distributed-device-component: device_VNX_0914_206_1_vol_12019Jun06_095143 (2T, raid-0, cluster-1-D1) extent: extent_VNX_0914_206_1_vol_1 (2T) storage-volume: VNX_0914_206_1_vol (2T) logical-unit: VPD83T3:600601601e203900ec02e3ae3f88e911 storage-array: EMC-CLARiiON-CKM00142500914 distributed-device-component: device_VNX_1278_111_1_vol_1 (2T, raid-0, cluster-2-Y3) <<<< extent: extent_VNX_1278_111_1_vol_1 (2T) <<<< storage-volume: VNX_1278_111_1_vol (2T) logical-unit: VPD83T3:6006016013c03900a73fc8313f88e911 storage-array: EMC-CLARiiON-CKM00143801278
-
Se, após o "status de reconstrução", mostrar que as reconstruções foram concluídas e você executar a "show-use-hierarchy", o dispositivo distribuído e o dispositivo ainda serão exibidos em um estado de "falha crítica", você deverá verificar a integridade do volume de armazenamento. Se o volume de armazenamento estiver em uma "falha crítica", consulte os artigos da Base de conhecimento:
Abra um chat on-line com o serviço de atendimento ao cliente da Dell Technologies para obter assistência adicional e consulte este artigo.