Avamar: Falha intermitente no backup de imagem da máquina virtual com o erro "vSphere Task failed"
Summary: Falha intermitente no backup de imagem da máquina virtual (VM) com o erro "vSphere Task failed (snapshot error=45): Há dois domínios de falha utilizáveis. A operação requer mais um domínio de falha utilizável" quando o equipamento VxRail gerencia o vCenter. ...
Symptoms
O backup apresenta falha na fase de criação do snapshot com os seguintes erros:
2023-08-06 23:06:32 avvcbimage Error <44034>: vSphere Task failed (snapshot error=45): 'There are currently 2 usable fault domains. The operation requires 1 more usable fault domains.'. 2023-08-06 23:06:32 avvcbimage Error <44020>: Snapshot 'Avamar-169136317118b22ef41ebc7a87342f2790f581058cfa460bfd' creation for VM '[VxRail-Virtual-SAN-Datastore-xxxx-xxxx-xx] xxx-xxxx-xxx/vm_name.vmx' task creation encountered a problem
Esse problema ocorre esporadicamente com VMs aleatórias que residem em um datastore vSAN gerenciado pelo VxRail.
A mesma mensagem de erro exibida acima é observada na IU do vSphere:
Create Snapshot message: There are currently 2 usable fault domains. The operation requires 1 more usable fault domains. --> An error occurred while taking a snapshot: Out of resources.

Cause
O VxRail usa o conceito de "domínios de falha". Os domínios de falha no vSAN são uma configuração opcional para melhorar a resiliência de um cluster do vSAN. Ele garante que os dados no cluster permaneçam disponíveis em caso de falha ou indisponibilidade de um único host ou de vários hosts.
De acordo com o seguinte artigo da KB da VMware: Não é possível fazer snapshots de VMs quando menos do que o mínimo necessário de hosts de uma política de armazenamento específica estão on-line , o vSAN requer um número mínimo de hosts para atender à política de armazenamento. Se um desses hosts ficar indisponível, o vSAN não permitirá o provisionamento de novos objetos, pois não há recursos suficientes para atender à política de armazenamento aplicada.
A análise da causa raiz dessa falha de backup indica que o host testemunha do vSAN está na política de backup. Não é recomendável fazer backup do host testemunha, pois as operações de snapshot podem causar a discrepância acima, que afeta outros backups em execução com os erros acima.
Resolution
Exclua o host testemunha do vSAN da política de backup.