Falha no failover do teste do SRA: Falha ao criar snapshots de dispositivos de réplica
Summary:
Storage Replication Adapter (SRA) do Symmetrix Remote Data Facility (SRDF) Falha no failover de teste para alguns grupos de proteção em um plano de recuperação.
Error: Failed to create
snapshots of replica devices. Falha ao criar um snapshot do grupo de consistência da réplica . Falha do comando "testFailoverStart" do SRA para o grupo de consistência xx. Falha ao buscar informações de replicação. Verifique os registros EmcSrdfSra para obter mais informações sobre o erro.
...
Symptoms
Durante a execução de um failover de teste do SRDF SRA de um plano de recuperação contendo vários grupos de proteção, o failover de teste para alguns grupos de proteção apresentou falha com o erro:
Error: Failed to create snapshots of replica devices. Failed to create snapshot of replica consistency group xx. SRA command 'testFailoverStart' failed for consistency group xx. Failed to fetch replication information. Please check EmcSrdfSra logs for more information on the error.
A coluna EmcSrdfSraGlobalOptions.xml e o EmcSrdfSraTestFailoverConfig.xml Os arquivos estão configurados corretamente.
O failover de teste também apresentava falha quando os grupos de proteção afetados eram adicionados a planos de recuperação individuais e executavam o failover de teste, com o mesmo erro.
Cause
Foi detectado que os grupos de dispositivos do lado da recuperação de desastres (DR) entraram em um estado inválido. Isso é visto em um symdg list saída de comando do servidor SYMAPI do local de recuperação. Esse é o motivo pelo qual o failover de teste do SRA falhou.
Os seguintes erros são vistos no symapi.log:
EMC:SMBASE emcSymValidateGroup Group (DG_NAME) invalid; TGT dev (0x 200), Symm <array SN> ; reason; SYMAPI_C_DEV_IS_VVOL (The action cannot be performed because the specified device is a VVol device)
Verificou-se que havia alguns dispositivos VVol configurados e adicionados aos grupos de dispositivos (DG). Posteriormente, eles foram excluídos do array. Os grupos de dispositivos são baseados em host e definidos pelo usuário, portanto, excluir os dispositivos diretamente do PowerMax array não atualizará o grupo de dispositivos.
As informações do dispositivo excluído existiam no DG e o DG entrou em um estado inválido. Quando o failover do teste do SRA foi executado no DG inválido, ele falhou.
Resolution
- É recomendável certificar-se de que o DG seja válido antes de executar um failover de teste do SRA no mesmo.
- Se a etapa acima for perdida e o failover de teste do SRA tiver sido executado e falhar, o plano de ação abaixo poderá ajudar a recuperar a operação de failover do SRA.
- Exclua o DG e recrie-o do zero. Esta é a opção mais rápida.
-
symdg delete DGNAME -force symdg create DGNAME -type RDF2 --> RDF2 since the test failover will always happen on the Recovery Site. symdg -g DGNAME -sid <SN> add dev <dev_name>
-
OU
- Exporte o grupo para um arquivo, remova o dispositivo com problema, exclua o DG atual e importe o DG novamente do arquivo.
-
symdg export DGNAME -file <filename.txt> Update the file to contain only the devices that should be in the DG symdg delete DGNAME -force symdg import DGNAME -file <filename.txt>
-
- Execute o failover de teste do SRA.