PowerFlex: Reinicializar a replicação após a interrupção da replicação
Summary: O grupo de consistência de replicação pode ser excluído por vários motivos, e a replicação entre os locais de origem e destino é interrompida. O ponto em comum para todos os casos é o fim da capacidade de registro. ...
Symptoms
Na linha de comando, podemos encontrar mensagens de advertência informando "volumes em grupos de consistência de replicação quebrados".
# scli --query_all_replication_pairs
query_all_replication_pairs returned 0 Replication Pairs.
WARNING: The System contains 2 volumes in broken replication consistency groups
# scli --query_all_replication_consistency_groups
Protection Domain aef4ce8300000000 Name: RHEL7-PD
WARNING: The Protection Domain contains 2 volumes in broken replication consistency groups
Na interface do usuário, o status dos RCGs (Replication Consistency Groups, grupos de consistência de replicação) tem o seguinte erro: RCGs were deleted by the system.

O objetivo desses arquivos de log é permitir a reinicialização tranquila da replicação entre os locais. Os arquivos de registros são usados para reiniciar rapidamente o processo de replicação depois que a causa da interrupção for resolvida.
Cause
Exemplos de motivos que podem causar interrupção da replicação:
a. Falha de rede longa entre os locais
de origem e destinob) Diminuição repentina da capacidade nos locais de origem ou destino — por exemplo, em um cenário de dados indisponíveis (DU)
Depois que a replicação é interrompida, o MDM excluirá automaticamente todos os RCGs (Replication Consistency Groups, grupos de consistência de replicação) entre os locais de origem e destino. E gera arquivos de log de replicação que contêm todas as informações relacionadas aos RCGs excluídos.
Resolution
um. Localize os arquivos de log de interrupção de replicação de geração automática no MDM principal com o próximo formato -
Auto-DeletedOnEndOfJournalCapacityRplCg_<RCG_ID>_<RCG_name>
Exemplo:
# cd /opt/emc/scaleio/mdm/logs
# ls -l AutoDelete*
-rw-r--r-- 1 root root 953 Apr 14 12:15 AutoDeletedOnEndOfJournalCapacityRplCg_4ca1bc9600000000_Rep_Beta1
b. Confirme se o problema que causava a interrupção da replicação foi corrigido.
c. Reinicialize a replicação por um dos dois métodos a seguir: Usando script ou manualmente.
Usando o script:
-
Gere um arquivo que tenha todos os comandos relevantes dos arquivos de log gerados automaticamente para reinicializar a replicação
Exemplo:
for i in `ls /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacity*`;do sed -e '1,/Recreation CLIs/d' $i >> full_replication_restore_$(date +%s); done -
Valide se o arquivo foi criado e seu conteúdo
Exemplo:
[root@112AX-7 logs]# cat full_replication_restore_1587387678 scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_sanity --source_volume_id 0da61f0d00000003 --destination_volume_id 1981bbaf00000005 --copy_type full scli --add_replication_consistency_group --replication_consistency_group_name rcg_SANITY2 --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_SANITY2 --source_volume_id 0da61f2500000000 --destination_volume_id 1981bbb000000006 --copy_type full scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity3 --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_sanity3 --source_volume_id 0da61f2600000001 --destination_volume_id 1981bbb100000007 --copy_type full [root@112AX-7 logs]# -
Torne o arquivo gerado executável, faça log-in como administrador no MDM primário e execute o arquivo criado.
Exemplo:
# scli --login --username admin --password xxxxxxxxxx Logged in. User role is SuperUser. System ID is xxxxxxxxxxxxxxx # # chmod +x full_replication_restore_1587387678 ; ./full_replication_restore_1587387678 Successfully created Replication Consistency Group rcg_sanity. Object ID 357a6c4f00000001 Successfully created the Pair, ID = a1f1819900000001 Successfully created Replication Consistency Group rcg_SANITY2. Object ID 357a6c5300000003 Successfully created the Pair, ID = a1f1819a00000002 Successfully created Replication Consistency Group rcg_sanity3. Object ID 357a6c5500000005 Successfully created the Pair, ID = a1f1819b00000003 - Valide se a replicação foi criada com sucesso executando
-
scli --query_all_replication_consistency_groups scli --query_all_replication_pairs
-
Manualmente:
-
Verifique se cada RCG que foi excluído automaticamente tem um arquivo de log gerado automaticamente:
Exemplo:
# ls /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacity* /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacityRplCg_357a454600000001_rcg_sanity /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacityRplCg_357a6c4b00000002_rcg_SANITY2 /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacityRplCg_357a6c4c00000003_rcg_sanity3 -
Repita as próximas etapas para cada arquivo na lista da etapa 1 acima
a. Verifique se os comandos da CLI foram gerados e valide se ela tem as informações relevantes nas CLIs de recreaçãoExemplo:
#cat AutoDeletedOnEndOfJournalCapacityRplCg_357a6c4900000001_rcg_sanity REPLICATION CONSISTENCY GROUP LocalId:357a6c4900000001 RemoteId:4ca1e3ab00000001 Name:rcg_sanity PeerMdmId:416af83800000000 RpoSeconds:60 Direction:LOCAL_TO_REMOTE DRState:NONE DeletionDecisionTime:20/04 08:37:35 DeletionReason:AUTOMATIC_ON_END_OF_CAPACITY FailureDomainId:b3dd0a5900000000 RemoteFailureDomainId:4ff0744e00000000 PAIR 0 LocalId:a1f1819600000001 RemoteId:2dfad1c100000001 LocalVolumeId:0da61f0d00000003 LocalVolumeName:test1 RemoteVolumeId:1981bbaf00000005 RemoteVolumeName:test1 Recreation CLIs: scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_sanity --source_volume_id 0da61f0d00000003 --destination_volume_id 1981bbaf00000005 --copy_type fullb. Execute todos os comandos exibidos na seção "CLIs de recreação"
Exemplo:
# scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access Successfully created Replication Consistency Group rcg_sanity. Object ID 357a6c4f00000001 [root@112AX-7 logs]# scli --add_replication_pair --replication_consistency_group_name rcg_sanity --source_volume_id 0da61f0d00000003 --destination_volume_id 1981bbaf00000005 --copy_type full Successfully created the Pair, ID = a1f1819900000001 [root@112AX-7 logs]# -
Valide se a replicação foi criada com sucesso executando
-
scli --query_all_replication_consistency_groups scli --query_all_replication_pairs
-