PowerFlex: Initialiser replikering på nytt etter replikeringspause
Summary: Konsistensgruppen for replikering kan bli slettet av ulike årsaker, og replikeringen mellom kilde- og målområder stopper. Felles for alle saker er avviklingen av journalkapasiteten.
Symptoms
Fra kommandolinjen kan vi finne advarsler som sier "volumer i brutte replikeringskonsistensgrupper."
# scli --query_all_replication_pairs
query_all_replication_pairs returned 0 Replication Pairs.
WARNING: The System contains 2 volumes in broken replication consistency groups
# scli --query_all_replication_consistency_groups
Protection Domain aef4ce8300000000 Name: RHEL7-PD
WARNING: The Protection Domain contains 2 volumes in broken replication consistency groups
Fra brukergrensesnittet har statusen Replication Consistency Groups (RCGs) følgende feilmelding "RCG-er ble slettet av systemet".

Formålet med disse loggfilene er å muliggjøre jevn reinitialisering av replikering mellom områdene. Loggfilene brukes til å starte replikeringsprosessen på nytt raskt etter at årsaken til bruddet er løst.
Cause
Eksempler på årsaker som kan forårsake replikeringspause:
a. Lang nettverksfeil mellom kilde- og målsteder
b. Plutselig reduksjon av kapasiteten på kilde- eller målområdene – for eksempel i et scenario med Data utilgjengelig (DU)
Når replikeringen er brutt, sletter MDM-en automatisk alle replikeringskonsistensgruppene (RCG-er) mellom kilde- og målområdene. Og det genererer replikeringsloggfiler som inneholder all informasjon relatert til de slettede RCG-ene.
Resolution
en. Finn loggfilene for autogenerering av replikeringsbrytere under primær MDM med neste format –
Auto-DeletedOnEndOfJournalCapacityRplCg_<RCG_ID>_<RCG_name>
Eksempel:
# cd /opt/emc/scaleio/mdm/logs
# ls -l AutoDelete*
-rw-r--r-- 1 root root 953 Apr 14 12:15 AutoDeletedOnEndOfJournalCapacityRplCg_4ca1bc9600000000_Rep_Beta1
b. Kontroller at problemet som førte til at replikeringen ble ødelagt, er løst.
c. Initialiser replikering på nytt ved hjelp av én av følgende to metoder: Ved hjelp av skript eller manuelt.
Bruke skript:
-
Generer én fil som har alle relevante kommandoer fra de autogenererte loggfilene for å initialisere replikering på nytt
Eksempel:
for i in `ls /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacity*`;do sed -e '1,/Recreation CLIs/d' $i >> full_replication_restore_$(date +%s); done -
Valider at filen ble opprettet og innholdet i den
Eksempel:
[root@112AX-7 logs]# cat full_replication_restore_1587387678 scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_sanity --source_volume_id 0da61f0d00000003 --destination_volume_id 1981bbaf00000005 --copy_type full scli --add_replication_consistency_group --replication_consistency_group_name rcg_SANITY2 --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_SANITY2 --source_volume_id 0da61f2500000000 --destination_volume_id 1981bbb000000006 --copy_type full scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity3 --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_sanity3 --source_volume_id 0da61f2600000001 --destination_volume_id 1981bbb100000007 --copy_type full [root@112AX-7 logs]# -
Gjør den genererte filen kjørbar, logg deretter på som administrator for den primære MDM-en og kjør den opprettede filen.
Eksempel:
# scli --login --username admin --password xxxxxxxxxx Logged in. User role is SuperUser. System ID is xxxxxxxxxxxxxxx # # chmod +x full_replication_restore_1587387678 ; ./full_replication_restore_1587387678 Successfully created Replication Consistency Group rcg_sanity. Object ID 357a6c4f00000001 Successfully created the Pair, ID = a1f1819900000001 Successfully created Replication Consistency Group rcg_SANITY2. Object ID 357a6c5300000003 Successfully created the Pair, ID = a1f1819a00000002 Successfully created Replication Consistency Group rcg_sanity3. Object ID 357a6c5500000005 Successfully created the Pair, ID = a1f1819b00000003 - Kontrollere at opprettingen av replikeringen var vellykket ved å kjøre
-
scli --query_all_replication_consistency_groups scli --query_all_replication_pairs
-
Manuelt:
-
Kontroller at hvert RCG-kort som ble slettet automatisk, har en automatisk generert loggfil:
Eksempel:
# ls /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacity* /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacityRplCg_357a454600000001_rcg_sanity /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacityRplCg_357a6c4b00000002_rcg_SANITY2 /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacityRplCg_357a6c4c00000003_rcg_sanity3 -
Gjenta de neste trinnene for hver fil i listen i trinn 1 ovenfor
a. Kontroller at CLI-kommandoene ble generert, og kontroller at de har relevant informasjon under Rekreasjons-CLIEksempel:
#cat AutoDeletedOnEndOfJournalCapacityRplCg_357a6c4900000001_rcg_sanity REPLICATION CONSISTENCY GROUP LocalId:357a6c4900000001 RemoteId:4ca1e3ab00000001 Name:rcg_sanity PeerMdmId:416af83800000000 RpoSeconds:60 Direction:LOCAL_TO_REMOTE DRState:NONE DeletionDecisionTime:20/04 08:37:35 DeletionReason:AUTOMATIC_ON_END_OF_CAPACITY FailureDomainId:b3dd0a5900000000 RemoteFailureDomainId:4ff0744e00000000 PAIR 0 LocalId:a1f1819600000001 RemoteId:2dfad1c100000001 LocalVolumeId:0da61f0d00000003 LocalVolumeName:test1 RemoteVolumeId:1981bbaf00000005 RemoteVolumeName:test1 Recreation CLIs: scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_sanity --source_volume_id 0da61f0d00000003 --destination_volume_id 1981bbaf00000005 --copy_type fullb. Kjør alle kommandoene som vises under delen "Recreation CLIs"
Eksempel:
# scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access Successfully created Replication Consistency Group rcg_sanity. Object ID 357a6c4f00000001 [root@112AX-7 logs]# scli --add_replication_pair --replication_consistency_group_name rcg_sanity --source_volume_id 0da61f0d00000003 --destination_volume_id 1981bbaf00000005 --copy_type full Successfully created the Pair, ID = a1f1819900000001 [root@112AX-7 logs]# -
Kontrollere at opprettingen av replikeringen var vellykket ved å kjøre
-
scli --query_all_replication_consistency_groups scli --query_all_replication_pairs
-