PowerFlex: Opětovná inicializace replikace po přerušení replikace

Summary: Skupina konzistence replikace může být odstraněna z různých důvodů a replikace mezi zdrojovou a cílovou lokalitou se zastaví. Společným důvodem pro všechny případy je ukončení kapacity Žurnálu. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

V příkazovém řádku se zobrazí varovné zprávy "svazky ve skupinách s přerušenou konzistencí replikace".

# scli --query_all_replication_pairs
query_all_replication_pairs returned 0 Replication Pairs.
WARNING: The System contains 2 volumes in broken replication consistency groups
 
# scli --query_all_replication_consistency_groups
Protection Domain aef4ce8300000000 Name: RHEL7-PD
WARNING: The Protection Domain contains 2 volumes in broken replication consistency groups

V uživatelském rozhraní se u stavu skupin konzistence replikace (RCG) zobrazuje následující chyba "RCG byly odstraněny systémem".

Stav RCG error.png

 

Účelem těchto souborů protokolu je umožnit plynulou opětovnou inicializaci replikace mezi lokalitami. Soubory protokolu se používají k rychlému restartování procesu replikace po vyřešení příčiny přerušení.
 

Cause

Příklady důvodů, které mohou způsobit přerušení replikace:
a. Dlouhé selhání sítě mezi zdrojovou a cílovou lokalitou
b. Náhlé snížení kapacity ve zdrojové nebo cílové lokalitě – například ve scénáři nedostupnosti dat (DU)

Po přerušení replikace MDM automaticky odstraní všechny skupiny konzistence replikace (RCG) mezi zdrojovým a cílovým umístěním. A generuje soubory protokolů replikace, které obsahují všechny informace související se smazanými RCG.

Resolution

a. Vyhledejte automaticky generované soubory protokolu přerušení replikace v primárním MDM v následujícím formátu: 

Automaticky DeletedOnEndOfJournalCapacityRplCg_<RCG_ID>_<RCG_name>

Příklad:

# cd /opt/emc/scaleio/mdm/logs
# ls -l AutoDelete*
-rw-r--r-- 1 root root 953 Apr 14 12:15 AutoDeletedOnEndOfJournalCapacityRplCg_4ca1bc9600000000_Rep_Beta1

b. Ověřte, zda je opraven problém, který způsobil přerušení replikace.

c. Znovu inicializujte replikaci jednou z následujících dvou metod: Pomocí skriptu nebo ručně.
 

Pomocí skriptu:

  1. Vygenerujte jeden soubor, který obsahuje všechny relevantní příkazy z automaticky generovaných souborů protokolu, aby bylo možné replikaci znovu inicializovat

    Příklad:

    for i in `ls /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacity*`;do sed -e '1,/Recreation CLIs/d' $i >> full_replication_restore_$(date +%s); done

     

  2. Ověřte, že byl soubor úspěšně vytvořen a jeho obsah

    Příklad:

    [root@112AX-7 logs]# cat full_replication_restore_1587387678
    scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access
    scli --add_replication_pair --replication_consistency_group_name rcg_sanity --source_volume_id 0da61f0d00000003 --destination_volume_id 1981bbaf00000005 --copy_type full
    scli --add_replication_consistency_group --replication_consistency_group_name rcg_SANITY2 --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access
    scli --add_replication_pair --replication_consistency_group_name rcg_SANITY2 --source_volume_id 0da61f2500000000 --destination_volume_id 1981bbb000000006 --copy_type full
    scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity3 --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access
    scli --add_replication_pair --replication_consistency_group_name rcg_sanity3 --source_volume_id 0da61f2600000001 --destination_volume_id 1981bbb100000007 --copy_type full
    [root@112AX-7 logs]#

     

  3. Nastavte vygenerovaný soubor jako spustitelný, poté se přihlaste jako správce k primárnímu uzlu MDM a vytvořený soubor spusťte.

    Příklad:

     
    # scli --login --username admin --password xxxxxxxxxx
    Logged in. User role is SuperUser. System ID is xxxxxxxxxxxxxxx
    #
    # chmod +x full_replication_restore_1587387678 ; ./full_replication_restore_1587387678
    Successfully created Replication Consistency Group rcg_sanity. Object ID 357a6c4f00000001
    Successfully created the Pair, ID = a1f1819900000001
    Successfully created Replication Consistency Group rcg_SANITY2. Object ID 357a6c5300000003
    Successfully created the Pair, ID = a1f1819a00000002
    Successfully created Replication Consistency Group rcg_sanity3. Object ID 357a6c5500000005
    Successfully created the Pair, ID = a1f1819b00000003
     

     

  4. Ověřte, zda byla replikace úspěšně vytvořena, spuštěním příkazu
    1. scli --query_all_replication_consistency_groups
      scli --query_all_replication_pairs

 

Ručně:

  1. Zkontrolujte, že každý RCG, který byl automaticky odstraněn, má automaticky generovaný soubor protokolu:

    Příklad:

     
    # ls /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacity*
    
    /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacityRplCg_357a454600000001_rcg_sanity
    /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacityRplCg_357a6c4b00000002_rcg_SANITY2
    /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacityRplCg_357a6c4c00000003_rcg_sanity3
     

     

  2. Opakujte další kroky pro každý soubor v seznamu v kroku 1 výše

    a. Zkontrolujte, že byly vygenerovány příkazy CLI, a ověřte, že jsou k dispozici relevantní informace v části Recreation CLIs

    Příklad:

    #cat AutoDeletedOnEndOfJournalCapacityRplCg_357a6c4900000001_rcg_sanity
    
    REPLICATION CONSISTENCY GROUP
    LocalId:357a6c4900000001
    RemoteId:4ca1e3ab00000001
    Name:rcg_sanity
    PeerMdmId:416af83800000000
    RpoSeconds:60
    Direction:LOCAL_TO_REMOTE
    DRState:NONE
    DeletionDecisionTime:20/04 08:37:35
    DeletionReason:AUTOMATIC_ON_END_OF_CAPACITY
    FailureDomainId:b3dd0a5900000000
    RemoteFailureDomainId:4ff0744e00000000
    PAIR 0
    LocalId:a1f1819600000001
    RemoteId:2dfad1c100000001
    LocalVolumeId:0da61f0d00000003
    LocalVolumeName:test1
    RemoteVolumeId:1981bbaf00000005
    RemoteVolumeName:test1
    Recreation CLIs:
    scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access
    scli --add_replication_pair --replication_consistency_group_name rcg_sanity --source_volume_id 0da61f0d00000003 --destination_volume_id 1981bbaf00000005 --copy_type full
     

     

    b. Spusťte všechny příkazy, které se zobrazí v části "Recreation CLIs"

    Příklad:

     
    # scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access
    Successfully created Replication Consistency Group rcg_sanity. Object ID 357a6c4f00000001
    [root@112AX-7 logs]# scli --add_replication_pair --replication_consistency_group_name rcg_sanity --source_volume_id 0da61f0d00000003 --destination_volume_id 1981bbaf00000005 --copy_type full
    Successfully created the Pair, ID = a1f1819900000001
    [root@112AX-7 logs]#
     
  3. Ověřte, zda byla replikace úspěšně vytvořena, spuštěním příkazu

    1. scli --query_all_replication_consistency_groups
      
      scli --query_all_replication_pairs

Affected Products

PowerFlex rack, ScaleIO, PowerFlex Software
Article Properties
Article Number: 000260985
Article Type: Solution
Last Modified: 03 Jul 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.