RecoverPoint: Replikointiprosessi kaatuu, kun vaiheen 1 välimuisti ei riitä
Summary: Replikointi kaatuu, kun vaiheen 1 välimuisti ei riitä väitteeseen, mikä aiheuttaa uudelleenkäynnistyksen sääntelyn.
Symptoms
Consistency Group -ryhmän tila on edelleen alustuksessa, mutta normaalijakauma ei näytä koskaan alkavan eikä CG siirry aktiiviseen tilaan. Replikointiprosessi kaatuu ja vahvistus kirjataan lokiin, kun vaiheen 1 välimuisti ei riitä ja kohdepuolen RecoverPoint-laitteet eivät pysty kirjoittamaan kohdepäiväkirjaan. Oireet löytyivät lokista /home/kos/replication: Väite: XXXX/XX/XX 18:59:25.693 - #2 - 17936/16776 - AssertLogSender: lähetysloki: topic=DistributorGroupHandler, msg=Vahvistus epäonnistui: bIsPhase1CacheMemoryRiittävä rivi 1825 Tiedosto DistributorGroupHandlerPhase1.cc PID: 16776 Info: tavallisen vaiheen 1 välimuisti ei riitä m_GroupGridCopyRID = (groupCopyRID=(kVolSlot=XXXXXXXXXX,globalCopyID=GlobalCopy(SiteUID(0xXXXXXXXXXXXXXX) 0) ),gridCopyID=0) XXXX/XX/XX 18:59:25.694 - #2 - 16911/16776 - RemoteLogSender: got event (uniqueId=0, eventTime=1584471565693987), EventID_KBOX_ASSERTION_FAILED(3031), SiteUID(0xxxxxxxxxxxxxx), seDetails=Sender=replication, Topic=DistributorGroupHandler, msg=Vahvistus epäonnistui: bIsPhase1CacheMemoryRiittävä rivi 1825 Tiedosto DistributorGroupHandlerPhase1.cc PID: 16776 Info: tavallinen phase1-välimuisti ei riitä m_GroupGridCopyRID = (groupCopyRID=(kVolSlot=XXXXXXXXXX,globalCopyID=GlobalCopy(SiteUID(0xXXXXXXXXXXX) 0) ),gridCopyID=0) Tilastot, jotka osoittavat suurta tietovirtaa: XXXX/XX/XX 18:52:41.520 - #2 - 7676/7665 - AccumulatorFormatManager::p rintStatistics: Ryhmän tilastot Option( kVolSlot = XXXXXXXXXX groupUID = GroupCopy(1346840554 SiteUID(0xXXXXXXXXXXX) 0) gridID = 0): { TILASTOT: name=InitNCOnePhaseSpeed kVolSlot = 1346840554 groupUID = GroupCopy(1346840554 SiteUID(0xXXXXXXXXXXXXX) 0) gridID = 0 kuvaus: init nc yksi vaihenopeus . TILASTOT: name=InitNCOnePhaseSpeed kVolSlot = 1346840554 groupUID = GroupCopy(1346840554 SiteUID(0xXXXXXXXXXXXXX) 0) gridID = 0 8 sekunnin ikkuna: Keskiarvo: 1,14e+03 Mt/s TILASTOT: name=InitNCOnePhaseSpeed kVolSlot = 1346840554 groupUID = GroupCopy(1346840554 SiteUID(0xXXXXXXXXXXXXX) 0) gridID = 0 77 sekunnin ikkuna: Keskiarvo: 1,06e+03 Mt/s Consistency Group on alustustilassa: 2020/03/17 18:56:05.070 - #2 - 7954/7665 - InitNCState::D istributeOnePhase: yhden vaiheen jakaminen m_groupID = (groupCopyRID=( kVolSlot=XXXXXXXXXX,globalCopyID=GlobalCopy(SiteUID(0xXXXXXXXXXXXX) 0) ),gridCopyID=0) Tämän Consistency Group -ryhmän vaiheen 1 kuluttaja osoittaa suurta kulutusta väitteessä: XXXX/XX/XX 18:56:05.241 - #2 - 7954/7665 - MemoryManager: viscus on assert + lähtölaskenta = 2413/390 + väh. muistintarve = 433429 (kiinteä 329537 joustava 103892) + joustava käyttötila = 37977/3864963 + allastilan käyttö = 37985/4194500 (max 143544) >> 1160635626647715840 :p Hase1#22 >> (groupTaskID=(sessionID=1817723153,replicationLinkID=(kVolSlot=XXXXXXXXX,srcCopyID=GlobalCopy(SiteUID(0xXXXXXXXXXXXX) >> 0) ,destCopyID = GlobalCopy (SiteUID Replication StackTrace kokee myös: 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 3: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZNK6Kashya23DistributorGroupHandler21waitForMemoryIfNeededEv+0x5b2) [0xxxxxxxxxxxxx] 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 4: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZN6Kashya23DistributorGroupHandler25addSequencesToPhase1CacheENS_9SequencesERNS_15ReplicationModeE+0x939) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 5: /etusivu/kos/kashya/arkisto/lib/libreplication_libsrelease.so(_ZN6Kashya23DistributorGroupHandler23handleSplittedSequencesENS_9SequencesERKNS_15ReplicationModeERKb+0x20a) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 6: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZN6Kashya23DistributorGroupHandler15handleSequencesENS_9SequencesERKNS_15ReplicationModeERKb+0x577) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 7: /etusivu/kos/kashya/arkisto/lib/libreplication_libsrelease.so(_ZN6Kashya19Distributor_AO_IMPL23continueHandleSequencesENS_9SequencesENS_15ReplicationModeEbRKNS_10GridCopyIDE+0xf7) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 8: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZN6Kashya16SequencesRequest21continueHandleRequestERNS_28JournalRegulationRequestBase14RequestHandlerE+0x30b) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 9: /etusivu/kos/kashya/arkisto/lib/libreplication_libsrelease.so(_ZN6Kashya31JournalRegulationThread_AO_IMPL9process_iERKNS_16GroupGridCopyRIDE+0x36f)
Cause
Resolution
Kiertotapa: Muuta säädön arvo t_phase1CacheMemoryThreadSleepTime arvoon 5000. (Odotusajan pidentäminen 10 mikrosekunnista 5 millisekuntiin). Tämä varmistaa, että emme vakuuta ennen kuin lanka odottaa muistia 5 millisekuntia. Jos ongelma ilmenee edelleen: 1. Kerää myös tuotantolaitoksen lokit. Koska se ilmoittaa meille tuotannosta lähetettyjen tietojen määrän ongelman tekohetkellä. 2. Muuta tweakin arvo t_maxNoOfTriesToWaitForPhase1CacheMemory arvoon 10. Huomautus: Nämä muutokset koskevat vain versioita 5.1.3 ja uudempia. Jos koodiversio ei ole 5.1.3 tai uudempi, RecoverPoint TÄYTYY päivittää uusimpaan koodiin, jotta näitä muutoksia voidaan käyttää. Ratkaisu: Dell EMC Engineering tutkii ongelmaa parhaillaan. Pysyvä korjaus on tulossa. Ota yhteys Dell EMC:n asiakastukeen tai huoltoedustajaan ja mainitse tämän ratkaisun tunnus.