RecoverPoint: Het replicatieproces loopt vast wanneer het cachegeheugen van fase 1 onvoldoende wordt
Summary: Replicatie crasht met fase1-cachegeheugen onvoldoende bevestiging waardoor herstartregelgeving wordt veroorzaakt.
Symptoms
De status van de consistentiegroep bevindt zich nog steeds in initialisatie, maar de normale distributie lijkt nooit te beginnen en de CG gaat niet over in een actieve status. Een replicatieproces loopt vast met een bevestiging geregistreerd, wanneer het cachegeheugen van fase 1 onvoldoende is en de RecoverPoint-apparaten aan de doelzijde niet naar het doeljournaal kunnen schrijven. Symptomen gevonden in /home/kos/replication logs: Bewering: XXXX/XX/XX 18:59:25.693 - #2 - 17936/16776 - AssertLogSender: sending log: topic=DistributorGroupHandler, msg=Assertion failed: bIsPhase1CacheMemorySufficient Line 1825 File DistributorGroupHandlerPhase1.cc PID: 16776 Info: regular phase1 cache memory not sufficient m_GroupGridCopyRID = (groupCopyRID=(kVolSlot=XXXXXXXXXX,globalCopyID=GlobalCopy(SiteUID(0xXXXXXXXXXXXXXX) 0) ),gridCopyID=0) XXXX/XX/XX 18:59:25.694 - #2 - 16911/16776 - RemoteLogSender: got event (uniqueId=0, eventTime=1584471565693987), EventID_KBOX_ASSERTION_FAILED(3031), SiteUID(0xxxxxxxxxxxxxxxxx), seDetails=Sender=replication, Topic=DistributorGroupHandler, msg=Assertion failed: bIsPhase1CacheMemorySufficient Line 1825 File DistributorGroupHandlerPhase1.cc PID: 16776 Info: regulier phase1 cachegeheugen niet voldoende m_GroupGridCopyRID = (groupCopyRID=(kVolSlot=XXXXXXXXXX,globalCopyID=GlobalCopy(SiteUID(0xXXXXXXXXXXX) 0) ),gridCopyID=0) Statistieken die een hoge gegevensstroom laten zien: XXXX/XX/XX 18:52:41.520 - #2 - 7676/7665 - AccumulatorFormatManager::p rintStatistics: Groepsstatistieken voor groep Option( kVolSlot = XXXXXXXXXX groupUID = GroupCopy(1346840554 SiteUID(0xXXXXXXXXXXX) 0) gridID = 0): { STATISTICS: name=InitNCOnePhaseSpeed kVolSlot = 1346840554 groupUID = GroupCopy(1346840554 SiteUID(0xXXXXXXXXXXXXX) 0) gridID = 0 description: init nc one phase speed . STATISTICS: name=InitNCOnePhaseSpeed kVolSlot = 1346840554 groupUID = GroupCopy(1346840554 SiteUID(0xXXXXXXXXXXXXX) 0) gridID = 0 8 sec window: Gemiddeld: 1,14e+03 MB/sec STATISTICS: name=InitNCOnePhaseSpeed kVolSlot = 1346840554 groupUID = GroupCopy(1346840554 SiteUID(0xXXXXXXXXXXXXX) 0) gridID = 0 77 sec window: Gemiddeld: 1,06e+03 MB/sec Een consistentiegroep bevindt zich in de initialisatiestatus: 2020/03/17 18:56:05.070 - #2 - 7954/7665 - InitNCState::D istributeOnePhase: distributing one phase m_groupID = (groupCopyRID=( kVolSlot=XXXXXXXXXX,globalCopyID=GlobalCopy(SiteUID(0xXXXXXXXXXXXX) 0) ),gridCopyID=0) Fase 1-consument voor deze consistentiegroep vertoont een hoog verbruik op de bewering: XXXX/XX/XX 18:56:05.241 - #2 - 7954/7665 - MemoryManager: viscus on assert + countdowns = 2413/390 + min. geheugenbehoefte = 433429 (vaste 329537 flexibele 103892) + flexibele gebruiksruimte = 37977/3864963 + gebruik van groepsruimte = 37985/4194500 (max 143544) >> 1160635626647715840 :p hase1#22 >> (groupTaskID=(sessionID=1817723153,replicationLinkID=(kVolSlot=XXXXXXXXX,srcCopyID=GlobalCopy(SiteUID(0xXXXXXXXXXXXX) >> 0) ,destCopyID=GlobalCopy(SiteUID Een Replication StackTrace wordt ook ervaren: 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 3: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZNK6Kashya23DistributorGroupHandler21waitForMemoryIfNeededEv+0x5b2) [0xxxxxxxxxxxxx] 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 4: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZN6Kashya23DistributorGroupHandler25addSequencesToPhase1CacheENS_9SequencesERNS_15ReplicationModeE+0x939) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 5: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZN6Kashya23DistributorGroupHandler23handleSplittedSequencesENS_9SequencesERKNS_15ReplicationModeERKb+0x20a) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 6: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZN6Kashya23DistributorGroupHandler15handleSequencesENS_9SequencesERKNS_15ReplicationModeERKb+0x577) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 7: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZN6Kashya19Distributor_AO_IMPL23continueHandleSequencesENS_9SequencesENS_15ReplicationModeEbRKNS_10GridCopyIDE+0xf7) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 8: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZN6Kashya16SequencesRequest21continueHandleRequestERNS_28JournalRegulationRequestBase14RequestHandlerE+0x30b) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 9: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZN6Kashya31JournalRegulationThread_AO_IMPL9process_iERKNS_16GroupGridCopyRIDE+0x36f)
Cause
Resolution
Tijdelijke oplossing: Wijzig de waarde van de aanpassing t_phase1CacheMemoryThreadSleepTime in 5000. (Verlenging van de wachttijd van 10 microseconden naar 5 milliseconden). Dit zorgt ervoor dat we pas doorgaan als de thread 5 milliseconden op geheugen wacht. Als het probleem zich nog steeds voordoet: 1. Verzamel ook de logboeken van de productiesite. Omdat het ons laat weten hoeveel gegevens er op het moment van het probleem vanuit de productie wordt verzonden. 2. Waarde van tweak t_maxNoOfTriesToWaitForPhase1CacheMemory gewijzigd in 10. Opmerking: Deze aanpassingen zijn alleen relevant voor versie 5.1.3 en hoger. Als de codeversie niet 5.1.3 of hoger is, MOET RecoverPoint worden geüpgraded naar de nieuwste code om deze aanpassingen te gebruiken. Oplossing: Dit probleem wordt momenteel door Dell EMC Engineering onderzocht. Aan een permanente oplossing wordt nog gewerkt. Neem contact op met het Dell EMC Customer Support Center of uw servicevertegenwoordiger voor hulp en verwijs naar deze oplossings-ID.