RecoverPoint: Replikeringsprocessen går ned, når fase 1-cachehukommelsen bliver utilstrækkelig
Summary: Replikering vil gå ned med fase 1-cachehukommelse ikke tilstrækkelig påstand, der forårsager genstartsregulering.
Symptoms
Konsistensgruppens tilstand fortsætter med at være i initialisering, men normalfordeling synes aldrig at starte, og CG overgår ikke til en aktiv tilstand. En replikeringsproces går ned med en påstand logført, når fase 1-cachehukommelsen ikke er tilstrækkelig, og RecoverPoint-enheder på målsiden ikke kan skrive til målkladden. Symptomer fundet i /home/kos/replikeringslogfiler: Påstand: XXXX/XX/XX 18:59:25.693 - #2 - 17936/16776 - AssertLogSender: sender log: topic=DistributorGroupHandler, msg=Påstand mislykkedes: bIsPhase1CacheMemorySufficient Line 1825-fil DistributorGroupHandlerPhase1.cc PID: 16776 Info: Almindelig fase 1-cachehukommelse er ikke tilstrækkelig m_GroupGridCopyRID = (groupCopyRID=(kVolSlot=XXXXXXXXXX,globalCopyID=GlobalCopy(SiteUID(0xXXXXXXXXXXXXXX) 0)) ,gridCopyID=0) XXXX/XX/XX 18:59:25.694 - #2 - 16911/16776 - RemoteLogSender: got event (uniqueId=0, eventTime=1584471565693987), EventID_KBOX_ASSERTION_FAILED(3031), SiteUID(0xxxxxxxxx), seDetails=Sender=replikering, Topic=DistributorGroupHandler, msg=Assertion mislykkedes: bIsPhase1CacheMemorySufficient Line 1825-fil DistributorGroupHandlerPhase1.cc PID: 16776 Info: almindelig fase 1 cachehukommelse er ikke tilstrækkelig m_GroupGridCopyRID = (groupCopyRID=(kVolSlot=XXXXXXXXXX,globalCopyID=GlobalCopy(SiteUID(0xXXXXXXXXXXX) 0) ),gridCopyID=0) Statistik, der viser høj datastrøm: XXXX/XX/XX 18:52:41.520 - #2 - 7676/7665 - AccumulatorFormatManager::p rintStatistics: Gruppestatistik for gruppe Option (kVolSlot = XXXXXXXXXX groupUID = GroupCopy (1346840554 SiteUID (0xXXXXXXXXXXX) 0) gridID = 0): { STATISTIK: navn = InitNCOnePhaseSpeed kVolSlot = 1346840554 groupUID = GroupCopy (1346840554 SiteUID (0xXXXXXXXXXXXXX) 0) gridID = 0 beskrivelse: init nc en fase hastighed . STATISTIK: name=InitNCOnePhaseSpeed kVolSlot = 1346840554 groupUID = GroupCopy(1346840554 SiteUID(0xXXXXXXXXXXXXX) 0) gridID = 0 8 sek. vindue: Gennemsnitlig: 1,14e+03 MB/sek. STATISTIK: name=InitNCOnePhaseSpeed kVolSlot = 1346840554 groupUID = GroupCopy(1346840554 SiteUID(0xXXXXXXXXXXX) 0) gridID = 0 77 sek. vindue: Gennemsnitlig: 1,06E+03 MB/sek. En konsistensgruppe er i initialiseringstilstand: 2020/03/17 18:56:05.070 - #2 - 7954/7665 - InitNCState::D istributeOnePhase: distribution af en fase m_groupID = (groupCopyRID=( kVolSlot=XXXXXXXXXX,globalCopyID=GlobalCopy(SiteUID(0xXXXXXXXXXXXX) 0),gridCopyID=0) Fase 1 forbruger for denne konsistensgruppe viser højt forbrug på påstanden: XXXX/XX/XX 18:56:05.241 - #2 - 7954/7665 - MemoryManager: viscus på assert + nedtællinger = 2413/390 + min. hukommelsesbehov = 433429 (fast 329537 fleksibelt 103892) + fleksibel brugsplads = 37977/3864963 + brug af poolplads = 37985/4194500 (maks. 143544) >> 1160635626647715840 :p hase1#22 >> (groupTaskID=(sessionID=1817723153,replicationLinkID=(kVolSlot=XXXXXXXXX,srcCopyID=GlobalCopy(SiteUID(0xXXXXXXXXXXXXXX) >> 0) ,destCopyID=GlobalCopy(SiteUID Der opleves også en replikeringsstaksporing: 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 3: /hjem/kos/kashya/arkiv/lib/libreplication_libsrelease.so(_ZNK6Kashya23DistributorGroupHandler21waitForMemoryIfNeededEv+0x5b2) [0xxxxxxxxxxx] 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 4: /hjem/kos/kashya/arkiv/lib/libreplication_libsrelease.so(_ZN6Kashya23DistributorGroupHandler25addSequencesToPhase1CacheENS_9SequencesERNS_15ReplicationModeE+0x939) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 5: /hjem/kos/kashya/arkiv/lib/libreplication_libsrelease.so(_ZN6Kashya23DistributorGroupHandler23handleSplittedSequencesENS_9SequencesERKNS_15ReplicationModeERKb+0x20a) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 6: /hjem/kos/kashya/arkiv/lib/libreplication_libsrelease.so(_ZN6Kashya23DistributorGroupHandler15handleSequencesENS_9SequencesERKNS_15ReplicationModeERKb+0x577) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 7: /hjem/kos/kashya/arkiv/lib/libreplication_libsrelease.so(_ZN6Kashya19Distributor_AO_IMPL23continueHandleSequencesENS_9SequencesENS_15ReplicationModeEbRKNS_10GridCopyIDE+0xf7) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 8: /hjem/kos/kashya/arkiv/lib/libreplication_libsrelease.so(_ZN6Kashya16SequencesRequest21continueHandleRequestERNS_28JournalRegulationRequestBase14RequestHandlerE+0x30b) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 9: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZN6Kashya31JournalRegulationThread_AO_IMPL9process_iERKNS_16GroupGridCopyRIDE+0x36f)
Cause
Resolution
Løsning: Skift værdi af tweak t_phase1CacheMemoryThreadSleepTime til 5000. (Forøgelse af ventetiden fra 10 mikrosekunder til 5 millisekunder). Dette vil sikre, at vi ikke hævder, før tråden venter på hukommelse i 5 millisekunder. Hvis problemet stadig opstår: 1. Indsaml også logfilerne på produktionsstedet. Da det vil fortælle os mængden af data, der sendes fra produktionen på tidspunktet for problemet. 2. Skift værdi af tweak t_maxNoOfTriesToWaitForPhase1CacheMemory til 10. Bemærk: Disse justeringer er kun relevante for version 5.1.3 og nyere. Hvis kodeversionen ikke er 5.1.3 eller højere, SKAL RecoverPoint opgraderes til den nyeste kode for at udnytte disse justeringer. Løsning: Dell EMC's teknikere er pt. i gang med at undersøge problemet. En permanent rettelse er under udarbejdelse. Kontakt Dell EMC's kundesupportcenter eller din servicerepræsentant for at få hjælp, og henvis til dette løsnings-id.