RecoverPoint: El proceso de replicación se bloquea cuando la memoria caché de la fase 1 no es suficiente

Summary: La replicación se bloqueará y la memoria caché de la fase 1 no será suficiente, lo que causará una regulación de reinicio.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms



El estado del grupo de coherencia sigue siendo inicialización, pero la distribución normal nunca parece iniciarse y el CG no pasa a un estado activo. Un proceso de replicación se bloquea con una aserción registrada cuando la memoria caché de la fase 1 no es suficiente y los dispositivos RecoverPoint Appliance del lado de destino no pueden escribir en el registro de destino. Síntomas encontrados en los registros de /home/kos/replication: Aserción: XXXX/XX/XX 18:59:25.693 - #2 - 17936/16776 - AssertLogSender: sending log: topic=DistributorGroupHandler, msg=Assertion failed: bIsPhase1CacheMemoryEnough Line 1825 PID DistributorGroupHandlerPhase1.cc de archivo: 16776 Información: la memoria caché normal de la fase 1 no es suficiente m_GroupGridCopyRID = (groupCopyRID=(kVolSlot=XXXXXXXXXX,globalCopyID=GlobalCopy(SiteUID(0xXXXXXXXXXXXXXX) 0) ),gridCopyID=0) XXXX/XX/XX 18:59:25.694 - #2 - 16911/16776 - RemoteLogSender: got event (uniqueId=0, eventTime=1584471565693987), EventID_KBOX_ASSERTION_FAILED(3031), SiteUID(0xxxxxxxxxxxxxxxxx), seDetails=Sender=replication, Topic=DistributorGroupHandler, msg=Assertion failed: bIsPhase1CacheMemoryEnough PID DistributorGroupHandlerPhase1.cc línea 1825: 16776 Información: la memoria caché normal de la fase 1 no es suficiente m_GroupGridCopyRID = (groupCopyRID=(kVolSlot=XXXXXXXXXX,globalCopyID=GlobalCopy(SiteUID(0xXXXXXXXXXXX) 0),gridCopyID=0) Estadísticas que muestran un alto flujo de datos: XXXX/XX/XX 18:52:41.520 - #2 - 7676/7665 - AccumulatorFormatManager::p rintStatistics: Estadísticas de grupo para el grupo Opción( kVolSlot = XXXXXXXXXX groupUID = GroupCopy(1346840554 SiteUID(0xXXXXXXXXXXX) 0) gridID = 0): { ESTADÍSTICAS: name=InitNCOnePhaseSpeed kVolSlot = 1346840554 groupUID = GroupCopy(1346840554 SiteUID(0xXXXXXXXXXXXXX) 0) gridID = 0 description: init nc velocidad monofásica . ESTADÍSTICAS: name=InitNCOnePhaseSpeed kVolSlot = 1346840554 groupUID = GroupCopy(1346840554 SiteUID(0xXXXXXXXXXXXXX) 0) gridID = 0 Ventana de 8 segundos: Promedio: 1,14e + 03 MB/s ESTADÍSTICAS: name=InitNCOnePhaseSpeed kVolSlot = 1346840554 groupUID = GroupCopy(1346840554 SiteUID(0xXXXXXXXXXXXXX) 0) gridID = 0 77 seg window: Promedio: 1,06e + 03 MB/s Un grupo de coherencia está en estado de inicialización: 2020/03/17 18:56:05.070 - #2 - 7954/7665 - InitNCState::D istributeOnePhase: distribución de una fase m_groupID = (groupCopyRID=( kVolSlot=XXXXXXXXXX,globalCopyID=GlobalCopy(SiteUID(0xXXXXXXXXXXXX) 0) ),gridCopyID=0) El consumidor de la fase 1 para este grupo de coherencia muestra un alto consumo en la siguiente afirmación: XXXX/XX/XX 18:56:05.241 - #2 - 7954/7665 - MemoryManager: viscus on assert + cuentas regresivas = 2413/390 + demanda mínima de memoria = 433429 (fijo 329537 flexible 103892) + espacio de uso flexible = 37977/3864963 + uso del espacio del pool = 37985/4194500 (máx. 143544) >> 1160635626647715840 :p hase1#22 >> (groupTaskID=(sessionID=1817723153,replicationLinkID=(kVolSlot=XXXXXXXXX,srcCopyID=GlobalCopy(SiteUID(0xXXXXXXXXXXXX) >> 0), destCopyID=GlobalCopy(SiteUID También se experimenta un StackTrace de replicación: 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 3: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZNK6Kashya23DistributorGroupHandler21waitForMemoryIfNeededEv+0x5b2) [0xxxxxxxxxxxxx] 17/03/2020 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 4: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZN6Kashya23DistributorGroupHandler25addSequencesToPhase1CacheENS_9SequencesERNS_15ReplicationModeE+0x939) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 5: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZN6Kashya23DistributorGroupHandler23handleSplittedSequencesENS_9SequencesERKNS_15ReplicationModeERKb+0x20a) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 6: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZN6Kashya23DistributorGroupHandler15handleSequencesENS_9SequencesERKNS_15ReplicationModeERKb+0x577) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 7: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZN6Kashya19Distributor_AO_IMPL23continueHandleSequencesENS_9SequencesENS_15ReplicationModeEbRKNS_10GridCopyIDE+0xf7) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 8: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZN6Kashya16SequencesRequest21continueHandleRequestERNS_28JournalRegulationRequestBase14RequestHandlerE+0x30b) 2020/03/17 18:56:05.278 - #0 - 7954/7665 - StackTrace: errno=0 9: /home/kos/kashya/archive/lib/libreplication_libsrelease.so(_ZN6Kashya31JournalRegulationThread_AO_IMPL9process_iERKNS_16GroupGridCopyRIDE+0x36f)

Cause

El administrador de memoria no puede escalar verticalmente la asignación de memoria a la caché de fase 1 y esto provoca una condición temporal en la que a la caché de fase 1 no le queda espacio para las secuencias entrantes, de ahí la aserción.

Resolution

Solución alternativa: Cambie el valor del t_phase1CacheMemoryThreadSleepTime de ajuste a 5000. (Aumento del tiempo de espera de 10 microsegundos a 5 milisegundos). Esto garantizará que no hagamos una aserción hasta que el subproceso espere la memoria durante 5 milisegundos. Si el problema persiste: 1. Recopile también los registros del sitio de producción. Ya que nos permitirá saber la cantidad de datos que se envían desde la producción en el momento del problema. 2. Cambie el valor del ajuste t_maxNoOfTriesToWaitForPhase1CacheMemory a 10. Nota: Estos ajustes solo son relevantes para las versiones 5.1.3 y superiores. Si la versión del código no es 5.1.3 o superior, RecoverPoint DEBE actualizarse al código más reciente para utilizar estos ajustes. Solución: El departamento de Ingeniería de Dell EMC actualmente se encuentra investigando este problema. Aún está en curso una corrección permanente. Comuníquese con el centro de soporte al cliente de Dell EMC o con su representante de servicio para obtener asistencia y hacer referencia a este ID de solución.

Affected Products

RecoverPoint

Products

RecoverPoint, RecoverPoint EX
Article Properties
Article Number: 000174142
Article Type: Solution
Last Modified: 10 Jul 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.