RecoverPoint for Virtual Machines: Bloqueos de procesos en vRPA que causan un impacto en la replicación
Summary: Los grupos de coherencia (CG) en estado de error, ya que los dispositivos RecoverPoint Appliance (RPA) no pueden acceder a los volúmenes del repositorio (KVOL) y del registro (JVOL).
Symptoms
En los entornos de RecoverPoint para VM (RP4VM), los grupos de coherencia (CG) pueden entrar en un estado de error, ya que los RPA no pueden acceder al repositorio ni a los volúmenes del registro.
Errores en el tablero o en la salida del estado del sistema:
Posibles errores en los registros de control/replicación:
2020/02/12 23:40:02.275 - #0 - 13659/13550 - MultiPath: errno=0 PathImporter::importFinished: got MPI error: SanDiscoveryBoxMgrProxy connection lost (maybe storage process died?) a_res.error = 1 2020/02/12 23:40:02.275 - #2 - 13631/13550 - MultiPath: MPVolumeConnectingState::handleImportedPaths: requesting non-optimized: a_volume = 0x483a04edc455f87e (StorageType=RP_VSTORAGE, revision= 2020/02/12 23:40:02.275 - #0 - 13631/13550 - MultiPath: errno=0 PathImporter::importFinished: got MPI error: SanDiscoveryBoxMgrProxy connection lost (maybe storage process died?) a_res.error = 1 2020/02/12 23:40:02.275 - #2 - 13631/13550 - MultiPath: MPVolumeConnectingState::handleImportedPaths: requesting all: a_volume = 0x483a04edc455f87e (StorageType=RP_VSTORAGE, revision= 2020/02/12 23:40:02.275 - #0 - 13631/13550 - MultiPath: errno=0 PathImporter::importFinished: got MPI error: SanDiscoveryBoxMgrProxy connection lost (maybe storage process died?) a_res.error = 1 2020/02/12 23:40:02.275 - #2 - 13631/13550 - MultiPath: MultiIOSender::finish: IO error m_volume.getGuid() = 0x483a04edc455f87e &m_io = 0x7f5ef4887950 this = 0x7f5ef4887940 a_status = general error MPVolumeConnectingState
El registro del kernel de RPA (extraído
*/files/var/log/kern.log) muestra Out of memory killing del proceso de replicación:
Nov 26 13:36:40 localhost kernel: [4545420.314953] Out of memory: Kill process 4842 (replication) score 530 or sacrifice child Nov 26 13:36:40 localhost kernel: [4545420.354484] Out of memory: Kill process 4842 (replication) score 530 or sacrifice child
Cause
Los procesos de RPA se bloquean debido a la falta de memoria. Las VM de RPA no tenían toda la memoria reservada.
Resolution
Solución alternativa:
Reinicie los RPA.
Resolución:
Verifique que todos los RPA tengan reservada todas las memorias de huésped.
En vSphere, haga clic con el botón secundario en la VM > de vRPA Edit settings... > Expanda la sección >Memory Seleccione Reserve all guest memory (All locked)> Haga clic en OK.