RecoverPoint for Virtual Machines : Le processus se bloque sur les vRPA entraînant un impact sur la réplication
Summary: Les groupes de cohérence (CG) à l’état d’erreur en tant qu’appliances RecoverPoint (RPA) ne peuvent pas accéder aux volumes du référentiel (KVOL) et du journal (JVOL).
Symptoms
Dans les environnements RecoverPoint for VMs (RP4VM), les groupes de cohérence (CG) peuvent passer à un état d’erreur, car les RPA ne peuvent pas accéder au référentiel et aux volumes de journal.
Erreurs dans le tableau de bord ou la sortie de l’état du système :
Erreurs possibles dans les logs de contrôle/réplication :
2020/02/12 23:40:02.275 - #0 - 13659/13550 - MultiPath: errno=0 PathImporter::importFinished: got MPI error: SanDiscoveryBoxMgrProxy connection lost (maybe storage process died?) a_res.error = 1 2020/02/12 23:40:02.275 - #2 - 13631/13550 - MultiPath: MPVolumeConnectingState::handleImportedPaths: requesting non-optimized: a_volume = 0x483a04edc455f87e (StorageType=RP_VSTORAGE, revision= 2020/02/12 23:40:02.275 - #0 - 13631/13550 - MultiPath: errno=0 PathImporter::importFinished: got MPI error: SanDiscoveryBoxMgrProxy connection lost (maybe storage process died?) a_res.error = 1 2020/02/12 23:40:02.275 - #2 - 13631/13550 - MultiPath: MPVolumeConnectingState::handleImportedPaths: requesting all: a_volume = 0x483a04edc455f87e (StorageType=RP_VSTORAGE, revision= 2020/02/12 23:40:02.275 - #0 - 13631/13550 - MultiPath: errno=0 PathImporter::importFinished: got MPI error: SanDiscoveryBoxMgrProxy connection lost (maybe storage process died?) a_res.error = 1 2020/02/12 23:40:02.275 - #2 - 13631/13550 - MultiPath: MultiIOSender::finish: IO error m_volume.getGuid() = 0x483a04edc455f87e &m_io = 0x7f5ef4887950 this = 0x7f5ef4887940 a_status = general error MPVolumeConnectingState
Journal du noyau RPA (extrait
*/files/var/log/kern.log) montre Out of memory killing du processus de réplication :
Nov 26 13:36:40 localhost kernel: [4545420.314953] Out of memory: Kill process 4842 (replication) score 530 or sacrifice child Nov 26 13:36:40 localhost kernel: [4545420.354484] Out of memory: Kill process 4842 (replication) score 530 or sacrifice child
Cause
Les processus RPA se bloquent en raison d’un manque de mémoire. La mémoire des machines virtuelles RPA n’était pas entièrement réservée.
Resolution
Solution de contournement :
Redémarrez les RPA.
Résolution:
Vérifiez que la mémoire invitée est réservée sur toutes les RPA.
Sous vSphere, cliquez avec le bouton droit de la souris sur les paramètres de modification de la machine virtuelle > vRPA... > Développez la section >Mémoire Sélectionnez Réserver toute la mémoire invitée (toutes verrouillées)> Cliquez sur OK.