RecoverPoint: El grupo de coherencia entra en un estado de error debido a que "SYM no pudo encontrar el conjunto de instantáneas"
Summary: RecoverPoint: El grupo de coherencia entra en un estado de error debido a [SYM no pudo encontrar el conjunto de instantáneas]
Symptoms
El enlace de un CG cae en un error debido a [SYM no pudo encontrar el conjunto de instantáneas], lo que fuerza a todo el grupo a un estado habilitado sin transferencia.
Error: Uno o más enlaces del grupo cg_name están configurados para replicar instantáneas y se produjo un error en el proceso de replicación basada en instantáneas. Se recibieron los siguientes errores desde el almacenamiento:
Link = cg_name->cg_name_copy, error = [SYM failed to find snapset]
Síntomas encontrados en los registros:
/files/home/kos/storage/result.log
ActiveXioArrayHelper_AO_IMPL::xioRefreshConsistentSnapshotFromDevice_i: xioRefreshConsistentSnapshotFromDevice Failed with res.faultString() = SYM failed to find snapset res.arrayRvCode() = e_API_FAILURE printCommand: methodName = sym.SystemRemoveSnapSet format = ((ssi)(ssi)(ssi)i) numArgs = 10 buffer = (( 0065ff5a961b41979c64b1998bf9xxxx xms 1 )( xxxxxb824ee14c94b5f708ced17f3b85 XIO-HO-C01 1 )( 6fbb339729954axxxxxxxxxx 1 ) 19558 ) XioConnection::executeCommand: Command execution fail. methodName = sym.SystemRemoveSnapSet m_client = 0x7f502dxxxxx server = 0x7f5xxxxxxxx URL: http://172.xx.xxx.xxx:11111/RPC2 this = 0x7f5030165xxxxx CleanEnvAndReturnRV: Operation failed. rv.faultString() = RPC failed at server. snapset_not_found env.fault_code = -500 XioArrayHelper: RPC failed at server. snapset_not_found, called from function: xioDeleteConsistentSnapshot:3212
/files/home/kos/control/result.log
2018/10/17 10:12:50.135 - #1 - 5040/4313 - WorkManager: GroupCopy(206327186 SiteUID(0x228e3ecc2dxxxxxx) 0): Action refreshArrayConsistentSnapshot failed! value.arrayRvCode() = e_API_FAILURE value.errorStrings() = [SYM failed to find snapset] 2018/10/17 10:12:50.550 - #2 - 5040/4313 - StateChange: lastComputedPipeTargetsMap. copy=GroupCopy(2063271xxx SiteUID(0x228e3ecc2xxxxxxx) 0) to copy= GlobalCopy(SiteUID(0x31ba0c434a00xxxxx) 0) pipe target=PT_CLOSED, reason=No exposed snap to replicate -> PT_CLOSED, reason=Array error
Cause
Debido a una falta de alineación entre XtremIO y XMS, RecoverPoint recibe entradas anteriores de XMS cuando recupera la lista actual de instantáneas que se deben descartar.
En ocasiones, se recibe un valor inesperado y, en lugar de la instantánea anterior que se debe descartar, que se utiliza para su eliminación, se utiliza como la instantánea actual. Esto hace que se elimine la instantánea real.
Debido a esto, las llamadas desde el arreglo comienzan a fallar para el grupo asociado con la instantánea que se eliminó, lo que hace que el enlace de la copia entre en el estado de error [SYM failed to find snapset], debido a que el enlace del grupo está inactivo, todo el CG cae en un estado de error habilitado sin transferencia.
Resolution
Solución alternativa:
- Desactive el CG y vuelva a activarlo
- Cambie el t_xioPeriodicalSnapCleanupGatherInterval de ajuste de 600 000 a 600000000 (x1000) en todos los RPA de producción. Este cambio hace que la herramienta de limpieza se ejecute una vez a la semana en lugar de cada 10 minutos, y reduce la probabilidad de que se produzca el problema.
Resolución:
Hay una solución para este problema disponible en XtremIO 4.0.27-1 y XMS 6.2.1-36.
Additional Information
Configuraciones afectadas:
RecoverPoint Classic con el arreglo XtremIO (antes de XtremIO 4.0.27-1, XMS 6.2.1-36)