VNX: Limpieza de la replicación cuando los puntos de control raíz de replicación están dañados o inactivos (corregible por el usuario)

Summary: Limpieza de la replicación cuando los puntos de control raíz de replicación están dañados o inactivos (corregible por el usuario)

Affected Products

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Check out other resources

Symptoms

Puntos de control raíz dañados (la razón común es que los LUN de back-end tienen incorregibles debido a fallas de disco)

[nasadmin@CS0 ~]$ server_mount ALL | grep unmount
root_rep_ckpt_28_242474_1 on /root_rep_ckpt_28_242474_1 ckpt,perm,ro,<unmounted>
root_rep_ckpt_28_242474_2 on /root_rep_ckpt_28_242474_2 ckpt,perm,ro,<unmounted>
root_rep_ckpt_27_242517_1 on /root_rep_ckpt_27_242517_1 ckpt,perm,ro,<unmounted>
root_rep_ckpt_27_242517_2 on /root_rep_ckpt_27_242517_2 ckpt,perm,ro,<unmounted>

En esta salida anterior, solo se pueden ver puntos de control raíz y esto indica que el sistema de archivos principal está en buen estado. Esto suele suceder si el savvol se construye en un pool de almacenamiento diferente que tenía daños y el sistema de archivos asociado es seguro.

[nasadmin@CS0 ~]$ nas_replicate -l
Name                      Type       Local Mover               Interconnect         Celerra      Status
rep_fs1                filesystem server_2                  -->Replication       Remote_CS  Critical 8865448248:The replication session encountered an error that halted progress.
rep_fs2                filesystem server_2                  -->Replication       Remote_CS  OK
rep_fs3                filesystem server_2                  -->Replication       Remote_CS  Critical 8865448248:The replication session encountered an error that halted progress.

La salida anterior reflejará el error como se evidencia en los errores críticos de las 2 replicaciones (que coincide con el 2 conjunto de estados de desmontaje del punto de control raíz que se ve en server_mount resultado)

Cause

Si el administrador de transferencia de datos entra en una situación de pánico, en la mayoría de los casos, esto se debe a daños debidos a discos y VNX marcará el sistema de archivos como dañado. Los puntos de control raíz también se desmontarán.

Resolution

Nota: Los problemas de back-end deben solucionarse primero, por ejemplo, si algún disco necesita ser reemplazado, eso debe ser lo primero.

Para eliminar las replicaciones afectadas:

Si las sesiones se intentan eliminar directamente, es posible que la tarea de eliminación aparezca como bloqueada. Porque la eliminación intentará actualizar los puntos de control raíz y la actualización se bloqueará porque está dañada. Consulte la sección de notas para solucionar ese problema. Este procedimiento es para corregir en el orden correcto y se debe realizar desde Control Station a través del símbolo del sistema.

1) Inicie sesión en Control Station como nasadmin

2) Identifique el nombre de la sesión de replicación siguiendo este ejemplo:

a) Find the full name of root checkpoints by:
[nasadmin@CS0 ~]$ server_mount ALL | grep unmount
root_rep_ckpt_28_242474_1 on /root_rep_ckpt_28_242474_1 ckpt,perm,ro,<unmounted>
root_rep_ckpt_28_242474_2 on /root_rep_ckpt_28_242474_2 ckpt,perm,ro,<unmounted>
b) For each checkpoint, issue the following command and note the file system name
[nasadmin@CS0 ~]$ /nas/sbin/rootnas_fs -info root_rep_ckpt_28_242474_1 | grep checkpt_of
checkpt_of= fs1 Mon Jun 15 16:51:54 EDT 2015

Repeat above as every FS will have 2 root checkpoints per replication session, so good to get all FS names first before proceeding to next step

2) Identifique los puntos de control de replicación y elimínelos siguiendo este ejemplo

a) Identify the file system name from the replications failing with critical errors by :
nas_replicate -list

Example: 
$ nas_replicate -i jsq-stx-mq
ID                             = 156_APM001_01F4_137_APM002_01F4
Name                           = rep_fs1
Source Status                  = Critical 8865448248: The replication session encountered an error that halted progres                                                                                          s.
Network Status                 = OK
Destination Status             = OK
Last Sync Time                 = Wed Jul 13 14:35:15 EDT 2016
Type                           = filesystem
Celerra Network Server         = CS01
Dart Interconnect              = Replication
Peer Dart Interconnect         = Replication
Replication Role               = source  <== note the role 
Source Filesystem              = fs1 <== this is the fs name if the role is source
Source Data Mover              = server_2
Source Interface               = 10.x.x.x
Source Control Port            = 0
Source Current Data Port       = 0
Destination Filesystem         = fs1-DR <== this is the fs name if the role is destination
Destination Data Mover         = server_2
Destination Interface          = 10.x.x.x
...

Match this name from names identified in step 2 to ensure they are same.
b) Check the replication checkpoint status by : fs_ckpt <fs_name> -list -all

Example: 
$ fs_ckpt fs1 -list -all
id    ckpt_name                creation_time           inuse fullmark   total_savvol_used  ckpt_usage_on_savvol
32    root_rep_ckpt_28_242474_ 06/15/2015-16:51:54-EDT   y   90%        INACTIVE           N/A
33    root_rep_ckpt_28_242474_ 06/15/2015-16:51:56-EDT   y   90%        INACTIVE           N/A
34    fs1_ckpt1                          06/17/2015-16:51:56-EDT   y   90%        INACTIVE           N/A
Info 26306752329: The value of ckpt_usage_on_savvol for read-only checkpoints may not be consistent with the total_savvol_used.

id    wckpt_name               inuse fullmark total_savvol_used  base  ckpt_usage_on_savvol

INACTIVE indicates, this is corrupted.
c) If the "inuse" value is "y", delete the root checkpoints using the following command:  /nas/sbin/rootnas_fs -delete id=<root_ckpt_id> -o umount=yes -ALLOW_REP_INT_CKPT_OP 
Rarely, root checkpoint may have, inuse" value as "n", then,  /nas/sbin/rootnas_fs -delete id=<root_ckpt_id> -ALLOW_REP_INT_CKPT_OP 

Example:
[nasadmin@CS0 ~]$ /nas/sbin/rootnas_fs -delete id=32  -o umount=yes -ALLOW_REP_INT_CKPT_OP 
id        = 32
name      = root_rep_ckpt_28_242474_1
acl       = 0
in_use    = True
type      = ckpt
worm      = off
..

d) Repeat above step and delete all the root checkpoints 
e) For non root checkpoints, delete using same command with out the last arument (Example: /nas/sbin/rootnas_fs -delete id=34 -o umount=yes)

3) Elimine la sesión de replicación con la siguiente sintaxis:

For the "source" replication role : nas_replicate -delete <replication_session_name> -mode source -background
For the "destination" replication role : nas_replicate -delete <replication_session_name> -mode destination -background

Above command will give a task number, which can be used to view the status, by "nas_task -i <task_number>

4) Elimine también la replicación en el lado remoto utilizando solo el paso 3 anterior

 [ "nas_replicate -delete <session_name> -mode <mode> -background" ]

Si se realizan todos los pasos anteriores, se completa la actividad de eliminación de la replicación. Se puede volver a configurar una nueva replicación mediante Unisphere o el símbolo del sistema.

Comuníquese con el soporte técnico de Dell EMC si falla alguno de los pasos anteriores. Cite el ID de este artículo de la base de conocimientos.

Additional Information

Si las sesiones se intentan eliminar directamente en Unisphere o mediante el comando "nas_replicate -delete", es posible que la tarea de eliminación aparezca como bloqueada. En la mayoría de los casos, esto se puede corregir sin necesidad de reiniciar el administrador de transferencia de datos.

1) Identifique la tarea a través de:

nas_task -list | grep -i run

2) Encuentre la información detallada (en particular, el nombre del administrador de transferencia de datos) de la siguiente manera:

nas_task -info <task_number>

3) Aborte la tarea de la siguiente manera:

nas_task -abort <task_numer> -mover <data_mover_name>

Arriba también se debe eliminar la sesión de replicación y los puntos de control raíz. Los puntos de control de usuario se deben eliminar manualmente.

Affected Products

vVNX

Article Number: 000056557

Article Type: Solution

Last Modified: 20 May 2026

Version: 6

Check if your device is covered by Support Services.

VNX: Limpieza de la replicación cuando los puntos de control raíz de replicación están dañados o inactivos (corregible por el usuario)

Summary: Limpieza de la replicación cuando los puntos de control raíz de replicación están dañados o inactivos (corregible por el usuario)

Symptoms

Cause

Resolution

Additional Info

Affected Products

Symptoms

Cause

Resolution

Additional Information

Affected Products

Article Properties

Find answers to your questions from other Dell users

Support Services

Article Properties

Find answers to your questions from other Dell users

Support Services

VNX: Limpieza de la replicación cuando los puntos de control raíz de replicación están dañados o inactivos (corregible por el usuario)

Summary: Limpieza de la replicación cuando los puntos de control raíz de replicación están dañados o inactivos (corregible por el usuario)

Detailed Article

Symptoms

Cause

Resolution

Additional Info

Affected Products

Symptoms

Cause

Resolution

Additional Information

Affected Products

Article Properties

Find answers to your questions from other Dell users

Support Services

Article Properties

Find answers to your questions from other Dell users

Support Services