VNX : Nettoyage de la réplication lorsque les points de contrôle racine de réplication sont corrompus/inactifs (corrigible par l’utilisateur)
Summary: Nettoyage de la réplication lorsque les points de contrôle racine de réplication sont corrompus/inactifs (corrigible par l’utilisateur)
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Points de contrôle racine corrompus (raison courante : les LUN back-end ne sont pas corrigibles en raison de pannes de disque)
Dans la sortie ci-dessus, seuls les points de contrôle racine sont visibles, ce qui indique que le système de fichiers principal est correct. Cela se produit généralement si savvol est compilé sur un pool de stockage différent qui était corrompu et que le système de fichiers associé est sûr.
[nasadmin@CS0 ~]$ server_mount ALL | grep unmount root_rep_ckpt_28_242474_1 on /root_rep_ckpt_28_242474_1 ckpt,perm,ro,<unmounted> root_rep_ckpt_28_242474_2 on /root_rep_ckpt_28_242474_2 ckpt,perm,ro,<unmounted> root_rep_ckpt_27_242517_1 on /root_rep_ckpt_27_242517_1 ckpt,perm,ro,<unmounted> root_rep_ckpt_27_242517_2 on /root_rep_ckpt_27_242517_2 ckpt,perm,ro,<unmounted>
Dans la sortie ci-dessus, seuls les points de contrôle racine sont visibles, ce qui indique que le système de fichiers principal est correct. Cela se produit généralement si savvol est compilé sur un pool de stockage différent qui était corrompu et que le système de fichiers associé est sûr.
[nasadmin@CS0 ~]$ nas_replicate -l Name Type Local Mover Interconnect Celerra Status rep_fs1 filesystem server_2 -->Replication Remote_CS Critical 8865448248:The replication session encountered an error that halted progress. rep_fs2 filesystem server_2 -->Replication Remote_CS OK rep_fs3 filesystem server_2 -->Replication Remote_CS Critical 8865448248:The replication session encountered an error that halted progress.La sortie ci-dessus reflète l’erreur, comme en témoignent les 2 erreurs critiques de réplication (ce qui correspond à l’ensemble de 2 états de démontage du point de contrôle racine affichés dans server_mount sortie)
Cause
Si le logiciel de transfert de données présente un fonctionnement inattendu, dans la plupart des cas, cela est dû à une corruption due aux disques. VNX marque le système de fichiers comme étant corrompu. Les points de contrôle racine seront également démontés.
Resolution
Remarque : Les problèmes de back-end doivent être résolus en premier, par exemple si un disque doit être remplacé, celui-ci doit être le premier.
Pour supprimer les réplications concernées :
Si les sessions font l’objet d’une tentative de suppression directe, la tâche de suppression peut apparaître comme bloquée. En effet, la suppression tentera de mettre à jour les points de contrôle racine et la mise à jour se bloquera car elle est corrompue. Reportez-vous à la section Remarques pour résoudre ce problème. Cette procédure doit être corrigée dans l’ordre correct et doit être effectuée à partir de la station pilote via l’invite de commande.
1) Connectez-vous à la station pilote en tant que nasadmin
. 2) Identifiez le nom de la session de réplication en suivant cet exemple :
2) Identifiez les points de contrôle de réplication et supprimez-les, en suivant cet exemple
3) Supprimez la session de réplication à l’aide de la syntaxe suivante :
4) Supprimez également la réplication à distance en suivant simplement l’étape 3 ci-dessus.
Contactez le support technique Dell EMC si l’une des étapes ci-dessus échoue. Citez cet ID d’article de la base de connaissances.
Pour supprimer les réplications concernées :
Si les sessions font l’objet d’une tentative de suppression directe, la tâche de suppression peut apparaître comme bloquée. En effet, la suppression tentera de mettre à jour les points de contrôle racine et la mise à jour se bloquera car elle est corrompue. Reportez-vous à la section Remarques pour résoudre ce problème. Cette procédure doit être corrigée dans l’ordre correct et doit être effectuée à partir de la station pilote via l’invite de commande.
1) Connectez-vous à la station pilote en tant que nasadmin
. 2) Identifiez le nom de la session de réplication en suivant cet exemple :
a) Find the full name of root checkpoints by: [nasadmin@CS0 ~]$ server_mount ALL | grep unmount root_rep_ckpt_28_242474_1 on /root_rep_ckpt_28_242474_1 ckpt,perm,ro,<unmounted> root_rep_ckpt_28_242474_2 on /root_rep_ckpt_28_242474_2 ckpt,perm,ro,<unmounted> b) For each checkpoint, issue the following command and note the file system name [nasadmin@CS0 ~]$ /nas/sbin/rootnas_fs -info root_rep_ckpt_28_242474_1 | grep checkpt_of checkpt_of= fs1 Mon Jun 15 16:51:54 EDT 2015 Repeat above as every FS will have 2 root checkpoints per replication session, so good to get all FS names first before proceeding to next step
2) Identifiez les points de contrôle de réplication et supprimez-les, en suivant cet exemple
a) Identify the file system name from the replications failing with critical errors by :
nas_replicate -list
Example:
$ nas_replicate -i jsq-stx-mq
ID = 156_APM001_01F4_137_APM002_01F4
Name = rep_fs1
Source Status = Critical 8865448248: The replication session encountered an error that halted progres s.
Network Status = OK
Destination Status = OK
Last Sync Time = Wed Jul 13 14:35:15 EDT 2016
Type = filesystem
Celerra Network Server = CS01
Dart Interconnect = Replication
Peer Dart Interconnect = Replication
Replication Role = source <== note the role
Source Filesystem = fs1 <== this is the fs name if the role is source
Source Data Mover = server_2
Source Interface = 10.x.x.x
Source Control Port = 0
Source Current Data Port = 0
Destination Filesystem = fs1-DR <== this is the fs name if the role is destination
Destination Data Mover = server_2
Destination Interface = 10.x.x.x
...
Match this name from names identified in step 2 to ensure they are same.
b) Check the replication checkpoint status by : fs_ckpt <fs_name> -list -all
Example:
$ fs_ckpt fs1 -list -all
id ckpt_name creation_time inuse fullmark total_savvol_used ckpt_usage_on_savvol
32 root_rep_ckpt_28_242474_ 06/15/2015-16:51:54-EDT y 90% INACTIVE N/A
33 root_rep_ckpt_28_242474_ 06/15/2015-16:51:56-EDT y 90% INACTIVE N/A
34 fs1_ckpt1 06/17/2015-16:51:56-EDT y 90% INACTIVE N/A
Info 26306752329: The value of ckpt_usage_on_savvol for read-only checkpoints may not be consistent with the total_savvol_used.
id wckpt_name inuse fullmark total_savvol_used base ckpt_usage_on_savvol
INACTIVE indicates, this is corrupted.
c) If the "inuse" value is "y", delete the root checkpoints using the following command: /nas/sbin/rootnas_fs -delete id=<root_ckpt_id> -o umount=yes -ALLOW_REP_INT_CKPT_OP
Rarely, root checkpoint may have, inuse" value as "n", then, /nas/sbin/rootnas_fs -delete id=<root_ckpt_id> -ALLOW_REP_INT_CKPT_OP
Example:
[nasadmin@CS0 ~]$ /nas/sbin/rootnas_fs -delete id=32 -o umount=yes -ALLOW_REP_INT_CKPT_OP
id = 32
name = root_rep_ckpt_28_242474_1
acl = 0
in_use = True
type = ckpt
worm = off
..
d) Repeat above step and delete all the root checkpoints
e) For non root checkpoints, delete using same command with out the last arument (Example: /nas/sbin/rootnas_fs -delete id=34 -o umount=yes)
For the "source" replication role : nas_replicate -delete <replication_session_name> -mode source -background For the "destination" replication role : nas_replicate -delete <replication_session_name> -mode destination -background Above command will give a task number, which can be used to view the status, by "nas_task -i <task_number>
4) Supprimez également la réplication à distance en suivant simplement l’étape 3 ci-dessus.
[ "nas_replicate -delete <session_name> -mode <mode> -background" ]Si toutes les étapes ci-dessus sont effectuées, l’activité de suppression de la réplication est terminée. Une nouvelle réplication peut être reconfigurée à l’aide de Unisphere ou de l’invite de commande.
Contactez le support technique Dell EMC si l’une des étapes ci-dessus échoue. Citez cet ID d’article de la base de connaissances.
Additional Information
Si vous tentez directement de supprimer les sessions sur Unisphere ou via la commande « nas_replicate -delete », la tâche de suppression peut apparaître bloquée. Dans la plupart des cas, cela peut être résolu sans avoir à redémarrer le logiciel de transfert de données.
1) Identifier la tâche via :
2) Retrouvez les informations détaillées (notamment le nom du data mover) par :
3) Abandonner la tâche en :
La section ci-dessus doit également supprimer la session de réplication et les points de contrôle racine. Tous les points de contrôle utilisateur doivent être supprimés manuellement.
1) Identifier la tâche via :
nas_task -list | grep -i run
2) Retrouvez les informations détaillées (notamment le nom du data mover) par :
nas_task -info <task_number>
3) Abandonner la tâche en :
nas_task -abort <task_numer> -mover <data_mover_name>
La section ci-dessus doit également supprimer la session de réplication et les points de contrôle racine. Tous les points de contrôle utilisateur doivent être supprimés manuellement.
Affected Products
vVNXArticle Properties
Article Number: 000056557
Article Type: Solution
Last Modified: 29 Jul 2025
Version: 4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.