Avamar : Définition d’Avamar Server dans un état contrôlé connu

Summary: Cet article explique comment définir une instance d’Avamar Server sur un état contrôlé connu.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Il existe de nombreuses tâches automatisées sur une instance d’Avamar Server qui peuvent affecter les efforts de dépannage et de résolution.

Cette procédure explique comment placer Avamar dans ce que l’on appelle un « état contrôlé connu » afin d’éviter qu’une activité inattendue ou indésirable ne se produise.

La check-list ci-dessous doit être suivie lors de l’exécution de tâches de maintenance manuelles et avancées. Par exemple :
  • Reconstruction des bandes
  • Reconstruction des nœuds
  • Redémarrage des nœuds hors ligne
Il s’agit d’une check-list et non d’un guide sur la façon d’effectuer les opérations ou d’interpréter les résultats.

Il ne s’agit PAS d’une solution de contrôle d’intégrité. Elle suppose que le serveur Avamar est défectueux.

Cause

Les tâches de maintenance manuelle ou avancée doivent être exécutées sur une instance d’Avamar Server.

Resolution

Attention : Si elles ne sont pas utilisées correctement, certaines des commandes référencées ci-dessous peuvent entraîner des problèmes d’intégrité des données ou des pertes de données. Si vous ne comprenez pas une commande ou les conséquences de son exécution, demandez de l’aide au support Dell ou à votre représentant partenaire Dell local.

Conditions préalables:
  • Toutes les commandes doivent être exécutées en tant qu’administrateur avec les clés SSH chargées conformément à l’article Avamar : Connexion à un serveur Avamar et chargement de différentes clés.
  • Il se peut que certaines commandes ne donnent pas de retour d’information ou n’aient pas d’effet immédiat. Il ne doit pas être nécessaire d’exécuter une commande plus d’une fois.
  • Pour tout avmaint config --ava , confirmez toujours que la modification a pris effet. Exécutez la commande suivante :
avmaint config --ava | grep <setting>
  • La maintenance manuelle doit être évitée. Dans la mesure du possible, autorisez le planificateur de maintenance à gérer les tâches de maintenance.
Procédure :
  1. Vous devez répondre aux questions suivantes à l’aide de ces commandes pour comprendre l’état général de l’instance d’Avamar Server avant d’intervenir sur un système :
  • Quelle est l’ancienneté du dernier point de contrôle validé ?
cplist
  • Toutes les rayures sont-elles en ligne ? Tous les nœuds sont-ils en ligne ?
status.dpn
  • Tous les services sont-ils opérationnels ?
dpnctl status
  1. Vérifiez les opérations de maintenance en cours et annulez-les si nécessaire :
    1. Suspendez les activités de maintenance à l’aide du planificateur de maintenance pour vous assurer qu’elles ne redémarrent pas après les avoir arrêtées.
avmaint sched suspend cp --ava
avmaint sched suspend hfscheck --ava
Ne suspendez pas le nettoyage de la mémoire (GC), car cela pourrait entraîner une restauration inutile.
  1. Exécutez la commande ci-dessous et vérifiez si des activités de maintenance sont en cours.
status.dpn
  • Si un point de contrôle est en cours d’exécution, laissez-le se terminer.
  • Si HFScheck est en cours d’exécution, il peut être arrêté si le serveur n’est pas en mode admin (phase waitcgsan) ou si le HFScheck est presque terminé :
avmaint hfscheckstop --ava
  • Si un GC est en cours d’exécution, il peut être arrêté :
avmaint gckill --ava
Cette opération peut prendre un certain temps, car la passe en cours doit se terminer.
  1. Une fois qu’il n’y a plus de maintenance en cours d’exécution, le planificateur de maintenance doit être arrêté :
dpnctl stop maint
  1. Arrêtez le planificateur de sauvegardes, arrêtez l’exécution de sauvegardes ou de restaurations et suspendez les nouvelles connexions :
    1. Empêchez MCS de démarrer de nouvelles sauvegardes :
dpnctl stop sched
  1. Répertoriez toutes les sauvegardes en cours d’exécution :
avmaint sessions --ava | grep sessionid
Si une restauration autre qu’une réplication est en cours d’exécution, consultez l’utilisateur pour déterminer si la restauration doit être autorisée à se poursuivre.
  1. Une fois l’approbation reçue de l’utilisateur, indiquant que les sauvegardes peuvent être arrêtées proprement (des sauvegardes partielles sont créées) à l’aide de l’interface utilisateur ou de manière non propre à l’aide de :
avmaint kill -waittime=0 <sessionid>
  1. Répertoriez toutes les sauvegardes supplémentaires non répertoriées par la commande précédente :
avmaint sessions --full
  1. En fonction de l’opération à effectuer, il peut ne pas être acceptable d’exécuter des opérations de type sauvegarde (autrement dit, avmaint getrefby). Par conséquent, suspendez les répartiteurs pour ne pas autoriser les sauvegardes manuelles :
avmaint suspend
  1. Arrêtez la réplication (source ou cible de réplication).
    1. Pour la source de réplication (restauration), utilisez l’interface utilisateur ou EM ou arrêtez le processus pour arrêter la réplication.
    2. Pour la cible de réplication (sauvegarde), vérifiez si la réplication est en cours d’exécution : 
avmaint sessions | grep path
  1. Recherchez le domaine /REPLICATE dans le chemin d’accès. Arrêtez la réplication sur la grille source à l’aide des méthodes de l’étape 4a.
  1. Désactivez le crunching avec la commande :
avmaint config --ava asynccrunching=false
L’arrêt du crunch peut prendre jusqu’à 15 minutes. Vérifiez les journaux GSAN à partir des nœuds de données pour détecter tout message de « crunch ».
  1. Désactiver l’équilibrage
    1. Vérifiez si l’équilibrage est en cours d’exécution :
avmaint config --ava | grep balancemin
En général, l’équilibrage ne doit pas être activé (toute valeur autre que 0), mais il est tout de même important de le vérifier.
  1. Pour désactiver l’équilibrage :
avmaint config --ava balancemin=0
L’arrêt de l’équilibrage peut prendre jusqu’à 15 minutes. Vérifiez status.dpn pour voir si des bandes sont en cours de migration pour confirmer que l’équilibrage est terminé.
  1. Vérifiez la capacité :
    1. Vérifiez la capacité du système d’exploitation : 
avmaint nodelist --ava | grep fs-perc
  1. Vérifiez la taille des points de contrôle :
mapall copy ~/cps                # only if cps does not exist on the data nodes
mapall --noerror './cps'
  1. Consultez la liste des points de contrôle pour déterminer quels points de contrôle DOIVENT être conservés (le dernier point de contrôle validé sur tous les nœuds) :
cplist
En fonction des résultats ci-dessus, déterminez combien de points de contrôle peuvent être conservés, lesquels sont critiques et combien de nouveaux points de contrôle peuvent être créés.
  1. Renseignez-vous sur l’ordre des nœuds et sur les différences entre les numéros de nœud logiques et les numéros de nœud physiques :
nodenumbers
status.dpn
mapall --noerror 'tail -2 /data01/cur/gsan.log'
  1. Vérification du matériel
  • Toutes les tâches automatisées doivent maintenant être arrêtées. 
  • Le serveur doit avoir peu d’activité et il doit être sûr de poursuivre les tâches ou commandes manuelles. 
Vérifiez le serveur en vérifiant les logs GSAN sur les nœuds de données. Vérifiez que peu ou pas d’activité est consignée.
La commande uptime peut également être exécutée à l’aide de mapall, pour vérifier que la « moyenne de charge » sur les nœuds de données est faible (entre 0,01 et 0,05).

mapall --noerror 'uptime' 

(0.0) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.01, 0.02, 0.01 
(0.1) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01 
(0.2) ssh  -x  admin@10.xx.xx.xxx 'uptime'  
  16:39:29 up 100 days,  6:39,  0 users,  load average: 0.02, 0.01, 0.01
Les étapes ci-dessus définissent le serveur à un état hors production. Annulez toujours les modifications une fois que toutes les tâches manuelles ont été terminées.

Additional Information

 

Affected Products

Avamar, Avamar Server
Article Properties
Article Number: 000170876
Article Type: Solution
Last Modified: 06 Aug 2025
Version:  15
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.