Bilan de santé général Data Domain

Summary: Résumé : Ce document fournit des actions que le support technique doit effectuer lors de l’exécution d’un bilan de santé général sur un système Data Domain (DD). Elle inclut des commandes et sorties générales permettant d’identifier les alertes ou les erreurs de configuration. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

S’applique à :
  • Toutes les versions de Data Domain Operating System (DDOS)
  • Tous les modèles actuels 

Étape 1 : connectez-vous au système DD à l’aide de SSH (par exemple, PuTTY) en tant qu’utilisateur administrateur.

Étape 2 : assurez-vous que le système de fichiers est activé
# system show serialno
# date
# filesys status
The filesystem is enabled and running.

Étape 3 : assurez-vous que la version DDOS est prise en charge pour le modèle DD.
# system show model
# system show version

Article 81247 : Versions

du logiciel DDOSÉtape 4 : toute alerte ayant un impact sur l’intégrité du système doit être traitée.
# alerts show current
Article: 14723: Data Domain : vérification des alertes sur un système Data Domain.

Étape 5 : assurez-vous que /data est inférieur à 90 %.
Pour maintenir les niveaux de performances attendus, Data Domain recommande de toujours maintenir le pourcentage utile en dessous de 90 %.
# df

Exemple de sortie :
Active Tier:
Resource           Size GiB    Used GiB   Avail GiB   Use%   Cleanable GiB*
----------------   --------   ---------   ---------   ----   --------------
/data: pre-comp           -   7259347.5           -      -                -
/data: post-comp   304690.8    251252.4     53438.5    82%           51616.1 
/ddvar                 29.5        12.5        15.6    44%                -
----------------   --------   ---------   ---------   ----   --------------
Article 54303 : Data Domain : Comment résoudre les problèmes de capacité.
 


Étape 6a : assurez-vous qu’il n’y a pas de disques en échec (F), en cours de reconstruction (R) ou d’absence (A).
# disk show state

Exemple de sortie :
sysadmin## disk show state
Enclosure   Disk
            1  2  3  4  5  6  7  8  9  10 11 12 13 14 15 16
---------   ------------------------------------------------
1           .  .  .  .  s  .  .  .  .  .  .  .
2           .  .  .  .  .  .  .  .  .  A  .  .  .  .  S  R
3           E  .  .  .  .  .  .  .  .  C  .  .  .  .  .  .
---------   ------------------------------------------------
Legend   State          Count
------   ------------   -----
.        In Use Disks   25
s        Spare Disks    1
R        Spare (reconstructing) Disks 1
C        Copy Recovery Disks 1
A        Absent Disks   1
E        Exceeded Error Threshold
------   ------------   -----
Article: 21916: Data Domain - Description

de l’état du disqueÉtape 6b : Vérifiez la fiabilité du disque pour voir si un remplacement proactif du disque est nécessaire.
Assurez-vous qu’aucun disque avec des « Secteurs réalloués » supérieurs à 1 000 ou augmentant quotidiennement
# disk show reliability-data
Exemple de sortie :
Disk Show Reliability-Data
--------------------------
Disk         ATA Bus   Reallocated   Temperature
 (enc/disk)   CRC Err   Sectors
----------   -------   -----------   -----------
1.1          0         0             29 C   84 F
1.2          0         0             29 C   84 F
1.3          0         0             29 C   84 F
1.4          0         0             27 C   81 F
2.1          0         0             26 C   79 F
2.2          0         0             25 C   77 F
2.3          0         0             24 C   75 F
2.4          0         0             24 C   75 F
2.5         89         0             25 C   77 F
2.6          0         0             25 C   77 F
2.7          0         3156          24 C   75 F
2.8          0         0             23 C   73 F
2.9          0         0             24 C   75 F
2.10         0         0             24 C   75 F
2.11         0         0             23 C   73 F
2.12         0         0             23 C   73 F
2.13         0         0             25 C   77 F
2.14         0         0             24 C   75 F
2.15         0         0             22 C   72 F
2.16         0         0             22 C   72 F
 
Étape 7 : testez les communications sur les ports avec des câbles connectés pendant 5 minutes. En cas d’erreur, il est recommandé de replacer les câbles ou les cartes LCC.
# enclosure show topology
# enclosure test topology port 5 minutes

Article: 35680: Data Domain : Configuration, vérifications et tests

de topologie des câbles SASÉtape 8 - Mauvaise configuration du système :  Si la sortie indique une ou plusieurs erreurs de composant, ce problème doit être résolu.
# enclosure show misconfiguration

Exemple de sortie :
Enclosure Show Misconfiguration
-------------------------------
Memory Risers:
    No misconfiguration found.
Memory DIMMs:
    No misconfiguration found.
IO Cards:
    No misconfiguration found.
CPUs:
    No misconfiguration found.
Disks:
    No misconfiguration found.
 
 


Étape 9 : si la réplication est configurée, vérifiez s’il y a des erreurs. S’il y a une erreur, elle doit être corrigée.
# replication status

Article: 43349:  Data Domain – État

de la réplicationÉtape 10 : si la bibliothèque VTL est en cours d’utilisation.
# vtl status

Article: 12128: Dépannage de Data Domain VTL Target Visibility

Étape 11 : si système haute disponibilité (HA)
# ha status

Exemple de sortie :
SE@apollo-440-n1-p0(active:0)## ha status
HA System name: apollo-440-n1.chaos.local
HA System status: highly available
 
Node Name                         Node id   Role      HA State
-------------------------------   -------   -------   --------
apollo-440-n1-p0.chaos.local   0         active    online
apollo-440-n1-p1.chaos.local   1         standby   online
-------------------------------   -------   -------   --------
# ha status detailed
Exemple de sortie :
SE@apollo-440-n1-p0(active:0)## ha status detailed
HA System name: apollo-440-n1.chaos.local
HA System Status: highly available
Interconnect Status: ok
Primary Heartbeat Status:  ok
External LAN Heartbeat Status: not ok
Hardware compatibility check: ok
Software Version Check:   ok
 
Node apollo-440-n1-p0.chaos.local:
        Role:      active
        HA State:  online
        Node Health: ok
 
Node apollo-440-n1-p1.chaos.local:
        Role:     standby
        HA State: online
        Node Health: ok
 
Mirroring Status:
Component Name   Status
--------------   ------
nvram            ok
registry         ok
sms              ok
ddboost          ok
cifs             ok
--------------   ------
Sur l’article 17861 : Bilan de santé des appliances Data Domain HA (DDHA) 
 


Logs TSR :
Attention particulière pour les systèmes Data Domain basés sur Dell PowerEdge (par exemple : DD6900, DD9400, DD9900, DD3300 et versions ultérieures)
Connectez-vous à l’iDRAC et vérifiez l’état et l’intégrité du système. Collectez un journal TSE (si nécessaire).

Article 21925 : Data Domain : Comment collecter un journal TSR.

Étape finale de la demande de recertification : redémarrez enfin le système et, une fois que le système est de nouveau en ligne, recherchez les alertes actuelles. Toute alerte ayant un impact sur l’intégrité du système doit être traitée.

Si une assistance supplémentaire est requise, veuillez ouvrir une demande de service auprès de votre fournisseur de support.

Additional Information

Regardez cette vidéo :
 

Affected Products

Data Domain

Products

Data Domain, Data Domain, Data Domain Deduplication Storage Systems, Data Domain Replicator, DD OS, DD6300 Appliance, DD6800 Appliance, DD6900 Appliance, DD7200 Appliance, DD9300 Appliance, DD9400 Appliance, DD9800 Appliance, DD9900 Appliance
Article Properties
Article Number: 000197930
Article Type: How To
Last Modified: 16 Sept 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.