Avamar : Matériel Gen4S : Comment résoudre divers événements et erreurs de disque
Résumé: Cet article traite d’un grand nombre d’erreurs courantes liées aux disques signalées sur un nœud Gen4S, ainsi que des actions requises.
Symptômes
Des événements similaires aux événements suivants sont observés dans l’interface utilisateur ou les fichiers log :
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Information unit CRC error detected, CDB = 0x28 0x00 0xb6 0x77 0xc3 0x07 0x00 0x01 0xd0 0x00, Sense = 0x70 0x00 0x0b 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x47 0x03 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Unrecovered read error, CDB = 0x28 0x00 0xd2 0x91 0xe0 0xf7 0x00 0x00 0x40 0x00, Sense = 0xf0 0x00 0x03 0xd2 0x91 0xe0 0xf7 0x0a 0x00 0x00 0x00 0x00 0x11 0x00 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Hardware impending failure general hard drive failure, CDB = 0x03 0x00 0x00 0x00 0x40 0x00, Sense = 0x70 0x00 0x00 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x5d 0x10 0x00 0x00 0x00 0x00
Controller ID: 0 PD Reset: PD = Port 0 - 3:2:n, Error = 3, Path = 0x5001234567890
Controller ID: 0 Unexpected sense: PD = -:-:n Recovered data - recommended rewrite, CDB = 0x2f 0x00 0x01 0x09 0x80 0x00 0x00 0x10 0x00 0x00, Sense = 0xf0 0x00 0x01 0x01 0x09 0x8f 0xed 0x18 0x00 0x00 0x00 0x00 0x18 0x06 0x00 0x80 0x09 0x19
Controller ID: 0 Command timeout on PD: PD = Port 0 - 3:2:n No additional sense information, CDB = 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff, Sense = , Path = 0x5001234567890
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Logical block address out of range, CDB = 0x2a 0x00 0xac 0x64 0xcd 0xe6 0x00 0x00 0x08 0x00, Sense = 0xf0 0x00 0x05 0xac 0x64 0xcd 0xe6 0x0a 0x00 0x00 0x00 0x00 0x21 0x00 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Power on, reset, or bus device reset occurred, CDB = 0x2a 0x00 0x41 0xab 0x7a 0x00 0x00 0x00 0x80 0x00, Sense = 0x70 0x00 0x06 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00
Controller ID: 0 PD Predictive failure: Port 0 - 3:2:n
-
- 3:2:0 - 3:2:11 ou - :- :0 - - :- :11 sont les disques standard internes
- 3:2:12 ou - :- :12 est le disque SSD interne.
Cause
Reportez-vous à la section Résolution pour connaître les causes et les actions.
Résolution
1. Connectez-vous à Avamar Utility Node en tant qu’administrateur.
2. Élévation au niveau du privilège root.
3. Chargez les clés racine par article Avamar : Connexion à un serveur Avamar et chargement de différentes clés.
4. À l’aide des informations de l’événement de l’interface utilisateur ou de la demande de service d’appel à distance, déterminez le nœud qui a généré le message d’erreur.
5. Connectez-vous au nœud en tant qu’utilisateur root à l’aide de la commande ci-dessous :
ssn 0.# --user=root
(0.# étant le numéro du nœud physique)
6. Sur le nœud concerné :
un. Vérifiez l’état actuel des disques :
avsysreport pdisk
b. Passez en revue les /var/log/messages Fichier pour les événements relatifs au disque signalant l’événement.
Actions requises en fonction des événements consignés :
- Pour l’événement « Données récupérées - réécriture recommandée » :
- Si le disque n’a signalé aucun autre événement, celui-ci peut être ignoré en toute sécurité
- En cas d’autres événements tels qu’une erreur de lecture non restaurée, contactez Dell Technologies pour déterminer si le disque doit être remplacé de manière proactive.
- Pour l’événement « Adresse de bloc logique hors plage » :
- Si le disque n’a signalé aucun autre événement, celui-ci peut être ignoré en toute sécurité
- En cas d’autres événements tels qu’une erreur de lecture non restaurée, contactez Dell Technologies pour déterminer si le disque doit être remplacé de manière proactive.
- Pour l’événement « Erreur de lecture non restaurée » :
- Si l’événement se répète plus de trois fois sur un seul disque, le disque en question peut présenter un problème d’intégrité. Contactez Dell Technologies pour déterminer si le disque doit être remplacé de manière proactive.
- Pour l’événement « Erreur CRC de l’unité d’information détectée » :
- Si le disque signale l’événement 3:2:12, cela indique que le disque SSD est défaillant. Contactez Dell Technologies pour remplacer le nœud à l’aide de la procédure de transfert de nœud.
- Si le disque signale l’événement 3:2:0-3:2:11, cela indique que le disque dur est défaillant. Contactez Dell Technologies pour un remplacement proactif du disque.
- Pour l’événement « Défaillance matérielle imminente Panne générale de disque dur » :
-
- Si le disque signale l’événement 3:2:12, cela signifie que le disque SSD est défaillant (ou a échoué). Contactez Dell Technologies pour remplacer le nœud à l’aide de la procédure de transfert de nœud.
- Si le disque signale l’événement 3:2:0-3:2:11, cela signifie que le disque dur est défaillant (ou a échoué). Contactez Dell Technologies pour un remplacement proactif du disque.
- Pour l’événement « Défaillance prédictive :
- Si le disque signale l’événement 3:2:12, le disque SSD signale une mise en garde de défaillance prédictive via la fonction SMART et indique que le disque SSD est défaillant. Contactez Dell Technologies pour remplacer le nœud à l’aide de la procédure de transfert de nœud.
- Si le disque signale l’événement 3:2:0-3:2:11, le disque dur a signalé une mise en garde de panne prédictive via la fonction SMART et indique que le disque dur est défaillant. Contactez Dell Technologies pour un remplacement proactif du disque.
- Pour l’événement « La mise sous tension, la réinitialisation ou la réinitialisation du périphérique de bus s’est produite » :
- Passez en revue la
/var/log/messagespour vérifier si un seul disque ou plusieurs disques signalent l’erreur.- Si un seul disque signale l’erreur, celle-ci peut être liée aux vérifications de cohérence hebdomadaires. Contactez Dell Technologies pour déterminer si le disque doit être remplacé de manière proactive.
- Si plusieurs disques signalent l’erreur, le firmware du module d’extension est obsolète ou le châssis est en état de défaillance ou de défaillance. Contactez Dell Technologies pour passer en revue les niveaux de firmware ou remplacer le nœud à l’aide de la procédure de transfert de nœud.
- Passez en revue la
- Pour l’événement « Reset » :
- Passez en revue la
/var/log/messagespour vérifier si un seul disque ou plusieurs disques signalent l’erreur.- Si le disque a été remplacé récemment, ce message est attendu et peut être ignoré.
- Si le disque n’a pas été remplacé et reconstruit par lui-même, il se peut qu’il soit défaillant ou en panne. Contactez Dell Technologies pour un remplacement proactif du disque.
- Passez en revue la
- Pour les événements « Command timeout on » ou toute autre erreur non déjà mentionnée, contactez Dell Technologies afin de déterminer la marche à suivre.