Base de connaissances

Comment retirer les blocs défectueux sur un Disque Dur Virtuel sur les serveurs PowerEdge




Cet article fournit les étapes de diagnostic à suivre lorsque vous rencontrez des blocs défectueux (puncturing bad blocks) sur vos disques durs avec des contrôleurs PERC, surtout si aucune sauvegarde n'est possible.
Les informations suivantes peuvent vous aider à rétablir un Disque Dur Virtuel impacté vers un état optimal.


Table des matières:

  1. Description de l'erreur
  2. Quelle est la cause?
  3. Etapes pour résoudre le problème:

Description de l'erreur:

1. Erreur:
L'outil Dell Système E-Support Tool (DSET) ou OpenManage Server Administrator (OMSA) montrent une croix rouge en face d'un Disque Virtuel (Figure 1 en anglais).



Figure 1: Disque Virtuel avec une croix rouge devant Status (exemple H800)

Note: L'outil de diagnostic DSET est un utilitaire qui recueille la configuration et les données du journal pour divers matériels du châssis, le stockage, les logiciels et les composants du système d'exploitation d'un serveur Dell PowerEdge et consolide les données dans un fichier .zip.
Note: Dell OpenManage Server Administrator (OMSA) fournit une solution complète, de la gestion de systèmes un-à-un. OMSA peut être classé en deux applications:
- Interface utilisateur graphique basée sur un navigateur Web (GUI)
- Command Line Interface (CLI) -

2. Erreur:
Le Journal système Windows affiche les blocks défectueux Bad (figure 2 en anglais).



Figure 2 : Blocs défectueux dans le journal Windows System montré dans le DSET

3. Erreur
Le fichier "Alert Log" dans le DSET contient un message d'erreur spécifique (figure 3 en anglais)



Figure 3 : Alert Log dans Windows

Le disque dur virtuel contient l'erreur suivante (exemple H800):

Severity: Critical
ID : 2387
Date and Time : Tue Feb 07 22:58:11 20xx
Category : Storage Service
Description : Virtual disk bad block medium error is detected.: Virtual Disk 0 (Virtual Disk 0) Controller 0 (PERC H800 Adapter)

4. Erreur :
Le journal du contrôleur raid contient l'erreur suivante:

02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f

Attention: Il est possible que le journal du contrôleur ne montre aucune erreur

Vous trouverez plus d'informations pour récupérer ces journaux spécifiques dans notre article sur ce sujet.


Quelle est la cause :


Les RAIDs ne sont pas immunisés face aux erreurs de données. Les contrôleurs et les firmware des disques durs contiennent des fonctionnalités pour détecter et corriger de nombreuses erreurs avant qu'elles ne soient écrites sur le RAID. Utiliser des firmware obsolètes peut entrainer l'écriture de données corrompues sur un raid/disque car il ne contiendra pas les dernières fonctionnalités de détection/correction d'erreur.
Les erreurs de données peuvent aussi être causées par des blocs du disque physiquement défectueux. Par exemple, cela arrive quand la tête de lecture touche le plateau. Un bloc disque peut aussi devenir incorrect dans le temps du à une dégradation magnétique du plateau. Dans une grande partie des cas, ces blocs défectueux peuvent être lus et corrigés.

Un bloc défectueux, aussi connu comme Logical Block Address (LBA) peut être causé par une erreur logique des données. Cela arrive lorsque la donnée est incorrectement écrite sur un disque dur et que cette écriture est remontée comme valide. Egalement, des bons blocks stockés sur un disque peuvent être changés par inadvertance, il faut garder à l'esprit que la tête de lecture entraine des actions magnétiques sur le plateau et que dans de rares conditions, certains blocks sont modifiés. Cela reste rare mais dans ce cas cette partie des données devient alors corrompue. Une donnée est détectée comme défectueuse lorsque la différence du checksum entre le bloc d'origine et le bloc lu n'est pas égale à 0, apparait alors une erreur dans les journaux.

Pour plus d'informations, lisez notre article sur les Doubles Fautes dans les RAIDS (en anglais)


Etapes pour résoudre le problème :

  1. Créez une sauvegarde de vos données validées, si possible.
  2. Veiller à ce que tous les disques en prédiction d'échec soient remplacés.
  3. Mettez à jour tous les firmwares des disques durs
  4. OMSA offre la possibilité d'effacer les erreurs de blocs. Pour effacer les blocs défectueux la procédure suivante est recommandée:

a. Lorsque vous effectuez une sauvegarde du disque virtuel avec l'option "Vérifier" sélectionnée, deux scénarios peuvent se produire:

  • L'opération de sauvegarde échoue à un ou plusieurs fichiers. Dans ce cas, restaurer le fichier à partir d'une sauvegarde précédente. Après la restauration du fichier, passez à l'étape suivante.
  • L'opération de sauvegarde se termine sans erreurs. Cela indique qu'il n'y a pas de mauvais blocs sur la partie écrite de votre disque virtuel.
Note: Si vous recevez des alertes de blocs défectueux, c'est qu'ils ne se situent pas dans une zone de données.

b. Exécutez la tâche "Patrol Read" (Dans la section Disque Virtuel de OMSA) et vérifiez le journal d'évènements pour s'assurer qu'il n'y a pas de nouveaux blocs défectueux découverts. Si aucun nouveau bloc n'est découvert alors votre RAID est optimal et réparé, dans le cas contraire continuez à l'étape suivante.

Note: Pensez à désactiver le Patrol Read automatique avant de le lancer manuellement la tâche.

c. Pour nettoyer ces blocs défectueux, exécutez la tâche "Clear Virtual Disk Bad Blocks". Cela peut être fait dans l'interface de OMSA dans les options du contrôleur ou en ligne de commande.

omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id

Note: Pour obtenir les ID, tapez la commande omreport storage controller pour afficher l'ID du contrôleur, puis omreport storage vdisk controller=ID pour afficher l'ID du disque dur virtuel.

Besoin d'informations supplémentaires?
Accéder à la page d'accueil du Contenu PowerEdge

Visiter et demander de l'aide sur le Forum Dell

Créer une demande de Support en Ligne


Identificateur de l'article : SLN111146

Date de la dernière modification : 04/05/2016 13:24


Évaluer cet article

Précis
Utile
Facile à comprendre
Cet article était-il utile?
Oui Non
Envoyez-nous votre évaluation
Les commentaires ne peuvent pas contenir ces caractères spéciaux : <>()\
Désolés, notre système d’évaluation n’est pas accessible actuellement. Veuillez réessayer plus tard.

Nous vous remercions pour vos commentaires.