Gestion des dommages (blocs défectueux) sur les disques virtuels pour les serveurs PowerEdge

Resumen: étapes de dépannage pour les blocs défectueux (perforations) sur les disques durs des serveurs PowerEdge équipés de contrôleurs PERC. Les informations suivantes peuvent vous aider à rétablir un disque virtuel affecté à un état optimal, en particulier lorsqu’aucune sauvegarde n’est possible. ...

Este artículo se aplica a Este artículo no se aplica a Este artículo no está vinculado a ningún producto específico. No se identifican todas las versiones del producto en este artículo.

Consulte estos recursos

Síntomas

Causa

Resolución

Cet article présente les étapes de dépannage en cas de blocs défectueux (perforations) sur les disques durs des serveurs PowerEdge équipés de contrôleurs PERC. Les informations suivantes peuvent vous aider à rétablir un disque virtuel affecté à un état optimal, en particulier lorsqu’aucune sauvegarde n’est possible.

1. Description des pannes

Panne n° 1 :

OpenManage Server Administrator (OMSA) affiche une croix rouge devant un disque virtuel (Figure 1).

SLN111146_en_US__11343098652871.1
Figure 1 : Disque virtuel avec une croix rouge dans la colonne Status (exemple H800)

Remarque : Dell OpenManage Server Administrator (OMSA) fournit une solution de gestion de systèmes un-à-un complète. OMSA peut être utilisé de deux façons :
- Intégrée : interface graphique (GUI) de type navigateur Web.
- Interface de ligne de commande (CLI) : par l’intermédiaire du système d’exploitation

Panne n° 2 :

Le journal système de Windows affiche des erreurs de bloc défectueux (Figure 2).

SLN111146_en_US__31343098674763.2
Figure 2 : Erreur de bloc défectueux dans le journal système Windows

Panne n° 3 :

Le journal du contrôleur RAID (TTYLOG) affiche des erreurs telles que :

02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f

Avertissement : le journal du contrôleur (TTYLOG) peut ne présenter aucune erreur.

Vous trouverez plus d’informations sur la réception de ces journaux spécifiques dans notre article sur la collecte de journaux.

2. Cause :

Les systèmes RAID ne sont pas à l’abri des erreurs de données. Le contrôleur RAID et le micrologiciel du disque dur contiennent des fonctions permettant de détecter et de corriger de nombreux types d’erreurs de données, avant qu’elles ne soient écrites sur un disque ou une matrice. Utiliser un firmware obsolète peut entraîner l’écriture de données incorrectes sur un disque ou une baie, car le firmware ne dispose pas des fonctionnalités de gestion et de correction des erreurs disponibles dans les dernières versions.
Les erreurs de données peuvent également être provoquées par des blocs physiques défectueux. Par exemple, une erreur peut se produire lorsque la tête de lecture/écriture impacte le plateau tournant (cela s’appelle également une « panne de la tête »). Les blocs peuvent également devenir défectueux avec le temps, à cause de la dégradation de la capacité du plateau à stocker magnétiquement des bits dans un emplacement spécifique. Souvent, les blocs devenus défectueux à cause de la dégradation du plateau peuvent être lus correctement. Un bloc ainsi endommagé peut n’être détecté que par intermittence ou en effectuant des diagnostics étendus sur les disques.

Un bloc, également appelé adressage de blocs logiques (LBA), peut également devenir défectueux à cause d’erreurs de données logiques. Cela se produit lorsque les données sont écrites de manière incorrecte sur un disque, même si l’opération d’écriture est signalée comme réussie. En outre, des données exactes stockées sur un disque peuvent être modifiées par inadvertance. Une « inversion de bit » peut par exemple se produire lorsque la tête de lecture/écriture passe sur ou écrit sur un emplacement à proximité et provoque un changement de valeur des données, qui passent de 0 à 1 et vice versa. Dans cette situation, la « cohérence » des données est altérée. La valeur des données sur un bloc spécifique est différente de celle des données d’origine et peut ne pas correspondre à la somme de contrôle des données. Le LBA physique fonctionne et les opérations d’écriture peuvent s’effectuer sans problème, mais il contient des données incorrectes et peut être interprété comme un bloc défectueux.

Pour plus d’informations, lisez notre article Doubles défaillances dans les systèmes RAID.

3. Étapes de résolution du problème :

Remarque : les données actuelles présentes sur le disque virtuel sont corrompues et doivent être supprimées.

Créez une sauvegarde des données validée au niveau des fichiers.
- Une sauvegarde basée sur des blocs transfèrerait simplement le problème.
- Une sauvegarde au niveau des fichiers indique les fichiers corrompus (ces fichiers ne doivent pas être sauvegardés).
- Il n’y a jamais de garantie à 100 % que vous conserverez toutes les données si une bande endommagée existe déjà.
Assurez-vous que tous les disques défectueux affichant des pannes prédictives sont remplacés.
Supprimez et recréez le disque virtuel.
- Cette étape permet de supprimer toutes les données du disque virtuel.
- Supprimez la matrice.
- Recréez la matrice comme vous le souhaitez.
Effectuez une initialisation complète du disque virtuel.
- Assurez-vous que l’initialisation rapide n’est pas sélectionnée.
- Seule une initialisation complète (= lente) corrige le problème.
Effectuez une vérification de la cohérence du nouveau disque virtuel créé.
- Si la vérification de la cohérence s’effectue sans erreur, cela signifie que la baie est maintenant en bon état et que le dommage a disparu.
Les données peuvent maintenant être restaurées sur le disque virtuel sain.
Recommandation : mettez à niveau tous les firmwares de disques durs vers la version la plus récente.

4. Informations supplémentaires

OMSA permet d’effacer les avertissements concernant les blocs défectueux. Pour effacer les blocs défectueux, nous vous recommandons de procéder comme suit :

Lors de l’exécution d’une sauvegarde du disque virtuel avec l’option Verify sélectionnée, deux scénarios peuvent se produire :
- L’opération de sauvegarde échoue sur un ou plusieurs fichiers. Dans ce cas, restaurez le fichier à partir d’une sauvegarde précédente. Après avoir restauré le fichier, passez à l’étape suivante.
- L’opération de sauvegarde se termine sans erreur. Cela signifie qu’il n’y a pas de blocs défectueux sur la partie écrite de votre disque virtuel.
Remarque : si vous recevez toujours des avertissements concernant des blocs défectueux, cela signifie que les blocs défectueux se trouvent dans une zone sans données.
Exécutez Patrol Read (sous Virtual Disk Tasks dans OMSA) et consultez le journal des événements système pour vous assurer qu’aucun nouveau bloc défectueux n’est détecté. Si des blocs défectueux existent encore, passez à l’étape suivante. Sinon, le problème est supprimé.

Remarque : la fonction Patrol Read automatisée doit être désactivée avant que l’option d’exécution manuelle de cette action ne s’affiche dans OMSA.
Pour effacer ces blocs défectueux, exécutez la tâche Clear Virtual Disk Bad Blocks. Vous pouvez effectuer cette opération dans l’interface graphique d’OMSA ou utiliser la commande de la CLI :
omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id

Remarque : pour obtenir les valeurs de l’ID du contrôleur et de l’ID de disque virtuel, saisissez omreport storage controller pour afficher les ID du contrôleur, puis saisissez omreport storage vdisk controller=ID pour afficher les ID de disques virtuels.

Productos afectados

Servers

Número del artículo: 000139277

Tipo de artículo: Solution

Última modificación: 01 oct 2021

Versión: 3

Compruebe si el dispositivo está cubierto por los servicios de soporte.

Gestion des dommages (blocs défectueux) sur les disques virtuels pour les serveurs PowerEdge

Síntomas

Causa

Resolución

Sommaire :

1. Description des pannes

Panne n° 1 :

Panne n° 2 :

Panne n° 3 :

2. Cause :

3. Étapes de résolution du problème :

4. Informations supplémentaires

Productos afectados

Propiedades del artículo

Encuentre respuestas a sus preguntas de otros usuarios de Dell

Servicios de soporte

Propiedades del artículo

Encuentre respuestas a sus preguntas de otros usuarios de Dell

Servicios de soporte

Bienvenido

Bienvenido a Dell

Gestion des dommages (blocs défectueux) sur les disques virtuels pour les serveurs PowerEdge

Artículo detallado

Síntomas

Causa

Resolución

Productos afectados

Síntomas

Causa

Resolución

Sommaire :

1. Description des pannes

Panne n° 1 :

Panne n° 2 :

Panne n° 3 :

2. Cause :

3. Étapes de résolution du problème :

4. Informations supplémentaires

Productos afectados

Propiedades del artículo

Encuentre respuestas a sus preguntas de otros usuarios de Dell

Servicios de soporte

Propiedades del artículo

Encuentre respuestas a sus preguntas de otros usuarios de Dell

Servicios de soporte