PowerEdge : Comment résoudre les doubles erreurs et réparer les bandes endommagées dans les systèmes RAID

Summary: Cet article fournit des informations sur les doubles défauts et les perforations dans une baie RAID et fournit également des conseils sur la résolution du problème.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Sommaire

  1. Correction des doubles défauts et des crevaisons RAID
  2. Erreurs de données et doubles défaillances
  3. Perforations : qu’est-ce que c’est et quelle en est l’origine ?
  4. Prévention des problèmes et résolution des perforations
  5. Vidéos d’instructions sur la création/suppression d’une baie ou l’importation/exportation d’une configuration étrangère
Avertissement : Le fait de suivre ces étapes entraîne la perte de toutes les données de la baie. Avant d’effectuer les étapes, assurez-vous qu’une sauvegarde en mode fichier des données de la baie est terminée et que ces étapes n’ont pas d’impact sur les autres baies.  
 

Correction des doubles défauts et des crevaisons RAID

  1. Ignorer le cache conservé (s’il existe)
  2. Effacez les configurations étrangères (le cas échéant).
  3. Supprimez la matrice.
  4. Recherchez les disques défaillants
  5. Réinstallez tous les disques défaillants
  6. Effacez à nouveau toute configuration étrangère
  7. Remplacer tous les disques défaillants, y compris les disques défaillants prédictifs
  8. Mettez à jour le firmware (contrôleur, fond de panier (BP), disques) si nécessaire
  9. Créer la baie
  10. Effectuer une initialisation complète (pas une initialisation rapide)
  11. À ce stade, la baie doit être prête à être utilisée

 

Erreurs de données et doubles défaillances

Les systèmes RAID ne sont pas à l’abri des erreurs de données. Le contrôleur RAID et le micrologiciel du disque dur contiennent des fonctions permettant de détecter et de corriger de nombreux types d’erreurs de données, avant qu’elles ne soient écrites sur un disque ou une matrice.

  • Les erreurs de données peuvent être causées par des blocs défectueux physiques, tels qu’un « Head Crash » ou une dégradation de la capacité du plateau à stocker magnétiquement des bits à un emplacement spécifique.
  • Un bloc défectueux, également appelé adresse de bloc logique (LBA), peut également être dû à des erreurs de données logiques, telles qu’un « basculement de bits » ou l’écriture de données incorrectes sur un disque.
  • Les LBA défectueux sont généralement signalés comme Sense Code 3/11/0 (code de détection 3/11/0).
  • Les contrôleurs RAID basés sur du matériel Dell offrent des fonctions telles que Patrol Read et la vérification de la cohérence pour corriger de nombreux scénarios d’erreurs de données.

L’exécution d’opérations régulières de vérification de la cohérence permet de corriger les pannes uniques, qu’il s’agisse d’un bloc défectueux physique ou d’une erreur logique des données.

La vérification de cohérence permet également de réduire les risques d’une double défaillance en cas d’erreurs supplémentaires.

 

Plusieurs pannes uniques dans une matrice RAID 5 - Baie optimale

Graphique 1 Plusieurs pannes uniques dans une matrice RAID 5 - Baie optimale

 

Panne double avec un disque en échec (les données des bandes 1 et 2 sont perdues) : baie dégradée.

Graphique 2 Panne double avec un disque en échec (les données des bandes 1 et 2 sont perdues) : baie dégradée.

 

Bandes perforées (les données des bandes 1 et 2 sont perdues en raison d’une double défaillance) : matrice optimale.

Graphique 3 Bandes perforées (les données des bandes 1 et 2 sont perdues en raison d’une double défaillance) : matrice optimale.

Retour au tableau des matières

Perforations : qu’est-ce que c’est et quelle en est l’origine ?

Une perforation est une fonction des contrôleurs Dell PERC, conçue pour permettre au contrôleur de restaurer la redondance de la matrice malgré la perte de données due à une double défaillance.

  • Une crevaison est également connue sous le nom de « reconstruction avec erreurs ».
  • Une crevaison peut se produire dans l’une des deux situations suivantes : une double panne existe déjà, ou une double panne n’existe pas.
  • Une perforation peut se produire à trois emplacements : un espace vide, un espace de données non critique ou un espace de données accessible.
  • Tout état entraînant l’inaccessibilité des données sur la même bande, sur plus d’un disque, constitue une double défaillance.
  • Les doubles défaillances entraînent la perte de toutes les données sur la bande impactée.
  • Toutes les perforations sont des doubles défaillances, mais toutes les doubles défaillances ne sont pas des perforations.

 

Retour au tableau des matières

Prévention des problèmes et résolution des perforations

La maintenance proactive permet de corriger les erreurs existantes et d’éviter que certaines erreurs ne se produisent.

  • Mettre à jour les pilotes et le firmware sur les contrôleurs, disques durs, fonds de panier et autres périphériques.
  • Effectuer des opérations de routine de vérification de la cohérence.
  • Consultez les journaux pour trouver des indications sur les problèmes.
Remarque : Si la vérification de la cohérence s’effectue sans erreur, vous pouvez en toute sécurité supposer que la matrice est maintenant en bon état et que la défaillance a disparu. Les données peuvent maintenant être restaurées sur la matrice saine.
 
Attention : S’il existe une double défaillance ou une crevaison connue ou suspectée, procédez comme suit pour réduire le risque de problèmes plus graves :
  • Effectuer une opération de routine de vérification de la cohérence (la baie doit être optimale)
  • Déterminez s’il y a des problèmes matériels
  • Vérifiez le journal du contrôleur
  • Exécutez un diagnostic du matériel
  • Contactez le support technique Dell si besoin.
Remarque : Si ces étapes ont été effectuées, d’autres problèmes doivent être pris en compte. Les perforations peuvent entraîner un état de défaillance prévisible des disques durs au fil du temps. Les erreurs de données qui se propagent à un disque sont signalées en tant qu’erreurs de support sur le disque, même s’il n’existe aucun problème matériel.
 
Remarque : La surveillance du système permet de détecter et de corriger les problèmes en temps opportun, ce qui réduit également le risque de problèmes plus graves.

Retour au tableau des matières

 

Vidéos d’instructions sur la création/suppression d’une baie ou l’importation/exportation d’une configuration étrangère

 

Création ou suppression d’un disque virtuel dans iDRAC 9

Durée : 00:01:53
Le cas échéant, les paramètres de langue des sous-titres peuvent être choisis à l’aide de l’icône CC de ce lecteur vidéo.

 

Importation d’une configuration étrangère pour Dell PERC

Durée : 00:02:07
Lorsqu’ils sont disponibles, les paramètres de langue des sous-titres peuvent être choisis à l’aide de l’icône CC de ce lecteur vidéo.

Procédure d’effacement de la configuration étrangère pour Dell PERC

Durée : 00:02:02
Le cas échéant, les paramètres de langue des sous-titres peuvent être choisis à l’aide de l’icône CC sur ce lecteur vidéo.

Retour au tableau des matières

Affected Products

OEMR R240, OEMR R250, OEMR R260, OEMR R340, OEMR R350, OEMR XE R350, OEMR R360, OEMR XE R360, OEMR R440, OEMR R450, OEMR R540, OEMR R550, OEMR R640, OEMR XL R640, OEMR R6415, OEMR R650, OEMR R650xs, OEMR R6515, OEMR R6525, OEMR R660, OEMR XL R660 , OEMR R660xs, OEMR R6615, OEMR R6625, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R7415, OEMR R7425, OEMR R750, OEMR R750xa, OEMR R750xs, OEMR R7515, OEMR R7525, OEMR R760, OEMR R760xa, OEMR R760XD2, OEMR XL R760, OEMR R760xs, OEMR R7615, OEMR R7625, OEMR R840, OEMR R860, OEMR R940, OEMR R940xa, OEMR R960, OEMR T340, OEMR T350, OEMR T360, OEMR T440, OEMR T550, OEMR T560, OEMR T640, OEMR XL T640, OEMR XL R240, OEMR XL R340, OEMR XL R660xs, OEMR XL R6615, OEMR XL R6625, OEMR XL R760xs, OEMR XL R7615, OEMR XL R7625, PowerEdge RAID Controller H345, PowerEdge RAID Controller H355 Front SAS, PowerEdge RAID Controller H355 Adapter SAS, PowerEdge RAID Controller H750 Adapter SAS, PowerEdge RAID Controller H755 Adapter, PowerEdge RAID Controller H755 Front SAS, PowerEdge RAID Controller H965i Adapter, Poweredge C4140, PowerEdge C6400, PowerEdge C6420, PowerEdge C6520, PowerEdge C6525, PowerEdge C6600, PowerEdge C6615, PowerEdge C6620, PowerEdge FC640, PowerEdge HS5610, PowerEdge HS5620, PowerEdge M640, PowerEdge M640 (for PE VRTX), PowerEdge MX5016s, PowerEdge MX7000, PowerEdge MX740C, PowerEdge MX750c, PowerEdge MX760c, PowerEdge MX840C, PowerEdge R240, PowerEdge R250, PowerEdge R260, PowerEdge R340, PowerEdge R350, PowerEdge R360, PowerEdge R440, PowerEdge R450, PowerEdge R540, PowerEdge R550, PowerEdge R640, PowerEdge R6415, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R660, PowerEdge R660xs, PowerEdge R6615, PowerEdge R6625, PowerEdge R670, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R7415, PowerEdge R7425, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R760, PowerEdge R760XA, PowerEdge R760xd2, PowerEdge R760xs, PowerEdge R7615, PowerEdge R7625, PowerEdge R770, PowerEdge R840, PowerEdge R860, PowerEdge R940, PowerEdge R940xa, PowerEdge R960, PowerEdge RAID Controller H330, PowerEdge RAID Controller H730P, PowerEdge RAID Controller H740P, PowerEdge RAID Controller H965e Adapter, PowerEdge T340, PowerEdge T350, PowerEdge T360, PowerEdge T440, PowerEdge T550, PowerEdge T560, PowerEdge T640 ...
Article Properties
Article Number: 000139251
Article Type: How To
Last Modified: 02 Sept 2025
Version:  11
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.