PowerEdge : Comment résoudre les doubles erreurs et réparer les bandes endommagées dans les systèmes RAID
Summary: Cet article fournit des informations sur les doubles défauts et les perforations dans une baie RAID et fournit également des conseils sur la résolution du problème.
Instructions
Sommaire
- Correction des doubles défauts et des crevaisons RAID
- Erreurs de données et doubles défaillances
- Perforations : qu’est-ce que c’est et quelle en est l’origine ?
- Prévention des problèmes et résolution des perforations
- Vidéos d’instructions sur la création/suppression d’une baie ou l’importation/exportation d’une configuration étrangère
Correction des doubles défauts et des crevaisons RAID
- Ignorer le cache conservé (s’il existe)
- Effacez les configurations étrangères (le cas échéant).
- Supprimez la matrice.
- Recherchez les disques défaillants
- Réinstallez tous les disques défaillants
- Effacez à nouveau toute configuration étrangère
- Remplacer tous les disques défaillants, y compris les disques défaillants prédictifs
- Mettez à jour le firmware (contrôleur, fond de panier (BP), disques) si nécessaire
- Créer la baie
- Effectuer une initialisation complète (pas une initialisation rapide)
- À ce stade, la baie doit être prête à être utilisée
Erreurs de données et doubles défaillances
Les systèmes RAID ne sont pas à l’abri des erreurs de données. Le contrôleur RAID et le micrologiciel du disque dur contiennent des fonctions permettant de détecter et de corriger de nombreux types d’erreurs de données, avant qu’elles ne soient écrites sur un disque ou une matrice.
- Les erreurs de données peuvent être causées par des blocs défectueux physiques, tels qu’un « Head Crash » ou une dégradation de la capacité du plateau à stocker magnétiquement des bits à un emplacement spécifique.
- Un bloc défectueux, également appelé adresse de bloc logique (LBA), peut également être dû à des erreurs de données logiques, telles qu’un « basculement de bits » ou l’écriture de données incorrectes sur un disque.
- Les LBA défectueux sont généralement signalés comme Sense Code 3/11/0 (code de détection 3/11/0).
- Les contrôleurs RAID basés sur du matériel Dell offrent des fonctions telles que Patrol Read et la vérification de la cohérence pour corriger de nombreux scénarios d’erreurs de données.
L’exécution d’opérations régulières de vérification de la cohérence permet de corriger les pannes uniques, qu’il s’agisse d’un bloc défectueux physique ou d’une erreur logique des données.
La vérification de cohérence permet également de réduire les risques d’une double défaillance en cas d’erreurs supplémentaires.

Graphique 1 Plusieurs pannes uniques dans une matrice RAID 5 - Baie optimale

Graphique 2 Panne double avec un disque en échec (les données des bandes 1 et 2 sont perdues) : baie dégradée.

Graphique 3 Bandes perforées (les données des bandes 1 et 2 sont perdues en raison d’une double défaillance) : matrice optimale.
Retour au tableau des matières
Perforations : qu’est-ce que c’est et quelle en est l’origine ?
Une perforation est une fonction des contrôleurs Dell PERC, conçue pour permettre au contrôleur de restaurer la redondance de la matrice malgré la perte de données due à une double défaillance.
- Une crevaison est également connue sous le nom de « reconstruction avec erreurs ».
- Une crevaison peut se produire dans l’une des deux situations suivantes : une double panne existe déjà, ou une double panne n’existe pas.
- Une perforation peut se produire à trois emplacements : un espace vide, un espace de données non critique ou un espace de données accessible.
- Tout état entraînant l’inaccessibilité des données sur la même bande, sur plus d’un disque, constitue une double défaillance.
- Les doubles défaillances entraînent la perte de toutes les données sur la bande impactée.
- Toutes les perforations sont des doubles défaillances, mais toutes les doubles défaillances ne sont pas des perforations.
Retour au tableau des matières
Prévention des problèmes et résolution des perforations
La maintenance proactive permet de corriger les erreurs existantes et d’éviter que certaines erreurs ne se produisent.
- Mettre à jour les pilotes et le firmware sur les contrôleurs, disques durs, fonds de panier et autres périphériques.
- Effectuer des opérations de routine de vérification de la cohérence.
- Consultez les journaux pour trouver des indications sur les problèmes.
- Effectuer une opération de routine de vérification de la cohérence (la baie doit être optimale)
- Déterminez s’il y a des problèmes matériels
- Vérifiez le journal du contrôleur
- Exécutez un diagnostic du matériel
- Contactez le support technique Dell si besoin.
Retour au tableau des matières
Vidéos d’instructions sur la création/suppression d’une baie ou l’importation/exportation d’une configuration étrangère
Création ou suppression d’un disque virtuel dans iDRAC 9
Durée : 00:01:53
Le cas échéant, les paramètres de langue des sous-titres peuvent être choisis à l’aide de l’icône CC de ce lecteur vidéo.
Importation d’une configuration étrangère pour Dell PERC
Durée : 00:02:07
Lorsqu’ils sont disponibles, les paramètres de langue des sous-titres peuvent être choisis à l’aide de l’icône CC de ce lecteur vidéo.
Procédure d’effacement de la configuration étrangère pour Dell PERC
Durée : 00:02:02
Le cas échéant, les paramètres de langue des sous-titres peuvent être choisis à l’aide de l’icône CC sur ce lecteur vidéo.