PowerEdge: Anleitung zum Beheben von doppelten Fehlern und Löchern in RAID-Arrays
Summary: Dieser Artikel enthält Informationen zu doppelten Fehlern und Löchern in einem RAID-Array und gibt Ratschläge, wie das Problem behoben werden kann.
Instructions
Inhaltsverzeichnis
- Beheben von Doppelfehlern und RAID-Löchern
- Datenfehler und doppelte Fehler
- Löcher: Was sind Löcher und wie werden sie verursacht?
- Vermeidung von Problemen, bevor sie auftreten, und Beheben von Löchern, nachdem sie auftreten
- Anleitungsvideos zum Erstellen/Löschen eines Arrays oder Importieren/Exportieren einer Fremdkonfiguration
Beheben von Doppelfehlern und RAID-Löchern
- Verwerfen des beibehaltenen Cache (falls vorhanden)
- Löschen Sie Fremdkonfigurationen (falls vorhanden)
- Löschen Sie das Array
- Prüfen auf ausgefallene Laufwerke
- Setzen Sie alle ausgefallenen Laufwerke wieder ein.
- Löschen Sie alle Fremdkonfigurationen erneut.
- Ersetzen aller ausgefallenen Laufwerke, einschließlich vorausschauend ausgefallener Laufwerke
- Aktualisieren der Firmware (Controller, Rückwandplatine (BP), Laufwerke), falls erforderlich
- Erstellen des Arrays
- Durchführen einer Vollinitialisierung (keine Schnellinitialisierung)
- Zu diesem Zeitpunkt sollte das Array einsatzbereit sein
Datenfehler und doppelte Fehler
RAID-Arrays sind nicht immun gegenüber Datenfehlern. RAID-Controller- und Laufwerk-Firmware enthalten Funktionen zum Erkennen und Beheben vieler Arten von Datenfehlern, bevor sie in ein Array bzw. ein Laufwerk geschrieben werden.
- Datenfehler können durch physische ungültige Blöcke verursacht werden, z. B. durch einen "Head Crash" oder eine Verschlechterung der Fähigkeit der Platte, Bits magnetisch an einem bestimmten Ort zu speichern.
- Ein fehlerhafter Block, auch bekannt als fehlerhafte logische Blockadresse (LBA), kann auch durch logische Datenfehler verursacht werden, z. B. durch einen "Bit-Flip" oder durch das Schreiben falscher Daten auf ein Laufwerk.
- Fehlerhafte LBAs werden üblicherweise als Sensorcode 3/11/0 gemeldet.
- Hardware-basierte RAID-Controller von Dell bieten Funktionen wie Patrol Read und "Konsistenz prüfen" zur Korrektur vieler Datenfehlerszenarien an.
Regelmäßige Vorgänge zur Konsistenzüberprüfung korrigieren einzelne Fehler, unabhängig davon, ob es sich um einen physischen ungültigen Block oder einen logischen Fehler der Daten handelt.
Mit "Konsistenz prüfen" wird auch die Gefahr eines doppelten Fehlers im Falle von zusätzlichen Fehlern gemindert.

Abbildung 1 Mehrere Einzelfehler in einem RAID-5-Array – optimales Array

Abbildung 2 Doppelter Fehler mit einem ausgefallenen Laufwerk (Daten in Stripes 1 und 2 gehen verloren) – heruntergestuftes Array.

Abbildung 3 Lochierte Stripes (Daten in Stripes 1 und 2 gehen aufgrund eines doppelten Fehlers verloren) – Optimales Array.
Löcher: Was sind Löcher und wie werden sie verursacht?
Ein Loch ist eine Funktion der Dell PERC-Controller, wodurch der Controller die Redundanz des Arrays trotz des Verlustes von Daten durch einen doppelten Fehler wiederherstellen kann.
- Ein Loch wird auch als "fehlerhafter Neuaufbau" bezeichnet.
- Ein Loch kann in einer von zwei Situationen auftreten: ein Doppelfehler ist bereits vorhanden oder ein Doppelfehler existiert nicht.
- Ein Loch kann an drei Orten auftreten: in einem leeren Bereich, einem nicht kritischen Datenbereich oder einem Datenbereich, auf den zugegriffen wird.
- Jeder Zustand, der dafür sorgt, dass die Daten in demselben Stripe auf mehr als einem Laufwerk nicht zugänglich sind, ist ein doppelter Fehler
- Doppelte Fehler führen zum Verlust aller Daten innerhalb des betroffenen Stripe
- Alle Löcher sind doppelte Fehler, aber NICHT alle doppelten Fehlern sind Löcher
Vermeidung von Problemen, bevor sie auftreten, und Beheben von Löchern, nachdem sie auftreten
Durch die proaktive Wartung können vorhandene Fehler behoben und das Auftreten einiger Fehler verhindert werden.
- Aktualisieren Sie Treiber und Firmware auf Controllern, Festplatten, Rückwandplatinen und anderen Geräten.
- Führen Sie routinemäßige Vorgänge des Typs "Konsistenz prüfen" durch.
- Überprüfen Sie die Protokolle auf Hinweise auf Probleme.
- Führen Sie eine Routine der Konsistenzüberprüfung durch (das Array muss optimal sein)
- Stellen Sie fest, ob Hardwareprobleme vorliegen
- Überprüfen Sie die Controller-Protokolldatei
- Führen Sie eine Hardwarediagnose durch
- Nehmen Sie ggf. Kontakt zum technischen Support von Dell auf
Anleitungsvideos zum Erstellen/Löschen eines Arrays oder Importieren/Exportieren einer Fremdkonfiguration
Anleitung zum Erstellen oder Löschen eines virtuellen Laufwerks in iDRAC 9
Dauer: 00:01:53
Wenn verfügbar, können Spracheinstellungen für Untertitel über das CC-Symbol in diesem Videoplayer ausgewählt werden.
Importieren einer Fremdkonfiguration für Dell PERC
Dauer: 00:02:07
Wenn verfügbar, können Spracheinstellungen für Untertitel über das CC-Symbol in diesem Videoplayer ausgewählt werden.
Anleitung zum Löschen von Fremdkonfigurationen für Dell PERC
Dauer: 00:02:02
Wenn verfügbar, können Spracheinstellungen für Untertitel über das CC-Symbol auf diesem Videoplayer ausgewählt werden.