PowerEdge: Anleitung zum Beheben von doppelten Fehlern und Löchern in RAID-Arrays

Summary: Dieser Artikel enthält Informationen zu doppelten Fehlern und Löchern in einem RAID-Array und gibt Ratschläge, wie das Problem behoben werden kann.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Inhaltsverzeichnis

  1. Beheben von Doppelfehlern und RAID-Löchern
  2. Datenfehler und doppelte Fehler
  3. Löcher: Was sind Löcher und wie werden sie verursacht?
  4. Vermeidung von Problemen, bevor sie auftreten, und Beheben von Löchern, nachdem sie auftreten
  5. Anleitungsvideos zum Erstellen/Löschen eines Arrays oder Importieren/Exportieren einer Fremdkonfiguration
Warnung: Wenn Sie diese Schritte befolgen, gehen alle Daten auf dem Array verloren. Bevor Sie die Schritte ausführen, stellen Sie sicher, dass ein Backup der Arraydaten auf Dateiebene abgeschlossen wurde und dass das Ausführen dieser Schritte keine Auswirkungen auf andere Arrays hat.  
 

Beheben von Doppelfehlern und RAID-Löchern

  1. Verwerfen des beibehaltenen Cache (falls vorhanden)
  2. Löschen Sie Fremdkonfigurationen (falls vorhanden)
  3. Löschen Sie das Array
  4. Prüfen auf ausgefallene Laufwerke
  5. Setzen Sie alle ausgefallenen Laufwerke wieder ein.
  6. Löschen Sie alle Fremdkonfigurationen erneut.
  7. Ersetzen aller ausgefallenen Laufwerke, einschließlich vorausschauend ausgefallener Laufwerke
  8. Aktualisieren der Firmware (Controller, Rückwandplatine (BP), Laufwerke), falls erforderlich
  9. Erstellen des Arrays
  10. Durchführen einer Vollinitialisierung (keine Schnellinitialisierung)
  11. Zu diesem Zeitpunkt sollte das Array einsatzbereit sein

 

Datenfehler und doppelte Fehler

RAID-Arrays sind nicht immun gegenüber Datenfehlern. RAID-Controller- und Laufwerk-Firmware enthalten Funktionen zum Erkennen und Beheben vieler Arten von Datenfehlern, bevor sie in ein Array bzw. ein Laufwerk geschrieben werden.

  • Datenfehler können durch physische ungültige Blöcke verursacht werden, z. B. durch einen "Head Crash" oder eine Verschlechterung der Fähigkeit der Platte, Bits magnetisch an einem bestimmten Ort zu speichern.
  • Ein fehlerhafter Block, auch bekannt als fehlerhafte logische Blockadresse (LBA), kann auch durch logische Datenfehler verursacht werden, z. B. durch einen "Bit-Flip" oder durch das Schreiben falscher Daten auf ein Laufwerk.
  • Fehlerhafte LBAs werden üblicherweise als Sensorcode 3/11/0 gemeldet.
  • Hardware-basierte RAID-Controller von Dell bieten Funktionen wie Patrol Read und "Konsistenz prüfen" zur Korrektur vieler Datenfehlerszenarien an.

Regelmäßige Vorgänge zur Konsistenzüberprüfung korrigieren einzelne Fehler, unabhängig davon, ob es sich um einen physischen ungültigen Block oder einen logischen Fehler der Daten handelt.

Mit "Konsistenz prüfen" wird auch die Gefahr eines doppelten Fehlers im Falle von zusätzlichen Fehlern gemindert.

 

Mehrere Einzelfehler in einem RAID-5-Array – optimales Array

Abbildung 1 Mehrere Einzelfehler in einem RAID-5-Array – optimales Array

 

Doppelter Fehler mit einem ausgefallenen Laufwerk (Daten in Stripes 1 und 2 gehen verloren) – heruntergestuftes Array.

Abbildung 2 Doppelter Fehler mit einem ausgefallenen Laufwerk (Daten in Stripes 1 und 2 gehen verloren) – heruntergestuftes Array.

 

Lochierte Stripes (Daten in Stripes 1 und 2 gehen aufgrund eines doppelten Fehlers verloren) – Optimales Array.

Abbildung 3 Lochierte Stripes (Daten in Stripes 1 und 2 gehen aufgrund eines doppelten Fehlers verloren) – Optimales Array.

Zurück zur Tabelle zum Inhalt

Löcher: Was sind Löcher und wie werden sie verursacht?

Ein Loch ist eine Funktion der Dell PERC-Controller, wodurch der Controller die Redundanz des Arrays trotz des Verlustes von Daten durch einen doppelten Fehler wiederherstellen kann.

  • Ein Loch wird auch als "fehlerhafter Neuaufbau" bezeichnet.
  • Ein Loch kann in einer von zwei Situationen auftreten: ein Doppelfehler ist bereits vorhanden oder ein Doppelfehler existiert nicht.
  • Ein Loch kann an drei Orten auftreten: in einem leeren Bereich, einem nicht kritischen Datenbereich oder einem Datenbereich, auf den zugegriffen wird.
  • Jeder Zustand, der dafür sorgt, dass die Daten in demselben Stripe auf mehr als einem Laufwerk nicht zugänglich sind, ist ein doppelter Fehler
  • Doppelte Fehler führen zum Verlust aller Daten innerhalb des betroffenen Stripe
  • Alle Löcher sind doppelte Fehler, aber NICHT alle doppelten Fehlern sind Löcher

 

Zurück zur Tabelle zum Inhalt

Vermeidung von Problemen, bevor sie auftreten, und Beheben von Löchern, nachdem sie auftreten

Durch die proaktive Wartung können vorhandene Fehler behoben und das Auftreten einiger Fehler verhindert werden.

  • Aktualisieren Sie Treiber und Firmware auf Controllern, Festplatten, Rückwandplatinen und anderen Geräten.
  • Führen Sie routinemäßige Vorgänge des Typs "Konsistenz prüfen" durch.
  • Überprüfen Sie die Protokolle auf Hinweise auf Probleme.
Hinweis: Wenn die Konsistenzprüfung ohne Fehler abgeschlossen wird, können Sie davon ausgehen, dass das Array nun funktionsfähig ist und das Loch entfernt wurde. Die Daten können jetzt auf das funktionsfähige Array wiederhergestellt werden.
 
Achtung: Wenn ein bekannter oder vermuteter Doppelfehler oder eine Reifenpanne vorliegt, führen Sie die folgenden Schritte aus, um das Risiko schwerwiegenderer Probleme zu minimieren:
  • Führen Sie eine Routine der Konsistenzüberprüfung durch (das Array muss optimal sein)
  • Stellen Sie fest, ob Hardwareprobleme vorliegen
  • Überprüfen Sie die Controller-Protokolldatei
  • Führen Sie eine Hardwarediagnose durch
  • Nehmen Sie ggf. Kontakt zum technischen Support von Dell auf
Hinweis: Wenn diese Schritte durchgeführt wurden, gibt es weitere Aspekte, die es zu berücksichtigen gilt. Löcher können dazu führen, dass Laufwerke im Laufe der Zeit in den Status "Fehlerankündigung" wechseln. Datenfehler, die auf ein Laufwerk übertragen werden, werden als Medienfehler auf dem Laufwerk gemeldet, auch wenn keine Hardwareprobleme vorliegen.
 
Hinweis: Durch die Überwachung des Systems können Probleme rechtzeitig erkannt und behoben werden, wodurch auch das Risiko schwerwiegenderer Probleme verringert wird.

Zurück zur Tabelle zum Inhalt

 

Anleitungsvideos zum Erstellen/Löschen eines Arrays oder Importieren/Exportieren einer Fremdkonfiguration

 

Anleitung zum Erstellen oder Löschen eines virtuellen Laufwerks in iDRAC 9

Dauer: 00:01:53
Wenn verfügbar, können Spracheinstellungen für Untertitel über das CC-Symbol in diesem Videoplayer ausgewählt werden.

 

Importieren einer Fremdkonfiguration für Dell PERC

Dauer: 00:02:07
Wenn verfügbar, können Spracheinstellungen für Untertitel über das CC-Symbol in diesem Videoplayer ausgewählt werden.

Anleitung zum Löschen von Fremdkonfigurationen für Dell PERC

Dauer: 00:02:02
Wenn verfügbar, können Spracheinstellungen für Untertitel über das CC-Symbol auf diesem Videoplayer ausgewählt werden.

Zurück zur Tabelle zum Inhalt

Affected Products

OEMR R240, OEMR R250, OEMR R260, OEMR R340, OEMR R350, OEMR XE R350, OEMR R360, OEMR XE R360, OEMR R440, OEMR R450, OEMR R540, OEMR R550, OEMR R640, OEMR XL R640, OEMR R6415, OEMR R650, OEMR R650xs, OEMR R6515, OEMR R6525, OEMR R660, OEMR XL R660 , OEMR R660xs, OEMR R6615, OEMR R6625, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R7415, OEMR R7425, OEMR R750, OEMR R750xa, OEMR R750xs, OEMR R7515, OEMR R7525, OEMR R760, OEMR R760xa, OEMR R760XD2, OEMR XL R760, OEMR R760xs, OEMR R7615, OEMR R7625, OEMR R840, OEMR R860, OEMR R940, OEMR R940xa, OEMR R960, OEMR T340, OEMR T350, OEMR T360, OEMR T440, OEMR T550, OEMR T560, OEMR T640, OEMR XL T640, OEMR XL R240, OEMR XL R340, OEMR XL R660xs, OEMR XL R6615, OEMR XL R6625, OEMR XL R760xs, OEMR XL R7615, OEMR XL R7625, PowerEdge RAID Controller H345, PowerEdge RAID Controller H355 Front SAS, PowerEdge RAID Controller H355 Adapter SAS, PowerEdge RAID Controller H750 Adapter SAS, PowerEdge RAID Controller H755 Adapter, PowerEdge RAID Controller H755 Front SAS, PowerEdge RAID Controller H965i Adapter, Poweredge C4140, PowerEdge C6400, PowerEdge C6420, PowerEdge C6520, PowerEdge C6525, PowerEdge C6600, PowerEdge C6615, PowerEdge C6620, PowerEdge FC640, PowerEdge HS5610, PowerEdge HS5620, PowerEdge M640, PowerEdge M640 (for PE VRTX), PowerEdge MX5016s, PowerEdge MX7000, PowerEdge MX740C, PowerEdge MX750c, PowerEdge MX760c, PowerEdge MX840C, PowerEdge R240, PowerEdge R250, PowerEdge R260, PowerEdge R340, PowerEdge R350, PowerEdge R360, PowerEdge R440, PowerEdge R450, PowerEdge R540, PowerEdge R550, PowerEdge R640, PowerEdge R6415, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R660, PowerEdge R660xs, PowerEdge R6615, PowerEdge R6625, PowerEdge R670, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R7415, PowerEdge R7425, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R760, PowerEdge R760XA, PowerEdge R760xd2, PowerEdge R760xs, PowerEdge R7615, PowerEdge R7625, PowerEdge R770, PowerEdge R840, PowerEdge R860, PowerEdge R940, PowerEdge R940xa, PowerEdge R960, PowerEdge RAID Controller H330, PowerEdge RAID Controller H730P, PowerEdge RAID Controller H740P, PowerEdge RAID Controller H965e Adapter, PowerEdge T340, PowerEdge T350, PowerEdge T360, PowerEdge T440, PowerEdge T550, PowerEdge T560, PowerEdge T640 ...
Article Properties
Article Number: 000139251
Article Type: How To
Last Modified: 02 Sept 2025
Version:  11
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.