Dieser Artikel enthält Fehlerbehebungsschritte für Löcher durch fehlerhafte Blöcke auf HDDs in PowerEdge Servern mit PERC-Controllern. Insbesondere wenn keine Sicherung möglich ist, können die folgenden Informationen dazu beitragen, ein betroffenes virtuelles Laufwerk wieder in einen optimalen Zustand zu versetzen.
Der OpenManage Server Administrator (OMSA) zeigt ein rotes Kreuz vor einem virtuellen Laufwerk an (Abbildung 1).
Abbildung 1: Virtuelles Laufwerk mit rotem Kreuz im Status (Beispiel H800)
Das Windows-System Protokoll weist fehlerhafte Blöcke auf (Abbildung 2).
Abbildung 2: Fehlerhafte Blöcke werden im Windows-Systemprotokoll angezeigt
Das RAID-Controller-Protokoll (TTYLOG) zeigt Fehler wie:
02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f
Weitere Informationen zum Erhalt dieser speziellen Protokolle finden Sie in unserem Artikel über das Erfassen von Protokollen.
RAID-Arrays sind nicht immun gegenüber Datenfehlern. RAID-Controller- und Laufwerk-Firmware enthalten Funktionen zum Erkennen und Beheben vieler Arten von Datenfehlern, bevor sie in ein Array bzw. ein Laufwerk geschrieben werden. Die Verwendung veralteter Firmware kann dazu führen, dass falsche Daten auf ein Array/Laufwerk geschrieben werden, da die Fehlerbehandlungs-/Fehlerkorrekturfunktionen fehlen, die in den neuesten Firmwareversionen vorhanden sind.
Datenfehler können auch durch fehlerhafte physische Blöcke verursacht werden. Zum Beispiel kann dies auftreten, wenn der Schreib-/Lesekopf negative Auswirkung auf die rotierenden Platten hat (wird auch "Head Crash" genannt). Blöcke können auch im Laufe der Zeit fehlerhaft werden, da sich die Fähigkeit der Platten verschlechtert, Bits magnetisch an einem bestimmten Ort zu speichern. Fehlerhafte Blöcke, die durch Plattenverschlechterung entstehen, können oft erfolgreich gelesen werden. Diese fehlerhaften Blöcke können nur zeitweilig oder durch erweiterte Diagnosen auf den Laufwerken erkannt werden.
Ein fehlerhafter Block, auch bekannt als fehlerhafte logische Blockadresse (LBA), kann auch durch logische Datenfehler verursacht werden. Dies tritt auf, wenn Daten nicht richtig auf ein Laufwerk geschrieben werden, obwohl der Schreibvorgang als erfolgreich gemeldet wurde. Darüber hinaus können einwandfreie, auf einem Laufwerk gespeicherte Daten versehentlich verändert werden. Ein Beispiel ist ein "Bit-Flip", der auftreten kann, wenn der Lese-/Schreibkopf übertritt oder in einem nahe gelegenen Ort schreibt, was dazu führt, dass Daten in Form von Nullen und Einsen zu einem anderen Wert geändert werden. Ein solcher Zustand führt dazu, dass die "Konsistenz" der Daten beschädigt wird. Der Wert der Daten auf einem bestimmten Block unterscheidet sich von den ursprünglichen Daten und stimmt möglicherweise nicht mehr mit der Prüfsumme der Daten überein. Die physische LBA funktioniert gut und kann erfolgreich beschrieben werden, enthält jedoch derzeit falsche Daten und kann als fehlerhafter Block interpretiert werden.
Weitere Informationen finden Sie im Artikel über doppelte Fehler und Löcher in RAID-Arrays.
Erstellen Sie eine validierte Datensicherung auf Dateiebene.
Stellen Sie sicher, dass alle ausgefallenen Laufwerke mit vorhersagbaren Ausfällen ersetzt werden.
Löschen Sie den virtuellen Datenträger und erstellen Sie ihn neu.
Führen Sie eine vollständige Initialisierung des VD durch.
Führen Sie eine Konsistenzprüfung für das neu erstellte VD durch.
Die Daten können jetzt auf das funktionsfähige VD wiederhergestellt werden.
Empfehlung: Aktualisieren Sie die gesamte Festplattenfirmware auf die neueste Version.
OMSA bietet die Möglichkeit, Warnungen zu fehlerhaften Blöcken zu löschen. Um fehlerhafte Blöcke zu löschen, wird das folgende Verfahren empfohlen:
Wenn Sie eine Sicherung des virtuellen Laufwerks durchführen, wobei die Option Verify (verifizieren) ausgewählt ist, können zwei Szenarios auftreten:
Führen Sie Patrol Read unter "Virtual Disk Tasks" in OMSA aus und überprüfen Sie das Systemereignisprotokoll, um sicherzustellen, dass keine neuen fehlerhaften Blöcke gefunden werden. Wenn fehlerhafte Blöcke weiterhin vorhanden sind, fahren Sie mit dem nächsten Schritt fort. Ist dies nicht der Fall, ist der Zustand behoben.
Um diese fehlerhaften Blöcke zu löschen, führen Sie die Aufgabe Clear Virtual Disk Bad Blocks aus. Dies kann in der grafischen Benutzeroberfläche von OMSA oder über folgenden CLI-Befehl erfolgen:
omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id
omreport storage controller
ein, um die Controller-IDs anzuzeigen, und geben Sie dann omreport storage vdisk controller=ID
ein, um die IDs für die virtuellen Laufwerke anzuzeigen.