Anleitung zum Handhaben von Löchern (fehlerhaften Blöcken) auf virtuellen Laufwerken für Power Edge-Server

Summary: Fehlerbehebungsschritte für Löcher durch fehlerhafte Blöcke auf HDDs in PowerEdge-Servern mit PERC-Controllern. Insbesondere wenn keine Sicherung möglich ist, können die folgenden Informationen dazu beitragen, ein betroffenes virtuelles Laufwerk wieder in einen optimalen Zustand zu versetzen. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Check out other resources

Symptoms

Cause

Resolution

Dieser Artikel enthält Fehlerbehebungsschritte für Löcher durch fehlerhafte Blöcke auf HDDs in PowerEdge Servern mit PERC-Controllern. Insbesondere wenn keine Sicherung möglich ist, können die folgenden Informationen dazu beitragen, ein betroffenes virtuelles Laufwerk wieder in einen optimalen Zustand zu versetzen.

1. Fehlerbeschreibungen

Fehler Nr. 1:

Der OpenManage Server Administrator (OMSA) zeigt ein rotes Kreuz vor einem virtuellen Laufwerk an (Abbildung 1).

SLN111146_en_US__11343098652871.1
Abbildung 1: Virtuelles Laufwerk mit rotem Kreuz im Status (Beispiel H800)

Hinweis: OpenManage Server Administrator (OMSA) enthält eine umfassende 1:1-Systemverwaltungslösung: OMSA kann in zwei Anwendungen kategorisiert werden:
– Integriert – Webbrowser-basierte grafische Benutzeroberfläche (GUI)
– Befehlszeilenschnittstelle (CLI) – Über das Betriebssystem

Fehler Nr. 2:

Das Windows-System Protokoll weist fehlerhafte Blöcke auf (Abbildung 2).

SLN111146_en_US__31343098674763.2
Abbildung 2: Fehlerhafte Blöcke werden im Windows-Systemprotokoll angezeigt

Fehler Nr. 3:

Das RAID-Controller-Protokoll (TTYLOG) zeigt Fehler wie:

02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f

Warnung: Das Controller-Protokoll (TTYLOG) zeigt möglicherweise keine Fehler an.

Weitere Informationen zum Erhalt dieser speziellen Protokolle finden Sie in unserem Artikel über das Erfassen von Protokollen.

2. Was ist die Ursache?

RAID-Arrays sind nicht immun gegenüber Datenfehlern. RAID-Controller- und Laufwerk-Firmware enthalten Funktionen zum Erkennen und Beheben vieler Arten von Datenfehlern, bevor sie in ein Array bzw. ein Laufwerk geschrieben werden. Die Verwendung veralteter Firmware kann dazu führen, dass falsche Daten auf ein Array/Laufwerk geschrieben werden, da die Fehlerbehandlungs-/Fehlerkorrekturfunktionen fehlen, die in den neuesten Firmwareversionen vorhanden sind.
Datenfehler können auch durch fehlerhafte physische Blöcke verursacht werden. Zum Beispiel kann dies auftreten, wenn der Schreib-/Lesekopf negative Auswirkung auf die rotierenden Platten hat (wird auch "Head Crash" genannt). Blöcke können auch im Laufe der Zeit fehlerhaft werden, da sich die Fähigkeit der Platten verschlechtert, Bits magnetisch an einem bestimmten Ort zu speichern. Fehlerhafte Blöcke, die durch Plattenverschlechterung entstehen, können oft erfolgreich gelesen werden. Diese fehlerhaften Blöcke können nur zeitweilig oder durch erweiterte Diagnosen auf den Laufwerken erkannt werden.

Ein fehlerhafter Block, auch bekannt als fehlerhafte logische Blockadresse (LBA), kann auch durch logische Datenfehler verursacht werden. Dies tritt auf, wenn Daten nicht richtig auf ein Laufwerk geschrieben werden, obwohl der Schreibvorgang als erfolgreich gemeldet wurde. Darüber hinaus können einwandfreie, auf einem Laufwerk gespeicherte Daten versehentlich verändert werden. Ein Beispiel ist ein "Bit-Flip", der auftreten kann, wenn der Lese-/Schreibkopf übertritt oder in einem nahe gelegenen Ort schreibt, was dazu führt, dass Daten in Form von Nullen und Einsen zu einem anderen Wert geändert werden. Ein solcher Zustand führt dazu, dass die "Konsistenz" der Daten beschädigt wird. Der Wert der Daten auf einem bestimmten Block unterscheidet sich von den ursprünglichen Daten und stimmt möglicherweise nicht mehr mit der Prüfsumme der Daten überein. Die physische LBA funktioniert gut und kann erfolgreich beschrieben werden, enthält jedoch derzeit falsche Daten und kann als fehlerhafter Block interpretiert werden.

Weitere Informationen finden Sie im Artikel über doppelte Fehler und Löcher in RAID-Arrays.

3. Schritte zur Lösung des Problems:

Hinweis: Die aktuellen Daten auf dem virtuellen Laufwerk sind beschädigt und müssen gelöscht werden.

Erstellen Sie eine validierte Datensicherung auf Dateiebene.
- Eine blockbasierte Sicherung würde das Problem übertragen.
- Eine Sicherung auf Dateiebene zeigt beschädigte Dateien an (diese Dateien sollten nicht gesichert werden).
- Es gibt nie eine hundertprozentige Garantie für die Beibehaltung aller Daten, wenn bereits ein Loch im Stripeset vorhanden ist.
Stellen Sie sicher, dass alle ausgefallenen Laufwerke mit vorhersagbaren Ausfällen ersetzt werden.
Löschen Sie den virtuellen Datenträger und erstellen Sie ihn neu.
- Durch diesen Schritt werden alle Daten aus dem VD gelöscht.
- Löschen Sie das Array
- Erstellen Sie das Array wie gewünscht
Führen Sie eine vollständige Initialisierung des VD durch.
- Stellen Sie sicher, dass nicht die schnelle Initialisierung gewählt wurde.
- Nur eine vollständige (= langsamere) Initialisierung behebt das Problem.
Führen Sie eine Konsistenzprüfung für das neu erstellte VD durch.
- Wenn die Konsistenzprüfung ohne Fehler abgeschlossen wird, ist das Array nun funktionsfähig und das Loch wurde entfernt.
Die Daten können jetzt auf das funktionsfähige VD wiederhergestellt werden.
Empfehlung: Aktualisieren Sie die gesamte Festplattenfirmware auf die neueste Version.

4. Zusätzliche Informationen

OMSA bietet die Möglichkeit, Warnungen zu fehlerhaften Blöcken zu löschen. Um fehlerhafte Blöcke zu löschen, wird das folgende Verfahren empfohlen:

Wenn Sie eine Sicherung des virtuellen Laufwerks durchführen, wobei die Option Verify (verifizieren) ausgewählt ist, können zwei Szenarios auftreten:
- Der Sicherungsvorgang schlägt bei einer oder mehreren Dateien fehl. Stellen Sie in diesem Fall die Datei aus einer vorherigen Sicherung wieder her. Nachdem Sie die Datei wiederhergestellt haben, fahren Sie mit dem nächsten Schritt fort.
- Der Sicherungsvorgang wird ohne Fehler abgeschlossen. Dies deutet darauf hin, dass der beschriebene Teil des virtuellen Datenträgers keine fehlerhaften Blöcke enthält.
Hinweis: Wenn weiterhin Warnungen zu fehlerhaften Blöcken angezeigt werden, befinden sich die fehlerhaften Blöcke in einem Bereich ohne Daten.
Führen Sie Patrol Read unter "Virtual Disk Tasks" in OMSA aus und überprüfen Sie das Systemereignisprotokoll, um sicherzustellen, dass keine neuen fehlerhaften Blöcke gefunden werden. Wenn fehlerhafte Blöcke weiterhin vorhanden sind, fahren Sie mit dem nächsten Schritt fort. Ist dies nicht der Fall, ist der Zustand behoben.

Hinweis: Der automatisierte Patrol Read muss deaktiviert werden, damit die Option zur manuellen Ausführung dieser Funktion in OMSA angezeigt wird.
Um diese fehlerhaften Blöcke zu löschen, führen Sie die Aufgabe Clear Virtual Disk Bad Blocks aus. Dies kann in der grafischen Benutzeroberfläche von OMSA oder über folgenden CLI-Befehl erfolgen:
omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id

Hinweis: Um die Werte für die Controller-ID und die ID des virtuellen Laufwerks abzurufen, geben Sie omreport storage controller ein, um die Controller-IDs anzuzeigen, und geben Sie dann omreport storage vdisk controller=ID ein, um die IDs für die virtuellen Laufwerke anzuzeigen.

Affected Products

Servers

Article Number: 000139277

Article Type: Solution

Last Modified: 01 Oct 2021

Version: 3

Check if your device is covered by Support Services.

Anleitung zum Handhaben von Löchern (fehlerhaften Blöcken) auf virtuellen Laufwerken für Power Edge-Server

Symptoms

Cause

Resolution

Inhaltsverzeichnis:

1. Fehlerbeschreibungen

Fehler Nr. 1:

Fehler Nr. 2:

Fehler Nr. 3:

2. Was ist die Ursache?

3. Schritte zur Lösung des Problems:

4. Zusätzliche Informationen

Affected Products

Article Properties

Find answers to your questions from other Dell users

Support Services

Article Properties

Find answers to your questions from other Dell users

Support Services

Welcome

Welcome to Dell

Anleitung zum Handhaben von Löchern (fehlerhaften Blöcken) auf virtuellen Laufwerken für Power Edge-Server

Detailed Article

Symptoms

Cause

Resolution

Affected Products

Symptoms

Cause

Resolution

Inhaltsverzeichnis:

1. Fehlerbeschreibungen

Fehler Nr. 1:

Fehler Nr. 2:

Fehler Nr. 3:

2. Was ist die Ursache?

3. Schritte zur Lösung des Problems:

4. Zusätzliche Informationen

Affected Products

Article Properties

Find answers to your questions from other Dell users

Support Services

Article Properties

Find answers to your questions from other Dell users

Support Services