MD-Serie: Md3xxx Anleitung zum Ersetzen einer Festplatte bei vorhergesagtem oder bevorstehendem Fehler
Summary: In diesem Artikel wird beschrieben, wie Sie ein Laufwerk mit vorhergesagtem Ausfall in einem MD3xxx-Speicher mithilfe von Modular Disk Storage Management (MDSM) sicher ersetzen können.
Instructions
Einführung
In diesem Tutorial wird erläutert, wie ein Laufwerk bei einer Fehlerankündigung oder einem bevorstehenden Ausfall zu ersetzen ist. Eine Fehlerankündigung ist eine Funktion von modernen Festplattenlaufwerken (Festplatten), die zur Verbesserung der RAID-Zuverlässigkeit entwickelt wurden. Eine Fehlerankündigung weist darauf hin, dass eine Festplatte ausgetauscht werden muss, bevor es zu einem Ausfall kommt.
Ursache
Während normaler Lese-/Schreibvorgänge kann gelegentlich ein Fehler auf einer Festplatte auftreten. Der Controller erkennt diesen Fehler und repariert ihn. Diese Fehler werden auch als fehlerhafte Blöcke bezeichnet. Aus diesem Grund ist der Speicherplatz auf einer Festplatte in der Regel etwas größer als angegeben. Dieser Bereich wird verwendet, um fehlerhafte Blöcke zu verschieben oder zu reparieren, die während des normalen Betriebs auftreten. Ein vorgegebener Schwellenwert für fehlerhafte Blöcke wird einer einzelnen Festplatte zugewiesen. Wenn dieser Schwellenwert erreicht ist, ändert der Controller den Status des Festplattenlaufwerks in Fehlerankündigung. Die Festplatte bleibt funktionsfähig, aber die Wahrscheinlichkeit, dass die Festplatte bald ausfallen wird, ist groß.
Es wird empfohlen, eine Festplatte mit dem Status "Predictive Fail" umgehend auszutauschen, um die Integrität des RAID-Volumes zu erhalten. Um die Festplatte auszutauschen, kann sie vor dem physischen Austausch sicher aus dem RAID-Volume entfernt werden. Befolgen Sie die unten aufgeführten Schritte, um den Festplattenstatus auf „Offline“ zu setzen und sie sicher aus dem RAID-Volume zu entfernen.
Lösung
Hinweis: Bevor Sie fortfahren, muss Modular Disk Storage Manager(MDSM) installiert werden. MDSM kann von der Support-Website heruntergeladen werden. Das System muss Zugriff auf das Storage-Array haben.
Befolgen Sie den folgenden Prozess, um die Festplatte offline zu setzen und sicher aus dem RAID-Volume zu entfernen.
- Starten Sie MDSM und wählen Sie das entsprechende PowerVault-Array aus.
- Überprüfen des richtigen Arrays anhand des Gehäusestatus
- Wenn es keine Probleme mit einem Array gibt, wird es als "optimal" angezeigt, wie in Abbildung 1 unten dargestellt

- Abbildung 1: MDSM-Geräteansicht mit dem Status „Optimal“
- Wenn das Array eine Festplatte mit vorhergesagtem Fehler aufweist, ändert sich der Status zu "Need attention"
- Doppelklicken Sie auf das Array, um auf den Array-Manager zuzugreifen
- Stellen Sie sicher, dass keine anderen fehlenden oder ausgefallenen Laufwerke im selben RAID-Satz vorhanden sind
- Klicken Sie auf Hardware und wählen Sie dann das Festplattenlaufwerk mit der Fehlerankündigung aus. Der Status wird als Need Attention angezeigt.

- Abbildung 2: Hardwarebereich von MDSM
- Klicken Sie mit der rechten Maustaste auf die Festplatte und wählen Sie Advanced und dann Fail aus.

- Abbildung 3: Rechtsklick-Menü mit der Option „Fail“
- Quittieren Sie den Laufwerksausfall durch Eingabe von "yes".
- Wenn sich im Array eine Ersatzfestplatte befindet, die auch als "Hot Spare" bezeichnet wird, lassen Sie das Kontrollkästchen "Inhalt der Festplatte kopieren, bevor sie fehlschlägt" aktiviert
- Die Daten des Laufwerks mit Fehlerankündigung werden in den Hot Spare kopiert, um eine Verschlechterung des RAID zu vermeiden
- Dies ist unten in Abbildung 4 dargestellt
- Wenn kein Hot Spare vorhanden ist, deaktivieren Sie das Kontrollkästchen "Inhalt des physischen Laufwerks kopieren, bevor es fehlschlägt"
- Versuchen Sie nicht, Inhalte zu kopieren, es sei denn, im Array ist ein Hot Spare verfügbar
- Der Versuch kann zu Datenverlust oder -beschädigung führen

- Abbildung 4: Dialogfeld „Confirm Fail Physical Disk“
- Wenn die Option zum Kopieren des Inhalts verwendet wird,
- Es kann einige Zeit dauern, bis das Laufwerk ausfällt und sich der Status in "Ausgefallen" ändert
- Der Status der Festplatte ändert sich in "Failed" und ist mit einem roten "X" gekennzeichnet
- Es ist jetzt sicher, die Festplatte physisch auszutauschen