Ein neues Gespräch starten

Ungelöst

K

2 Nachrichten

890

October 31st, 2020 01:00

Raid degraded - jetzt nächster Fehler/Warnung

Hallo Zusammen,

Ich glaube es hat mich sehr schwer getroffen.

Wir haben einen R520 Server laufen mit 6 Festplatten im Raid 5. Controller ist ein PERC H710 mini..

Letzten Sonntag am 27.10. sendete das Idrac mir die Warnung dass eine Festplatte (Disk 2) ausgefallen ist. (ohne Vorwarnung sofort komplett ausgefallen).

Ich habe diese dann aus dem Server entfernt und sofort eine neue bei Dell bestellt - diese sollte eigentlich gestern eintreffen - lässt aber noch weiter auf sich warten.

Ich habe also ein Raid5 mit 6 Festplatten - welches seit einer Woche nur auf 5 Platten läuft.

Heute morgen hatte ich jetzt die besorgniserregende Nachricht im Postfach:

A block on Disk 4 in Backplane 1 of Integrated RAID Controller 1 was punctured by the controller.

In der gleichen Minute traf auch diese Nachricht ein:

An unrecoverable disk media error occurred on Disk 1 in Backplane 1 of Integrated RAID Controller 1.

Ich habe jetzt Panik..

Heißt es, Disk 1 und Disk 4 sind jetzt auch über den Jordan gegangen? Was mich wundert ist, dass im Idrac weiterhin nur Disk 2 mit einem roten Kreuz gezeigt wird. Disk 1 und 4 haben einen grünen Haken.

Absolut erschwerend kommt hinzu, ich sitze seit gestern In Quarantäne da Klassenkameraden meiner Tochter positiv auf Covid 19 getestet wurden.

Ich habe einem meiner Kollegen schon gesagt sobald die Festplatte eintrifft muss diese eingesetzt werden.

Kann jemand etwas zu der Situation sagen? Ist es eventuell alles halb so wild? Wie gesagt, im Idrac ist alles grün, ausser die eine Festplatte die entfernt wurde.

Wie soll ich weiter vorgehen?

Neue Festplatte einsetzen sobald diese eintrifft und den rebuild erst Mal laufen lassen?

 

Vielen Dank und viele Grüße

Klara

Moderator

 • 

790 Nachrichten

November 2nd, 2020 00:00

Hallo Klara,

 

als erstes: Ruhig bleiben.

 

Dass eine Festplatte von jetzt auf gleich vollständig ausfällt ist schon selten, kann aber tatsächlich passieren. Eventuell gab es im Vorfeld Medienfehler, die korrigierbar waren und nun war aber der Reservespeicher erschöpft und sie ist von uns gegangen. Oder es ist einfach ein elektonisches Problem, und der Controlelr der Platte ist von jetzt auf  gleich ausgestiegen.

Es kann sehr viele Gründe geben, wieso eine Platte direkt offline geht.

 

Der Austausch ist ja bereits auf dem Weg.

 

Weiter schreibst du, dass ein puncture aufgetreten ist. Das ist ein Bad Block auf der logischen Ebene des Laufwerks, also in der Virtuellen DIsk, nicht auf dem physischen Laufwerk. Das bringt ein Problem mit sich, bei jedem Rebuild der VD wird der puncture auch auf die neue Platte geschrieben.

 

Die beste Lösung bei einem puncture ist Backup -> RAID auflösen -> RAID neu erstellen -> Backup wieder einspielen. "Ja, ich weiß, das ist ein haufen Arbeit :(" Aber notwendig, um Folgefehler auszuschließen.

 

Hier noch ein Artikel, in dem wir eine 100% Lösung aufzeigen:
https://www.dell.com/support/article/en-us/sln156726/perc-how-to-fix-a-raid-puncture?lang=en

 

Der puncture wird dadurch entfernt, der unbehebbare Medienfehler bei Laufwerk 1 kann ein erstes Anzeichen sein, dass auch dieses in der nächsten Zeit, das zeitliche segnet. Am besten legt ihr euch dafür schon eine Ersatzplatte bereit.

 

Ich hoffe ich konnte dir etwas helfen und die große Sorge etwas mildern

 

Bleib gesund!

LG
Stefan

 

2 Nachrichten

November 17th, 2020 03:00

Hallo Stefan,

vielen Dank für deine Antwort.

Die neue Festplatte wurde vorletzte Woche eingesetzt und der Rebuild verlief ohne Probleme oder Fehler.

Alle Festplatten stehen wieder auf Grün, auch die virtuelle Disk ist auf grün gewechselt.

 

Seitdem die neue Festplatte drin ist habe ich keine Meldungen mehr über weitere punctures erhalten.

Es scheint als hätte sich mit dem Austausch dieser einen defekten Festplatte alle Probleme gelöst...?

 

Oder kann ich irgendwo nachvollziehen ob es noch Probleme gibt?

Wie gesagt, im iDRAC und auch im Server Administration Center ist alles was mit Festplatten & Virtual Disks zu tun hat grün.

Patrol-Read und Consistency-Check melden keine Probleme.

 

Das stand im Log nach dem Rebuild:

 
2020-11-02T13:45:00+0100 The bad block table(s) is cleared because Virtual Disk 0 on Integrated RAID Controller 1 is initialized.
2020-11-02T13:45:00+0100 A disk media error was corrected on Virtual Disk 0 on Integrated RAID Controller 1.
2020-11-02T10:36:37+0100 Disk 2 in Backplane 1 of Integrated RAID Controller 1 rebuild is complete.
2020-11-02T10:36:37+0100 Virtual Disk 0 on Integrated RAID Controller 1 returned to optimal state.
2020-11-02T10:36:27+0100 Bad block medium error is detected at block 0xadd14852 on Virtual Disk 0 on Integrated RAID Controller 1.
2020-11-02T10:36:27+0100 An unrecoverable disk media error occurred on Disk 4 in Backplane 1 of Integrated RAID Controller 1.

 

Viele Grüße

Moderator

 • 

790 Nachrichten

November 17th, 2020 03:00

Hi Klara,

 

der Fehler konnte also behoben werden, umso besser.
Dann soltte es auch vorerst keine weiteren Störungen geben.

 

Viele Grüße

Stefan

Keine Veranstaltungen gefunden!

Top