Avamar: Gen4S-Hardware: So beheben Sie verschiedene Festplattenereignisse und -fehler
Summary: Dieser Artikel befasst sich mit vielen der häufigsten datenträgerbezogenen Fehler, die auf einem Gen4S-Node gemeldet werden, zusammen mit den erforderlichen Aktionen.
Symptoms
Ereignisse, die den folgenden Ereignissen ähneln, werden in der Benutzeroberfläche oder in Protokolldateien beobachtet:
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Information unit CRC error detected, CDB = 0x28 0x00 0xb6 0x77 0xc3 0x07 0x00 0x01 0xd0 0x00, Sense = 0x70 0x00 0x0b 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x47 0x03 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Unrecovered read error, CDB = 0x28 0x00 0xd2 0x91 0xe0 0xf7 0x00 0x00 0x40 0x00, Sense = 0xf0 0x00 0x03 0xd2 0x91 0xe0 0xf7 0x0a 0x00 0x00 0x00 0x00 0x11 0x00 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Hardware impending failure general hard drive failure, CDB = 0x03 0x00 0x00 0x00 0x40 0x00, Sense = 0x70 0x00 0x00 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x5d 0x10 0x00 0x00 0x00 0x00
Controller ID: 0 PD Reset: PD = Port 0 - 3:2:n, Error = 3, Path = 0x5001234567890
Controller ID: 0 Unexpected sense: PD = -:-:n Recovered data - recommended rewrite, CDB = 0x2f 0x00 0x01 0x09 0x80 0x00 0x00 0x10 0x00 0x00, Sense = 0xf0 0x00 0x01 0x01 0x09 0x8f 0xed 0x18 0x00 0x00 0x00 0x00 0x18 0x06 0x00 0x80 0x09 0x19
Controller ID: 0 Command timeout on PD: PD = Port 0 - 3:2:n No additional sense information, CDB = 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff, Sense = , Path = 0x5001234567890
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Logical block address out of range, CDB = 0x2a 0x00 0xac 0x64 0xcd 0xe6 0x00 0x00 0x08 0x00, Sense = 0xf0 0x00 0x05 0xac 0x64 0xcd 0xe6 0x0a 0x00 0x00 0x00 0x00 0x21 0x00 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Power on, reset, or bus device reset occurred, CDB = 0x2a 0x00 0x41 0xab 0x7a 0x00 0x00 0x00 0x80 0x00, Sense = 0x70 0x00 0x06 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00
Controller ID: 0 PD Predictive failure: Port 0 - 3:2:n
-
- 3:2:0 - 3:2:11 oder -:-:0 - -:-:11 sind die internen Standardfestplatten
- 3:2:12 oder -:-:12 ist die interne SSD-Festplatte.
Cause
Informationen zu Ursachen und Maßnahmen finden Sie im Abschnitt "Lösung".
Resolution
1. Melden Sie sich beim Avamar Utility Node als Administrator an.
2. Erhöhen Sie das Root-Recht.
3. Laden Sie die Root-Schlüssel gemäß Artikel Avamar: So melden Sie sich bei einem Avamar-Server an und laden verschiedene Schlüssel.
4. Ermitteln Sie anhand der Informationen aus dem UI-Ereignis oder der Dial-Home-Service-Request den Node, der die Fehlermeldung erzeugt hat.
5. Stellen Sie mit dem folgenden Befehl eine Verbindung zum Node als Root her:
ssn 0.# --user=root
(Dabei ist 0.# die Nummer des physischen Nodes)
6. Gehen Sie auf dem betroffenen Node wie folgt vor:
ein. Überprüfen Sie den aktuellen Status der Festplatten:
avsysreport pdisk
b. Überprüfen Sie die /var/log/messages Datei für Ereignisse im Zusammenhang mit der Festplatte, die das Ereignis meldet.
Erforderliche Maßnahmen basierend auf protokollierten Ereignissen:
- Für das Ereignis "Wiederhergestellte Daten – empfohlenes Umschreiben":
- Wenn die Festplatte keine anderen Ereignisse gemeldet hat, kann dies ignoriert werden
- Wenn andere Ereignisse vorliegen, wie z. B. "Fehler beim unentdeckten Lesen", wenden Sie sich an Dell Technologies , um festzustellen, ob die Festplatte proaktiv ersetzt werden muss.
- Für das Ereignis "Logische Blockadresse außerhalb des Bereichs":
- Wenn die Festplatte keine anderen Ereignisse gemeldet hat, kann dies ignoriert werden
- Wenn andere Ereignisse vorliegen, wie z. B. "Fehler beim unentdeckten Lesen", wenden Sie sich an Dell Technologies , um festzustellen, ob die Festplatte proaktiv ersetzt werden muss.
- Für das Ereignis "Unentdeckter Lesefehler":
- Wenn sich das Ereignis mehr als dreimal auf einer einzelnen Festplatte wiederholt, liegt bei der betreffenden Festplatte möglicherweise ein Integritätsproblem vor. Wenden Sie sich an Dell Technologies , um herauszufinden, ob die Festplatte proaktiv ausgetauscht werden muss.
- Für das Ereignis "Information Unit CRC error detected":
- Wenn die Festplatte, die das Ereignis meldet, 3:2:12 ist, weist dies darauf hin, dass die SSD ausfällt. Wenden Sie sich an Dell Technologies , um den Node mithilfe des Node-Transplantationsverfahrens zu ersetzen.
- Wenn die Festplatte, die das Ereignis 3:2:0-3:2:11 meldet, weist dies darauf hin, dass die Festplatte fehlerhaft ist. Wenden Sie sich an Dell Technologies , um die Festplatte proaktiv auszutauschen.
- Für das Ereignis "Hardware-bevorstehender Fehler allgemeiner Festplattenfehler":
-
- Wenn die Festplatte, die das Ereignis meldet, 3:2:12 ist, ist die SSD defekt (oder ist ausgefallen). Wenden Sie sich an Dell Technologies , um den Node mithilfe des Node-Transplantationsverfahrens zu ersetzen.
- Wenn die Festplatte, die das Ereignis meldet, 3:2:0-3:2:11 ist, ist die Festplatte fehlerhaft (oder ist ausgefallen). Wenden Sie sich an Dell Technologies , um die Festplatte proaktiv auszutauschen.
- Für das Ereignis "Predictive failure:
- Wenn die Festplatte, die das Ereignis meldet, 3:2:12 ist, hat die SSD über die SMART-Funktion eine Fehlerankündigung gemeldet und weist darauf hin, dass die SSD ausfällt. Wenden Sie sich an Dell Technologies , um den Node mithilfe des Node-Transplantationsverfahrens zu ersetzen.
- Wenn die Festplatte, die das Ereignis meldet, 3:2:0-3:2:11 ist, hat die Festplatte über die SMART-Funktion eine Fehlerankündigung gemeldet und weist darauf hin, dass die Festplatte ausfällt. Wenden Sie sich an Dell Technologies , um die Festplatte proaktiv auszutauschen.
- Für das Ereignis "Einschalten, Zurücksetzen oder Zurücksetzen des Busgeräts aufgetreten":
- Überprüfen Sie die
/var/log/messagesDatei, um zu überprüfen, ob eine einzelne Festplatte oder mehrere Festplatten den Fehler melden.- Wenn ein einzelnes Laufwerk den Fehler meldet, hängt er möglicherweise mit den wöchentlichen Konsistenzprüfungen zusammen. Wenden Sie sich an Dell Technologies , um herauszufinden, ob die Festplatte proaktiv ausgetauscht werden muss.
- Wenn mehrere Festplatten den Fehler melden, ist die Expander-Firmware veraltet oder das Gehäuse befindet sich in einem fehlerhaften oder fehlerhaften Zustand. Wenden Sie sich an Dell Technologies , um die Firmware-Level zu überprüfen oder den Node mithilfe des Node-Transplantationsverfahrens zu ersetzen.
- Überprüfen Sie die
- Für das Ereignis "PD-Reset":
- Überprüfen Sie die
/var/log/messagesDatei, um zu überprüfen, ob eine einzelne Festplatte oder mehrere Festplatten den Fehler melden.- Wenn das Laufwerk vor kurzem ausgetauscht wurde, ist diese Meldung zu erwarten und kann ignoriert werden.
- Wenn das Laufwerk nicht ausgetauscht und eigenständig neu erstellt wurde, ist es möglicherweise fehlerhaft oder ausgefallen. Wenden Sie sich an Dell Technologies , um die Festplatte proaktiv auszutauschen.
- Überprüfen Sie die
- Wenden Sie sich bei den Ereignissen "Befehlstimeout bei PD" oder anderen nicht bereits erwähnten Fehlern an Dell Technologies , um die weitere Vorgehensweise zu bestimmen.