PowerEdge: Hohe SMART-Fehlerraten für Lese- und Verifizierungs-ECC-Fehler auf bestimmten Unternehmensfestplatten
Summary: Hohe SMART-Fehlerraten auf einigen Enterprise-Festplatten sind informativ und haben keinen Einfluss auf den Hardwarezustand.
Symptoms
Inhaltsverzeichnis
1. Einführung
2. Beschreibung
3. Lösung
4. Weitere Informationen
Einführung
S.M.A.R.T. (Self-Monitoring, Analysis, and Reporting Technology; oft als SMART bezeichnet) ist ein international standardisiertes Integritätsüberwachungssystem für Festplatten und Solid-State-Laufwerke.
Die Hauptfunktion von SMART besteht darin, Anzeigen für die Zuverlässigkeit von Laufwerken zu erkennen und zu melden, um Ausfälle zu antizipieren, um einen Austausch der Hardware vor einem Ausfall zu ermöglichen und die Datenintegrität aufrechtzuerhalten.
Dell hat bei der Interpretation dieser Werte mit unseren Festplattenanbietern zusammengearbeitet.
Beschreibung
Die Überprüfung des SMART-Status einiger Enterprise-Festplatten ergab bei bestimmten Modellen hohe Lese- und Verifizierungs-ECC-Korrekturraten. Ein Vergleich dieser Werte mit anderen Festplatten kann darauf hindeuten, dass einige Modelle eine höhere Fehlerrate aufweisen als andere, die möglicherweise keine ECC-Korrekturen melden.
Manchmal wird diese Fehlerrate in Form von Hunderten von Millionen von ECC-Korrekturen angezeigt und kann schnell zunehmen, wenn mehr I/O-Transaktionen auftreten.
Nachstehend finden Sie ein Beispiel für diese Situation. Dieses Beispiel wurde durch Ausführen des Befehls "smartctl -a /dev/sdX" unter Linux OS.
Abbildung 1: Fehlerzählerprotokoll
Smartctl Anwendung ist Bestandteil von Smartmontools, ein Open-Source-Toolset zur Abfrage des Zustands von Festplatten.
Smartmontools, gibt die Anzahl der ECC-Fehler für die Geräte möglicherweise nicht genau wieder.
Cause
Resolution
Lösung
Die SMART-Spezifikation ermöglicht es Anbietern, diese Zähler, wie z. B. die im obigen Beispiel dargestellten, zu Informationszwecken bereitzustellen. Die Zähler stellen nicht unbedingt eine Anzahl von Hard- oder Soft-Fehlern innerhalb der ECC-Logik dar. Dies ermöglicht jedem Laufwerksanbieter Flexibilität hinsichtlich der Anzeige in den verfügbaren SMART-Feldern. Für einige Anbieter gibt es keine Fehlerdaten in den ECC-Kategorien "Lesen" oder "Überprüfen". Im obigen Beispiel hat der Anbieter die Zähler für die Überwachung der ECC-Funktionen verwendet. Die dargestellten Werte stellen keine Fehlerrate dar. Ebenso deutet eine höhere Rate von Ereignissen auf einigen Festplatten im Vergleich zu anderen nicht darauf hin, dass ein Performanceproblem vorliegt.
Bei spezifischen Fragen zu Integritätsindikatoren auf einem Enterprise-Festplattenmodell wenden Sie sich an unsere Supporttechniker, um Antworten von den Engineering-Teams von Dell Technologies zu erhalten.
.
Additional Information
Weitere Informationen
- Weitere Informationen über die internationale Standardisierung von SMART-Werten und anderen SCSI-Speicherschnittstellen finden Sie auf der Homepage des technischen Komitees T10 hier
.
Smartmontoolsist ein Dienstprogramm zur Steuerung und Überwachung von Computerspeichersystemen mit Hilfe der Selbstüberwachungs-, Analyse- und Berichtstechnologie, die in die meisten modernen ATA-, seriellen ATA-, SCSI/SAS- und NVMe-Festplatten integriert ist. Es handelt sich nicht um ein Dell Tool. Weitere Informationen zuSmartmontoolsfinden Sie hier.