PowerEdge: Hohe SMART-Fehlerraten für Lese- und Verifizierungs-ECC-Fehler auf bestimmten Unternehmensfestplatten

Summary: Hohe SMART-Fehlerraten auf einigen Enterprise-Festplatten sind informativ und haben keinen Einfluss auf den Hardwarezustand.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Inhaltsverzeichnis

1. Einführung
2. Beschreibung
3. Lösung
4. Weitere Informationen

 


Einführung

S.M.A.R.T. (Self-Monitoring, Analysis, and Reporting Technology; oft als SMART bezeichnet) ist ein international standardisiertes Integritätsüberwachungssystem für Festplatten und Solid-State-Laufwerke.

Die Hauptfunktion von SMART besteht darin, Anzeigen für die Zuverlässigkeit von Laufwerken zu erkennen und zu melden, um Ausfälle zu antizipieren, um einen Austausch der Hardware vor einem Ausfall zu ermöglichen und die Datenintegrität aufrechtzuerhalten.

Dell hat bei der Interpretation dieser Werte mit unseren Festplattenanbietern zusammengearbeitet.
 


Beschreibung

Die Überprüfung des SMART-Status einiger Enterprise-Festplatten ergab bei bestimmten Modellen hohe Lese- und Verifizierungs-ECC-Korrekturraten. Ein Vergleich dieser Werte mit anderen Festplatten kann darauf hindeuten, dass einige Modelle eine höhere Fehlerrate aufweisen als andere, die möglicherweise keine ECC-Korrekturen melden.
Manchmal wird diese Fehlerrate in Form von Hunderten von Millionen von ECC-Korrekturen angezeigt und kann schnell zunehmen, wenn mehr I/O-Transaktionen auftreten.

 

Nachstehend finden Sie ein Beispiel für diese Situation. Dieses Beispiel wurde durch Ausführen des Befehls "smartctl -a /dev/sdX" unter Linux OS.
Fehlerzählerprotokoll 
Abbildung 1: Fehlerzählerprotokoll

Hinweis: Die Spalte Smartctl Anwendung ist Bestandteil von Smartmontools, ein Open-Source-Toolset zur Abfrage des Zustands von Festplatten.
Hinweis: SMART-Protokolle von Festplatten der Enterprise-Klasse, interpretiert von Drittanbieter-Dienstprogrammen wie Smartmontools, gibt die Anzahl der ECC-Fehler für die Geräte möglicherweise nicht genau wieder.

 

Cause

N. z.

Resolution

Lösung


Die SMART-Spezifikation ermöglicht es Anbietern, diese Zähler, wie z. B. die im obigen Beispiel dargestellten, zu Informationszwecken bereitzustellen. Die Zähler stellen nicht unbedingt eine Anzahl von Hard- oder Soft-Fehlern innerhalb der ECC-Logik dar. Dies ermöglicht jedem Laufwerksanbieter Flexibilität hinsichtlich der Anzeige in den verfügbaren SMART-Feldern. Für einige Anbieter gibt es keine Fehlerdaten in den ECC-Kategorien "Lesen" oder "Überprüfen". Im obigen Beispiel hat der Anbieter die Zähler für die Überwachung der ECC-Funktionen verwendet. Die dargestellten Werte stellen keine Fehlerrate dar. Ebenso deutet eine höhere Rate von Ereignissen auf einigen Festplatten im Vergleich zu anderen nicht darauf hin, dass ein Performanceproblem vorliegt.
 

Hinweis: SMART-Parameter sollten nicht über eine gemischte Installationsbasis von mehreren Anbietern oder aus mehreren Modellen hinweg verglichen werden. Es sollten nur ähnliche Modelle und Firmware verglichen werden.

Bei spezifischen Fragen zu Integritätsindikatoren auf einem Enterprise-Festplattenmodell wenden Sie sich an unsere Supporttechniker, um Antworten von den Engineering-Teams von Dell Technologies zu erhalten.

.

Additional Information

 

Weitere Informationen

  • Weitere Informationen über die internationale Standardisierung von SMART-Werten und anderen SCSI-Speicherschnittstellen finden Sie auf der Homepage des technischen Komitees T10 hierDieser Hyperlink führt Sie zu einer Website außerhalb von Dell Technologies..
  • Smartmontools ist ein Dienstprogramm zur Steuerung und Überwachung von Computerspeichersystemen mit Hilfe der Selbstüberwachungs-, Analyse- und Berichtstechnologie, die in die meisten modernen ATA-, seriellen ATA-, SCSI/SAS- und NVMe-Festplatten integriert ist. Es handelt sich nicht um ein Dell Tool. Weitere Informationen zu Smartmontools finden Sie hierDieser Hyperlink führt Sie zu einer Website außerhalb von Dell Technologies..

 

Affected Products

PowerEdge, C Series, PowerVault, Legacy Storage Models
Article Properties
Article Number: 000147878
Article Type: Solution
Last Modified: 01 May 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.