PowerEdge: Høje SMART-fejlrater for læse og verificere ECC-fejl på visse virksomhedsharddiske
Summary: Høje SMART-fejlrater på nogle Enterprise-harddiske er informative og har ingen indflydelse på hardwarens tilstand.
Symptoms
Indholdsfortegnelse
1. Indførelsen
2. Beskrivelse
3. Opløsning
4. Yderligere oplysninger
Indledning
S.M.A.R.T. (Self-Monitoring, Analysis, and Reporting Technology; ofte skrevet som SMART) er et sundhedsovervågningssystem til harddiske og solid state-drev, som er internationalt standardiseret.
SMARTs primære funktion er at registrere og rapportere indikatorer for drevpålidelighed, forudse fejl for at tillade udskiftning af hardware før fejl og opretholde dataintegritet.
Dell har samarbejdet med vores harddiskleverandører om fortolkningen af disse værdier.
Beskrivelse
Gennemgang af SMART-status for nogle virksomhedsharddiske afslørede høje læse- og verificeringskorrektionshastigheder for ECC på visse modeller. Sammenligning af disse værdier med andre harddiske kan tyde på, at nogle modeller har en højere fejlrate end andre, som kan rapportere nul ECC-korrektioner.
Nogle gange vises denne fejlprocent som hundreder af millioner af ECC-korrektioner og kan stige hurtigt, efterhånden som flere I / O-transaktioner finder sted.
Et eksempel på dette er vist nedenfor. Dette eksempel blev indsamlet ved at køre kommandoen "smartctl -a /dev/sdX" under Linux OS.
Figur 1: Fejl i tællerlog
Smartctl Ansøgningen er en bestanddel af Smartmontools, et open source-værktøjssæt til forespørgsel om harddiskes tilstand.
Smartmontools, afspejler muligvis ikke nøjagtigt antallet af ECC-fejl for enhederne.
Cause
Resolution
Løsning
SMART-specifikationen giver leverandører mulighed for at levere disse tællere, som vist i ovenstående eksempel, kun til orientering. Tællerne angiver ikke nødvendigvis et antal bløde eller hårde fejl i ECC-logikken. Dette giver hver drevleverandør fleksibilitet med hensyn til, hvad der vises i de tilgængelige SMART-felter. For nogle leverandører er der ingen fejldata i ECC-kategorierne læs eller bekræft. I ovenstående eksempel har leverandøren valgt at bruge tællerne til overvågning af ECC-funktionaliteten. De viste værdier repræsenterer ikke en fejlfrekvens. På samme måde betyder en højere frekvens af hændelser på nogle diske sammenlignet med andre ikke, at der er et ydelsesproblem.
Hvis du har specifikke spørgsmål om tilstandstællere på en Enterprise-harddiskmodel, kan du kontakte vores supportteknikere for at få svar fra Dell Technologies' tekniske teams.
.
Additional Information
Yderligere oplysninger
- For mere information om den internationale standardisering af SMART-værdier og andre SCSI-lagergrænseflader se hjemmesiden for T10's tekniske udvalg, der findes her
.
Smartmontoolser et hjælpeprogram til styring og overvågning af computerstoragesystemer ved hjælp af selvovervågnings-, analyse- og rapporteringsteknologisystemet, der er indbygget i de fleste moderne ATA-, Seriel ATA-, SCSI/SAS- og NVMe-harddiske. Det er ikke et Dell-værktøj. Flere oplysninger omSmartmontoolskan findes her.