PowerEdge: Høy SMART-feilrate for lesing og verifisering av ECC-feil på enkelte harddisker for virksomheter
Summary: Høye SMART-feilrater på enkelte Enterprise-harddisker er informative og har ingen innvirkning på maskinvaretilstanden.
Symptoms
Innholdsfortegnelse
1. Introduksjon
2. Beskrivelse
3. Løsning
4. Mer informasjon
Innledning
S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology; ofte skrevet som SMART) er et tilstandsovervåkingssystem for harddisker og solid state-stasjoner som er internasjonalt standardisert.
SMARTs primære funksjon er å oppdage og rapportere frekvensomformerens pålitelighetsindikatorer, forutse feil for å tillate utskifting av maskinvare før feil og opprettholde dataintegriteten.
Dell har samarbeidet med harddiskleverandørene våre i tolkningen av disse verdiene.
Beskrivelse
Gjennomgang av SMART-statusen for enkelte bedriftsharddisker viste høy lese- og verifiseringsfrekvens for ECC på enkelte modeller. Sammenligning av disse verdiene med andre harddisker kan tyde på at noen modeller har en høyere feilrate enn andre, noe som kan rapportere null ECC-korreksjoner.
Noen ganger vises denne feilraten som hundrevis av millioner ECC-korreksjoner, og kan øke raskt etter hvert som flere I/O-transaksjoner oppstår.
Nedenfor finner du et eksempel på denne situasjonen. Dette eksemplet ble samlet ved å kjøre kommandoen "smartctl -a /dev/sdX" under Linux OS.
Figur 1: Feiltellerlogg
Smartctl Applikasjonen er en komponent i Smartmontools, et verktøysett med åpen kildekode for spørring av tilstanden til harddisker.
Smartmontools, gjenspeiler kanskje ikke nøyaktig antallet ECC-feil for enhetene.
Cause
Resolution
Løsning
SMART-spesifikasjonen gjør det mulig for leverandører å levere disse tellerne, for eksempel tellerne som vises i eksemplet ovenfor, som informasjon. Tellerne er ikke nødvendigvis en opptelling av myke eller harde feil i ECC-logikken. Dette gir hver enkelt stasjonsleverandør fleksibilitet med hensyn til hva som vises i de tilgjengelige SMART-feltene. For noen leverandører er det ingen feildata i ECC-kategoriene for lesing eller verifisering. I eksemplet ovenfor har leverandøren valgt å bruke tellerne for overvåking av ECC-funksjonen. Verdiene som presenteres, representerer ikke en feilfrekvens. Tilsvarende betyr ikke en høyere frekvens av hendelser på noen disker sammenlignet med andre at det eksisterer et ytelsesproblem.
Hvis du har spesifikke spørsmål om helsetellere på en Enterprise-harddiskmodell, kan du kontakte kundestøtteteknikerne våre for å få svar fra Dell Technologies' tekniske team.
.
Additional Information
Mer informasjon
- Hvis du vil ha mer informasjon om den internasjonale standardiseringen av SMART-verdier og andre SCSI-lagringsgrensesnitt, kan du se hjemmesiden til T10s tekniske komité her
.
Smartmontoolser et verktøy for å kontrollere og overvåke datalagringssystemer ved hjelp av selvovervåkings-, analyse- og rapporteringsteknologisystemet innebygd i de fleste moderne ATA-, seriell-, ATA-, SCSI-/SAS- og NVMe-harddisker. Det er ikke et Dell-verktøy. Mer informasjon omSmartmontoolsfinner du her.