PowerEdge: Höga SMART-felfrekvenser för läsning och verifiering av ECC-fel på vissa företagshårddiskar
Summary: Höga SMART-felfrekvenser på vissa Enterprise-hårddiskar är informativa och har ingen betydelse för maskinvarans hälsa.
Symptoms
Innehållsförteckning
1. Införandet
2. Beskrivning
3. Lösning
4. Ytterligare information
Introduktion
S.M.A.R.T. (Self-Monitoring, Analysis, and Reporting Technology; ofta skrivet som SMART) är ett hälsoövervakningssystem för hårddiskar och solid state-enheter som har standardiserats internationellt.
SMART:s primära funktion är att detektera och rapportera indikatorer för diskens tillförlitlighet, förutse fel för att möjliggöra byte av hårdvara före fel och upprätthålla dataintegriteten.
Dell har samarbetat med våra hårddiskleverantörer i tolkningen av dessa värden.
Beskrivning
Granskning av SMART-status för vissa företagshårddiskar avslöjade höga läs- och verifieringsfrekvenser för ECC-korrigering på vissa modeller. En jämförelse av dessa värden med andra hårddiskar kan tyda på att vissa modeller har en högre felfrekvens än andra, som kan rapportera noll ECC-korrigeringar.
Ibland visas denna felfrekvens som hundratals miljoner ECC-korrigeringar och kan öka snabbt när fler I/O-transaktioner sker.
Nedan visas ett exempel på den här situationen. Det här exemplet samlades in genom att köra kommandot "smartctl -a /dev/sdX" under Linux OS.
Figur 1: Felräknarlogg
Smartctl applikationen är en del av Smartmontools, en verktygsuppsättning med öppen källkod för att fråga efter hårddiskars hälsa.
Smartmontools, kanske inte korrekt återspeglar antalet ECC-fel för enheterna.
Cause
Resolution
Lösning
SMART-specifikationen gör att leverantörer kan tillhandahålla dessa räknare, som de som visades i exemplet ovan, i informationssyfte. Räknarna måste inte nödvändigtvis ange antalet mjuka eller hårda fel i ECC-logiken. Detta ger varje drivenhetsleverantör flexibilitet när det gäller vad som visas i de tillgängliga SMART-fälten. För vissa leverantörer finns inga feldata i ECC-läs- eller verifieringskategorierna. I exemplet ovan har leverantören valt att använda räknarna för att övervaka ECC-funktionaliteten. De värden som visas representerar inte en felfrekvens. På samma sätt indikerar inte en högre händelsefrekvens på vissa diskar jämfört med andra att det finns något prestandaproblem.
För specifika frågor om hälsoräknare på en Enterprise-hårddiskmodell kontaktar du våra supporttekniker för att få svar från Dell Technologies teknikteam.
.
Additional Information
Ytterligare information
- För mer information om den internationella standardiseringen av SMART-värden och andra SCSI-lagringsgränssnitt, se hemsidan för T10:s tekniska kommitté som finns här
.
Smartmontoolsär ett verktyg för att styra och övervaka datorlagringssystem med hjälp av Self-Monitoring, Analysis and Reporting Technology-systemet som är inbyggt i de flesta moderna ATA-, Serial ATA-, SCSI/SAS- och NVMe-hårddiskar. Det är inte ett verktyg från Dell. Mer information omSmartmontoolshittar du här.