PowerEdge: Hvorfor mislykkes harddisker
Summary: Denne artikkelen forklarer de ulike årsakene til at harddisker kan svikte i detalj.
Instructions
Innholdsfortegnelse
- Ødelagt fastvare og skade på fastvaresonen
- Elektronisk feil
- Mekanisk svikt
- Logisk feil
- Mediefeil
- SCSI/SAS-miljø
Ødelagt fastvare og skade på fastvaresonen
Når fastvaren til en harddisk blir skadet eller uleselig, er datamaskinen ofte ikke i stand til å samhandle riktig med harddisken
Elektronisk feil
Elektronisk svikt er vanligvis relatert til problemer på kontrollerkortet på harddisken. Serveren kan bli utsatt for en strømøkning eller elektrisk overspenning som slår ut kontrollerkortet på harddisken, noe som gjør det umulig å oppdage for kontrollerens BIOS.
Mekanisk svikt
Mekanisk svikt kan ofte (spesielt hvis det ikke handles tidlig) føre til delvis og noen ganger totalt tap av data. Mekanisk svikt kommer i ulike forkledninger som lese-/skrivehodesvikt og motoriske problemer. En av de vanligste mekaniske feilene er en hodeulykke. Et hodekrasj varierer i alvorlighetsgrad når lese-/skrivehodene på harddisken kommer i kontakt, et øyeblikk eller kontinuerlig, med platene på harddisken.
Hodekrasj kan skyldes en rekke årsaker, inkludert fysisk støt (for eksempel å miste disken på gulvet), bevegelse av datamaskinen, statisk elektrisitet, overspenning og mekanisk lese / skrive hodefeil.
Logisk feil
Ofte kan de enkleste og vanskeligste problemene å håndtere, logiske feil variere fra enkle ting som en ugyldig oppføring i en filtildelingstabell til virkelig forferdelige problemer som korrupsjon og tap av filsystemet på en alvorlig fragmentert stasjon.
Logiske feil er forskjellige fra de elektriske og mekaniske problemene ovenfor, da det vanligvis ikke er noe "fysisk" galt med disken, men informasjonen biter på den.
Mediefeil
Skadede sektorer er områder på harddisken som blir uleselige. Alle harddisker utvikler dårlige sektorer til slutt, sektorer som går dårlig er merket av harddisken og ikke brukt lenger, men hvis du har data som ligger på sektorer som blir dårlige sektorer, kan du ikke få tilgang til dataene eller filene dine riktig. Tøffe driftsforhold (for eksempel høye temperaturer, vibrasjon og så videre) kan føre til at harddisker utvikler mange dårlige sektorer raskt. Hver type harddisk er utsatt for å utvikle dårlige sektorer "naturlig", men dette er ikke alltid tilfelle.
SCSI/SAS-miljø
SCSI-harddisker blir ofte sett på som stasjoner med høy ytelse. De spinner raskere enn sine IDE / SATA-kolleger, og derfor er dataoverføringshastighetene ofte raskere. På grunn av dette finnes SCSI-stasjoner ofte i servere som må gi mye datagjennomstrømning. Denne ytelsen har imidlertid ofte sin pris, siden det er mer sannsynlig med mekaniske feil på disse diskene.
Den vanligste årsaken til flere diskfeil i dette miljøet er dårlig signalkvalitet over SCSI-bussen. Dårlig signalkvalitet resulterer i SCSI-protokollens overhead når den prøver å gjenopprette fra disse problemene (tidsavbrudd og tilbakestilling av bussen). Etter hvert som systemet blir travlere og etterspørselen etter data øker, øker de korrigerende tiltakene til SCSI-protokollen, og SCSI-bussen nærmer seg metning. Denne belastningen begrenser til slutt den vanlige båndbredden for enhetskommunikasjon, og hvis den ikke er slettet, kan det hende at én eller flere SCSI-enheter ikke kan svare RAID-kontrolleren i tide, noe som resulterer i at RAID-kontrolleren merker harddisken frakoblet. Denne typen signalproblemer kan skyldes feil installasjon av RAID-kontrolleren i et PCI-spor, dårlige kabeltilkoblinger, dårlig plassering av diskene mot SCSI-backplane, feil installasjon eller plassering av backplane-datterkort og feil SCSI-bussavslutning.
Kombinasjoner av disse feiltypene er også mulige.
Alle teknikere og kunder bør lese og forstå anbefalte fremgangsmåter for vedlikehold for å maksimere oppetiden og bidra til å forhindre tap av data som følge av harddiskfeil.