PowerEdge: Hvorfor fejler harddiske
Summary: Denne artikel forklarer de forskellige årsager til, at harddiske kan mislykkes i detaljer.
Instructions
Indholdsfortegnelse
- Firmwarebeskadigelse og beskadigelse af firmwarezonen
- Elektronisk fejl
- Mekanisk fejl
- Logisk fejl
- Mediefejl
- SCSI/SAS-miljø
Firmwarebeskadigelse og beskadigelse af firmwarezonen
Når firmwaren på en harddisk bliver beskadiget eller ulæselig, kan computeren ofte ikke interagere korrekt med harddisken
Elektronisk fejl
Elektronisk fejl vedrører normalt problemer på harddiskens controllerkort. Serveren kan opleve en strømspids eller elektrisk overspænding, der slår controllerkortet på harddisken ud, så det ikke kan registreres af controllerens BIOS.
Mekanisk fejl
Mekanisk svigt kan ofte (især hvis der ikke reageres på tidligt) føre til et delvist og undertiden totalt tab af data. Mekanisk svigt kommer i forskellige afskygninger såsom læse- / skrivehovedfejl og motoriske problemer. En af de mest almindelige mekaniske fejl er et hovedulykke. Forskellige i sværhedsgrad opstår der et hovednedbrud, når harddiskens læse-/skrivehoveder midlertidigt eller kontinuerligt kommer i kontakt med harddiskens plader.
Hovednedbrud kan skyldes en række årsager, herunder fysisk stød (såsom at tabe disken på gulvet), computerens bevægelse, statisk elektricitet, strømstød og mekanisk læse-/skrivehovedfejl.
Logisk fejl
Ofte er de nemmeste og sværeste problemer at håndtere, logiske fejl kan variere fra enkle ting som en ugyldig post i en filallokeringstabel til virkelig forfærdelige problemer som korruption og tab af filsystemet på et alvorligt fragmenteret drev.
Logiske fejl er forskellige fra de elektriske og mekaniske problemer ovenfor, da der normalt ikke er noget 'fysisk' galt med disken, men informationen bits på den.
Mediefejl
Dårlige sektorer er områder på harddisken, der bliver ulæselige. Alle harddiskdrev udvikler dårlige sektorer til sidst, sektorer, der går dårligt, markeres af harddisken og bruges ikke længere, men hvis du har data, der ligger på sektorer, der bliver dårlige sektorer, kan du ikke få adgang til dine data eller filer korrekt. Barske driftsforhold (f.eks. høje temperaturer, vibrationer osv.) kan medføre, at harddiske hurtigt udvikler mange dårlige sektorer. Hver type harddisk er tilbøjelig til at udvikle dårlige sektorer 'naturligt', men det er ikke altid tilfældet.
SCSI/SAS-miljø
SCSI-harddiske betragtes ofte som højtydende drev. De drejer hurtigere end deres IDE / SATA-kolleger, og derfor er dataoverførselshastigheder ofte hurtigere. Derfor findes SCSI-drev ofte på servere, der skal levere en masse dataoverførselshastigheder. Denne ydeevne har dog ofte en pris, da mekaniske fejl er mere sandsynlige på disse drev.
Den mest almindelige årsag til fejl på flere diske i dette miljø er dårlig signalkvalitet på tværs af SCSI-bussen. Dårlig signalkvalitet resulterer i SCSI-protokolomkostninger, når den forsøger at gendanne fra disse problemer (timeouts og busnulstillinger). Efterhånden som systemet bliver travlere, og efterspørgslen efter data stiger, øges SCSI-protokollens korrigerende handlinger, og SCSI-bussen kommer tættere på mætning. Disse faste omkostninger begrænser i sidste ende de normale kommunikationsbåndbredder for enheden, og hvis de ikke ryddes, kan en eller flere SCSI-enheder muligvis ikke reagere på RAID-controlleren rettidigt, hvilket resulterer i, at RAID-controlleren markerer harddisken offline. Disse typer signalproblemer kan skyldes forkert installation af RAID-controlleren i et PCI-slot, dårlige kabelforbindelser, dårlig placering af diskene mod SCSI-backplane, forkert installation eller placering af backplane-datterkort og forkert SCSI-busterminering.
Kombinationer af disse fejltyper er også mulige.
Alle teknikere og kunder bør læse og forstå bedste praksis for vedligeholdelse for at maksimere oppetiden og hjælpe med at forhindre tab af data som følge af harddiskfejl.