PowerEdge: Varför misslyckas hårddiskar?
Summary: Den här artikeln förklarar i detalj de olika orsakerna till att hårddiskar kan gå sönder.
Instructions
Innehållsförteckning
- Skadad firmware och skador på firmwarezonen
- Elektroniskt fel
- Mekaniskt fel
- Logiskt fel
- Fel i media
- SCSI/SAS-miljö
Skadad firmware och skador på firmwarezonen
När den fasta programvaran på en hårddisk skadas eller blir oläslig kan datorn ofta inte interagera korrekt med hårddisken
Elektroniskt fel
Elektroniska fel är vanligtvis relaterade till problem på hårddiskens styrkort. Servern kan drabbas av en strömspik eller strömsprång som slår ut styrkortet på hårddisken och gör det omöjligt att upptäcka det för styrenhetens BIOS.
Mekaniskt fel
Mekaniska fel kan ofta (särskilt om de inte åtgärdas tidigt) leda till en partiell och ibland total förlust av data. Mekaniska fel kommer i olika skepnader såsom läs-/skrivhuvudfel och motoriska problem. Ett av de vanligaste mekaniska felen är en huvudkrasch. En huvudkrasch varierar i svårighetsgrad och inträffar när hårddiskens läs-/skrivhuvuden kommer i kontakt, tillfälligt eller kontinuerligt, med hårddiskens skivor.
En huvudkrasch kan orsakas av en rad olika orsaker, inklusive fysiska stötar (som att tappa disken på golvet), att datorn rör sig, statisk elektricitet, strömtoppar och fel på det mekaniska läs-/skrivhuvudet.
Logiskt fel
Ofta de enklaste och svåraste problemen att hantera, logiska fel kan sträcka sig från enkla saker som en ogiltig post i en filallokeringstabell till verkligt fruktansvärda problem som korruption och förlust av filsystemet på en allvarligt fragmenterad enhet.
Logiska fel skiljer sig från de elektriska och mekaniska problemen ovan eftersom det vanligtvis inte är något "fysiskt" fel på disketten utan informationsbitarna på den.
Mediefel
Dåliga sektorer är områden på hårddisken som blir oläsliga. Alla hårddiskar utvecklar dåliga sektorer så småningom, sektorer som går dåliga markeras av hårddisken och används inte mer, men om du har data som finns i sektorer som blir dåliga sektorer kan du inte komma åt dina data eller filer korrekt. Tuffa driftsförhållanden (t.ex. höga temperaturer, vibrationer och så vidare) kan göra att hårddiskar snabbt utvecklar många dåliga sektorer. Varje typ av hårddisk är benägen att utveckla dåliga sektorer "naturligt", men så är inte alltid fallet.
SCSI/SAS-miljö
SCSI-hårddiskar betraktas ofta som högpresterande hårddiskar. De snurrar snabbare än sina IDE/SATA-motsvarigheter, och därför är dataöverföringshastigheterna ofta snabbare. På grund av detta finns SCSI-enheter ofta i servrar som måste tillhandahålla mycket datagenomströmning. Denna prestanda har dock ofta ett pris, eftersom mekaniska fel är mer sannolika på dessa enheter.
Den vanligaste orsaken till att det uppstår fel på flera diskar i den här miljön är dålig signalkvalitet i hela SCSI-bussen. Dålig signalkvalitet leder till överbelastning i SCSI-protokollet när det försöker återställa problemen (tidsgränser och bussåterställningar). I takt med att systemet blir mer belastat och efterfrågan på data ökar, ökar SCSI-protokollets korrigerande åtgärder och SCSI-bussen blir närmare mättnad. Den här overheaden begränsar så småningom enhetens normala bandbredd för kommunikation, och om den lämnas orensad kan det hända att en eller flera SCSI-enheter inte kan svara på RAID-kontrollern i tid, vilket resulterar i att RAID-kontrollern markerar hårddisken offline. Dessa typer av signalproblem kan orsakas av felaktig installation av RAID-kontrollern i en PCI-kortplats, dåliga kabelanslutningar, dålig placering av diskarna mot SCSI-bakplanet, felaktig installation eller placering av dotterkort för bakplan och felaktig SCSI-bussavslutning.
Kombinationer av dessa feltyper är också möjliga.
Alla tekniker och kunder bör läsa och förstå bästa praxis för underhåll för att maximera drifttiden och hjälpa till att förhindra dataförlust till följd av hårddiskfel.