PowerEdge: Proč pevné disky selhávají
Summary: Tento článek podrobně vysvětluje různé důvody, proč mohou selhat pevné disky.
Instructions
Obsah
- Poškození firmwaru a zóny firmwaru
- Elektronická porucha
- Mechanická porucha
- Logická závada
- Chyby médií
- Prostředí SCSI/SAS
Poškození firmwaru a zóny firmwaru
Pokud se firmware pevného disku poškodí nebo přestane být čitelný, počítač často není schopen s pevným diskem správně komunikovat
Elektronická porucha
Elektronická porucha obvykle souvisí s problémy na řídicí desce pevného disku. U serveru může dojít k výkyvům napájení nebo přepětí, které vyřadí desku řadiče na pevném disku a znemožní přístup do systému BIOS řadiče.
Mechanická porucha
Mechanická porucha může často (zejména pokud není včas řešena) vést k částečné, a někdy i úplné ztrátě dat. Mechanické poruchy se vyskytují v různých podobách, jako je selhání čtecí/zapisovací hlavy a problémy s motorkem. Jednou z nejčastějších mechanických poruch je poškození hlavy. K poškození hlavy s různou závažností dochází, když se čtecí/zapisovací hlavy pevného disku dostanou do kontaktu, ať už na okamžik nebo trvale, s plotnami pevného disku.
Poškození hlavy může být způsoben řadou důvodů, včetně fyzického šoku (například pádem disku na zem), pohybem počítače, statickou elektřinou, přepětím a mechanickým selháním čtecí/zapisovací hlavy.
Logická závada
Logické chyby, které jsou často nejjednoduššími i nejobtížnějšími problémy, mohou sahat od jednoduchých věcí, jako je neplatný záznam v tabulce alokace souborů, až po skutečně hrozivé problémy, jako je poškození a ztráta systému souborů na silně fragmentovaném disku.
Logické chyby se liší od výše uvedených elektrických a mechanických problémů, protože s diskem obvykle není „fyzicky“ nic v nepořádku, pouze s informacemi na něm uloženými.
Chyby médií
Vadné sektory jsou oblasti pevného disku, které se stanou nečitelnými. Na všech pevných discích se nakonec vytvoří chybné sektory. Sektory, které se pokazí, jsou označeny pevným diskem a dále se nepoužívají, ale pokud máte data, která se nacházejí v sektorech, které se stanou vadnými, nebudete moci ke svým datům nebo souborům správně přistupovat. Náročné provozní podmínky (například vysoké teploty, vibrace atd.) mohou způsobit, že se na pevných discích rychle vytvoří mnoho vadných sektorů. Každý typ pevného disku je náchylný k „přirozenému“ vzniku vadných sektorů, ale není tomu tak vždy.
Prostředí SCSI/SAS
Pevné disky SCSI jsou často považovány za vysoce výkonné disky. Otáčejí se rychleji než jejich protějšky IDE/SATA, takže rychlost přenosu dat je často vyšší. Z tohoto důvodu se jednotky SCSI často nacházejí na serverech, které musí poskytovat velké množství propustnosti dat. Tento výkon je však často vykoupen vysokou daní, protože mechanické poruchy jsou u těchto disků pravděpodobnější.
Nejčastější příčinou selhání více disků v tomto prostředí je špatná kvalita signálu na sběrnici SCSI. Špatná kvalita signálu má za následek režii protokolu SCSI, který se snaží tyto problémy odstranit (vypršení časového limitu a resetování sběrnice). Jak je systém stále vytíženější a poptávka po datech roste, nápravná opatření protokolu SCSI se zvyšují a sběrnice SCSI se blíží nasycení. Tato režie nakonec omezuje šířku pásma běžné komunikace zařízení, a pokud není vymazána, jedno nebo více zařízení SCSI nemusí být schopno včas reagovat na řadič RAID, což vede k tomu, že řadič RAID označí pevný disk jako offline. Tyto typy problémů se signálem mohou být způsobeny nesprávnou instalací řadiče RAID do slotu PCI, špatným připojením kabelů, špatným usazením disků vůči propojovací backplane SCSI, nesprávnou instalací nebo uložením dceřiných karet backplane a nesprávným ukončením sběrnice SCSI.
Možné jsou také kombinace těchto typů selhání.
Všichni technici a zákazníci by si měli přečíst a pochopit vzorové postupy údržby, aby maximalizovali dobu provozu a pomohli zabránit ztrátě dat v důsledku selhání pevného disku.