PowerEdge: Waarom falen harde schijven?
Samenvatting: In dit artikel worden de verschillende redenen waarom harde schijven defect kunnen raken, in detail uitgelegd.
Instructies
Inhoudsopgave
- Beschadiging van de firmware en schade aan de firmwarezone
- Elektronische storing
- Mechanische storing
- Logische fout
- Mediafouten
- SCSI/SAS-omgeving
- Waarschuwingen voor PowerEdge schijfstoringen
Beschadiging van de firmware en schade aan de firmwarezone
Wanneer de firmware van een harde schijf beschadigd of onleesbaar wordt, kan de computer vaak niet correct communiceren met de harde schijf.
Elektronische storing
Elektronische storingen hebben meestal betrekking op problemen op de controllerkaart van de harde schijf. De server kan te maken krijgen met een stroompiek of een stroomstoot waardoor de controllerkaart op de harde schijf uitvalt en niet meer detecteerbaar is voor het BIOS.
Mechanische storing
Mechanische storingen kunnen vaak (vooral als er niet vroegtijdig wordt ingegrepen) leiden tot een gedeeltelijk en soms volledig verlies van gegevens. Mechanische storingen komen in verschillende gedaanten voor, zoals het falen van de lees-/schrijfkop en motorproblemen. Een van de meest voorkomende mechanische storingen is een botsing met het hoofd. Een headcrash, variërend in ernst, treedt op wanneer de lees-/schrijfkoppen van de harde schijf kortstondig of continu in contact komen met de platen van de harde schijf.
Een botsing van het hoofd kan leiden uit verschillende redenen, waaronder een fysieke schok (zoals het laten vallen van de schijf op de grond), beweging van de computer, statische elektriciteit, stroompieken en mechanische lees-/schrijfkopstoringen.
Logische fout
Logische fouten zijn vaak de gemakkelijkste en de moeilijkste problemen om mee om te gaan. Logische fouten kunnen variëren van eenvoudige dingen zoals een ongeldige invoer in een bestandstoewijzingstabel tot echt gruwelijke problemen zoals de beschadiging en het verlies van het bestandssysteem op een ernstig gefragmenteerde schijf.
Logische fouten zijn anders dan de elektrische en mechanische problemen hierboven, omdat er meestal niets 'fysiek' mis is met de schijf, behalve de informatiebits erop.
Mediafouten
Slechte sectoren zijn delen van de harde schijf die onleesbaar worden. Alle harde schijven ontwikkelen uiteindelijk slechte sectoren. De harde schijf markeert de sectoren die slecht gaan en deze worden niet verder gebruikt. Maar als u gegevens hebt die zich bevinden in sectoren die slechte sectoren worden, kunt u niet correct toegang krijgen tot uw gegevens of bestanden. Zware bedrijfsomstandigheden (zoals hoge temperaturen, trillingen, enz.) kunnen ervoor zorgen dat harde schijven snel veel slechte sectoren ontwikkelen. Elk type harde schijf heeft de neiging om 'natuurlijk' slechte sectoren te ontwikkelen, maar dit is niet altijd het geval.
SCSI/SAS-omgeving
SCSI harde schijven worden vaak beschouwd als de krachtige schijven. Ze draaien sneller dan hun IDE/SATA-tegenhangers, en daarom zijn de snelheden voor gegevensoverdracht vaak hoger. Hierdoor zijn SCSI-schijven vaak te vinden in servers die veel datadoorvoer moeten leveren. Maar aan deze prestaties hangt vaak een prijskaartje, omdat de kans op mechanische storingen bij deze schijven groter is.
De meest voorkomende oorzaak van storingen in meerdere schijven in deze omgeving is een slechte signaalkwaliteit op de SCSI-bus. Een slechte signaalkwaliteit kan leiden tot overhead van het SCSI-protocol wanneer deze probeert te herstellen van deze problemen (time-outs en resets van de bus). Naarmate het systeem drukker wordt en de vraag naar data toeneemt, nemen de corrigerende maatregelen van het SCSI-protocol toe en komt de SCSI-bus dichter bij verzadiging. Deze overhead beperkt uiteindelijk de normale bandbreedtes voor apparaatcommunicatie. Als dit niet wordt gewist, kunnen een of meer SCSI-apparaten mogelijk niet tijdig reageren op de RAID-controller, waardoor de RAID-controller de harde schijf als offline markeert. Onjuiste installatie van de RAID-controller in een PCI-slot, slechte kabelverbindingen, slechte plaatsing van de schijven tegen de SCSI-backplane, onjuiste installatie of plaatsing van backplane-dochterkaarten en onjuiste SCSI-busafsluiting kunnen dit soort signaalproblemen veroorzaken.
Combinaties van deze storingstypen zijn ook mogelijk.
Alle technici en klanten dienen de best practices voor onderhoud te lezen en te begrijpen om de uptime te maximaliseren en dataverlies als gevolg van een defecte harde schijf te voorkomen.
Waarschuwingen voor PowerEdge schijfstoringen
Bij schijfstoringen in PowerEdge servers is het essentieel om de volgende voorzorgsmaatregelen te nemen:
- Back-updata: Maak altijd een back-up van kritieke data voordat u actie onderneemt op de schijven. Dit zorgt voor veiligheid van gegevens als er verdere problemen zijn.
- Waarschuwingen controleren: Let op voorspellende waarschuwingen voor schijfstoringen (foutcode
PDR6) en andere schijfgerelateerde foutcodes (zoalsPDR1001alsPDR3). Deze waarschuwingen geven mogelijke problemen aan die onmiddellijk aandacht nodig hebben. - Firmware-updates: Voordat u hardware vervangt, moet u ervoor zorgen dat de firmware voor de RAID-controller en -schijven is bijgewerkt. Dit kan helpen valse waarschuwingen te voorkomen en de algehele stabiliteit van het systeem te verbeteren.
- Ga voorzichtig met schijven om: Vermijd overmatig geweld bij het verwijderen, installeren of plaatsen van harde schijven. Dit kan de backplane buigen en er mogelijk toe leiden dat naburige schijven uitvallen of de connectiviteit verliezen.
- Controleer de aansluitingen: Als een schijf als defect wordt gemeld, plaatst u de schijf opnieuw om verbindingsproblemen uit te sluiten. Controleer of alle verbindingen veilig zijn.
- Controleer systeemlogboeken: Controleer regelmatig de iDRAC- en systeemlogboeken op gerelateerde waarschuwingen of thermische gebeurtenissen die op onderliggende problemen kunnen wijzen.
- Contact opnemen met de ondersteuning: Als meerdere schijven fouten melden of als er problemen blijven optreden na het uitvoeren van de bovenstaande acties, neemt u contact op met Dell Support voor verdere hulp.