PowerEdge: Dlaczego dyski twarde ulegają awarii
Summary: W tym artykule szczegółowo opisano różne przyczyny awarii dysków twardych.
Instructions
Spis treści
- Uszkodzenie oprogramowania wewnętrznego i strefy oprogramowania wewnętrznego
- Awaria elektroniczna
- Awaria mechaniczna
- Błąd logiczny
- Błędy nośnika
- Środowisko SCSI/SAS
Uszkodzenie oprogramowania wewnętrznego i strefy oprogramowania wewnętrznego
Gdy oprogramowanie wewnętrzne dysku twardego zostanie uszkodzone lub stanie się nieczytelne, komputer często nie jest w stanie prawidłowo współdziałać z dyskiem twardym
Awaria elektroniczna
Awaria elektroniczna zwykle dotyczy problemów na płycie kontrolera dysku twardego. Na serwerze może dojść do skoku napięcia lub przepięcia, które spowoduje wybicie płyty kontrolera na dysku twardym, czyniąc ją niewykrywalną dla systemu BIOS kontrolera.
Awaria mechaniczna
Awaria mechaniczna często (zwłaszcza w przypadku braku wczesnej reakcji) może prowadzić do częściowej, a czasem całkowitej utraty danych. Awaria mechaniczna występuje pod różnymi postaciami, takimi jak awaria głowicy odczytu/zapisu i problemy z silnikiem. Jedną z najczęstszych awarii mechanicznych jest uszkodzenie głowicy. Uszkodzenie głowicy o różnym nasileniu występuje, gdy głowice odczytu/zapisu dysku twardego stykają się, chwilowo lub w sposób ciągły, z tackami dysku twardego.
Uszkodzenia głowic mogą być spowodowane różnymi przyczynami, w tym wstrząsami fizycznymi (takimi jak upuszczenie dysku na podłogę), ruchem komputera, ładunkami elektrostatycznymi, skokami napięcia i awarią mechanicznej głowicy odczytu/zapisu.
Błąd logiczny
Często są to najłatwiejsze i najtrudniejsze do rozwiązania problemy, błędy logiczne mogą obejmować zarówno proste rzeczy, takie jak nieprawidłowy wpis w tabeli alokacji plików, jak i naprawdę krytyczne problemy, takie jak uszkodzenie i utrata systemu plików na poważnie pofragmentowanym dysku.
Błędy logiczne różnią się od powyższych problemów elektrycznych i mechanicznych, ponieważ zwykle nie ma „fizycznego” uszkodzenia dysku, poza uszkodzeniem bitów informacyjnych.
Błędy nośnika
Uszkodzone sektory to obszary dysku twardego, które stają się nieczytelne. Na każdym dysku twardym w końcu pojawią się uszkodzone sektory. Uszkodzone sektory są oznaczane przez dysk twardy i nie są już używane, ale w przypadku, gdy dane znajdują się w sektorach, które stają się uszkodzonymi sektorami, nie można uzyskać dostępu do danych lub plików. Trudne warunki pracy (takie jak wysokie temperatury, drgania itp.) mogą spowodować szybkie utworzenie uszkodzonych sektorów na dyskach twardych. Każdy typ dysku twardego jest „naturalnie” podatny na tworzenie uszkodzonych sektorów, ale nie zawsze tak jest.
Środowisko SCSI/SAS
Dyski twarde SCSI są często uważane za dyski o wysokiej wydajności. Obracają się szybciej niż ich odpowiedniki IDE/SATA, dlatego prędkość transferu danych jest często większa. Z tego powodu dyski SCSI często znajdują się na serwerach, które muszą zapewniać dużą przepustowość danych. Jednak ta wydajność często ma swoją cenę, ponieważ w tych dyskach częściej występują awarie mechaniczne.
Najczęstszą przyczyną awarii wielu dysków w tym środowisku jest niska jakość sygnału magistrali SCSI. Niska jakość sygnału powoduje obciążenie protokołu SCSI, gdy próbuje on odzyskać sprawność po tych problemach (przekroczenie limitu czasu i resetowanie magistrali). W miarę, jak system staje się coraz bardziej obciążony i wzrasta zapotrzebowanie na dane, działania naprawcze protokołu SCSI nasilają się, a magistrala SCSI zbliża się do nasycenia. To obciążenie ostatecznie ogranicza normalną przepustowość komunikacyjną urządzenia, a jeśli nie zostanie usunięte, jedno lub więcej urządzeń SCSI może nie być w stanie odpowiedzieć kontrolerowi RAID w odpowiednim czasie, co spowoduje, że kontroler RAID oznaczy dysk twardy jako offline. Tego typu problemy z sygnałem mogą być spowodowane nieprawidłową instalacją kontrolera RAID w gnieździe PCI, nieprawidłowymi połączeniami, nieprawidłowym osadzeniem dysków na płycie backplane SCSI, nieprawidłową instalacją lub osadzeniem kart towarzyszących płyty backplane oraz nieprawidłowym zakończeniem magistrali SCSI.
Możliwe są również różne kombinacje tych typów awarii.
Wszyscy technicy i klienci powinni przeczytać i opanować najlepsze praktyki w zakresie konserwacji, aby zmaksymalizować czas pracy bez przestojów i zapobiec utracie danych w wyniku awarii dysku twardego.