Ten artykuł zawiera instrukcje rozwiązywania problemów dotyczących (przebicia) uszkodzonych bloków na dyskach twardych w serwerach PowerEdge z kontrolerami PERC. W szczególności w przypadku braku możliwości utworzenia kopii zapasowych poniższe informacje mogą przyczynić się do przywrócenia optymalnego stanu dysku wirtualnego.
Oprogramowanie OpenManage Server Administrator (OMSA) wyświetla czerwony krzyżyk przy dysku wirtualnym (Rysunek 1).
Rysunek 1: Dysk wirtualny z czerwonym krzyżykiem w stanie (przykład H800)
Dziennik systemu Windows zawiera błędy dotyczące uszkodzonych bloków (Rysunek 2).
Rysunek 2: Wyświetlony komunikat o błędzie dotyczącym uszkodzonych bloków w dzienniku systemu Windows
Dziennik kontrolera RAID (TTYLOG) zawiera błędy takie jak:
02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f
Więcej informacji na temat otrzymywania tych dzienników znajduje się w artykule o zbieraniu dzienników.
Macierze RAID nie są odporne na błędy danych. Oprogramowanie wewnętrzne kontrolera RAID i dysków twardych zawiera funkcje wykrywania i naprawy wielu typów błędów danych, zanim zostaną one zapisane na macierzy/napędzie. Korzystanie z przestarzałego oprogramowania wewnętrznego może spowodować zapisywanie nieprawidłowych danych na macierzy/dysku, ponieważ brakuje mu funkcji obsługi błędów / korekcji błędów dostępnych w najnowszych wersjach oprogramowania wewnętrznego.
Błędy danych mogą być również spowodowane przez fizyczne uszkodzone bloki. Może to na przykład wystąpić w przypadku, gdy głowica odczytu/zapisu uderzy w obracające się talerze (sytuacja ta jest określana jako „zderzenie czołowe”). Bloki mogą także ulec uszkodzeniu na skutek utraty przez talerze zdolności do magnetycznego zapisywania bitów w określonej lokalizacji. Uszkodzone bloki spowodowane degradacją talerzy można często z powodzeniem odczytać. Taki uszkodzony blok może zostać rozpoznany tylko sporadycznie lub przy użyciu rozszerzonej diagnostyki dysków.
Uszkodzenie bloku znane jest też pod nazwą nieprawidłowego adresu bloku logicznego (LBA) i może być spowodowane przez logiczne błędy danych. Dzieje się tak w przypadku nieprawidłowego zapisania danych na dysku, które zostało zgłoszone jako prawidłowe. Dane zapisane prawidłowo na dysku mogą również zostać przypadkowo zmienione. Przykładem może być „odwrócenie bitu”, które może wystąpić, gdy głowica odczytu/zapisu przechodzi nad lub zapisuje dane w pobliskiej pozycji i powoduje zmianę zapisu danych w postaci zer i jedynek na inną wartość. Taki stan powoduje utracenie „spójności” danych. Wartość danych w określonym bloku jest inna niż oryginalne dane i nie jest już zgodna z sumą kontrolną dla tych danych. Fizyczny adres LBA jest w dobrym stanie i można na nim pomyślnie dokonywać zapisów, ale obecnie zawiera nieprawidłowe dane i może być interpretowany jako uszkodzony blok.
Więcej informacji można znaleźć w artykule Podwójne błędy i przebicia w macierzach RAID.
Utwórz zweryfikowaną kopię zapasową danych na poziomie plików
Upewnij się, że wszystkie uszkodzone dyski, które wykazują stan przewidywanej awarii, zostaną wymienione
Usuń i utwórz ponownie dysk wirtualny
Wykonaj pełną inicjalizację dysku wirtualnego
Wykonaj sprawdzanie spójności na nowym utworzonym dysku wirtualnym
Można przywrócić dane na sprawny dysk wirtualny
Zalecenie: zaktualizuj oprogramowanie wewnętrzne wszystkich dysków twardych do najnowszej wersji
Oprogramowanie OMSA zapewnia możliwość wyczyszczenia ostrzeżeń o uszkodzonych blokach. Aby usunąć uszkodzone bloki, zaleca się wykonanie następującej procedury:
Podczas wykonywania kopii zapasowej dysku wirtualnego z wybraną opcją Verify (Weryfikuj) mogą wystąpić dwa scenariusze:
Uruchom funkcję Patrol Read (w obszarze Virtual Disk Tasks w oprogramowaniu OMSA) i sprawdź dziennik zdarzeń systemowych, aby upewnić się, że nie znaleziono żadnych nowych uszkodzonych bloków. Jeśli nadal istnieją uszkodzone bloki, przejdź do następnego kroku. Jeśli nie, warunek został usunięty.
Aby usunąć te uszkodzone bloki, wykonaj zadanie Clear Virtual Disk Bad Blocks (Wyczyść uszkodzone bloki dysku wirtualnego). Można to zrobić w graficznym interfejsie użytkownika oprogramowania OMSA lub użyć polecenia CLI:
omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id
omreport storage controller
, aby wyświetlić identyfikatory kontrolera, a następnie wpisz omreport storage vdisk controller=ID
, aby wyświetlić identyfikatory dysków wirtualnych.