Jak radzić sobie z przebiciami (uszkodzonymi blokami) na dyskach wirtualnych serwerów PowerEdge

Resumen: Instrukcje rozwiązywania problemów dotyczących (przebicia) uszkodzonych bloków na dyskach twardych w serwerach PowerEdge z kontrolerami PERC. W szczególności w przypadku braku możliwości utworzenia kopii zapasowych poniższe informacje mogą przyczynić się do przywrócenia optymalnego stanu dysku wirtualnego. ...

Este artículo se aplica a Este artículo no se aplica a Este artículo no está vinculado a ningún producto específico. No se identifican todas las versiones del producto en este artículo.

Consulte estos recursos

Síntomas

Causa

Resolución

Ten artykuł zawiera instrukcje rozwiązywania problemów dotyczących (przebicia) uszkodzonych bloków na dyskach twardych w serwerach PowerEdge z kontrolerami PERC. W szczególności w przypadku braku możliwości utworzenia kopii zapasowych poniższe informacje mogą przyczynić się do przywrócenia optymalnego stanu dysku wirtualnego.

1. Opisy usterek

Usterka nr 1:

Oprogramowanie OpenManage Server Administrator (OMSA) wyświetla czerwony krzyżyk przy dysku wirtualnym (Rysunek 1).

SLN111146_en_US__11343098652871.1
Rysunek 1: Dysk wirtualny z czerwonym krzyżykiem w stanie (przykład H800)

Uwaga: Narzędzie Dell OpenManage Server Administrator (OMSA) zapewnia kompletne rozwiązanie do zarządzania systemami. Narzędzie OMSA można podzielić na dwie aplikacje:
- Zintegrowana — graficzny interfejs użytkownika oparty na przeglądarce internetowej (GUI)
- Wiersz poleceń (CLI) — z poziomu systemu operacyjnego

Usterka nr 2:

Dziennik systemu Windows zawiera błędy dotyczące uszkodzonych bloków (Rysunek 2).

SLN111146_en_US__31343098674763.2
Rysunek 2: Wyświetlony komunikat o błędzie dotyczącym uszkodzonych bloków w dzienniku systemu Windows

Usterka nr 3:

Dziennik kontrolera RAID (TTYLOG) zawiera błędy takie jak:

02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f

Ostrzeżenie: dziennik kontrolera (TTYLOG) może nie zawierać błędów.

Więcej informacji na temat otrzymywania tych dzienników znajduje się w artykule o zbieraniu dzienników.

2. Co jest przyczyną problemu:

Macierze RAID nie są odporne na błędy danych. Oprogramowanie wewnętrzne kontrolera RAID i dysków twardych zawiera funkcje wykrywania i naprawy wielu typów błędów danych, zanim zostaną one zapisane na macierzy/napędzie. Korzystanie z przestarzałego oprogramowania wewnętrznego może spowodować zapisywanie nieprawidłowych danych na macierzy/dysku, ponieważ brakuje mu funkcji obsługi błędów / korekcji błędów dostępnych w najnowszych wersjach oprogramowania wewnętrznego.
Błędy danych mogą być również spowodowane przez fizyczne uszkodzone bloki. Może to na przykład wystąpić w przypadku, gdy głowica odczytu/zapisu uderzy w obracające się talerze (sytuacja ta jest określana jako „zderzenie czołowe”). Bloki mogą także ulec uszkodzeniu na skutek utraty przez talerze zdolności do magnetycznego zapisywania bitów w określonej lokalizacji. Uszkodzone bloki spowodowane degradacją talerzy można często z powodzeniem odczytać. Taki uszkodzony blok może zostać rozpoznany tylko sporadycznie lub przy użyciu rozszerzonej diagnostyki dysków.

Uszkodzenie bloku znane jest też pod nazwą nieprawidłowego adresu bloku logicznego (LBA) i może być spowodowane przez logiczne błędy danych. Dzieje się tak w przypadku nieprawidłowego zapisania danych na dysku, które zostało zgłoszone jako prawidłowe. Dane zapisane prawidłowo na dysku mogą również zostać przypadkowo zmienione. Przykładem może być „odwrócenie bitu”, które może wystąpić, gdy głowica odczytu/zapisu przechodzi nad lub zapisuje dane w pobliskiej pozycji i powoduje zmianę zapisu danych w postaci zer i jedynek na inną wartość. Taki stan powoduje utracenie „spójności” danych. Wartość danych w określonym bloku jest inna niż oryginalne dane i nie jest już zgodna z sumą kontrolną dla tych danych. Fizyczny adres LBA jest w dobrym stanie i można na nim pomyślnie dokonywać zapisów, ale obecnie zawiera nieprawidłowe dane i może być interpretowany jako uszkodzony blok.

Więcej informacji można znaleźć w artykule Podwójne błędy i przebicia w macierzach RAID.

3. Kroki niezbędne do rozwiązania problemu:

Uwaga: bieżące dane na dysku wirtualnym są uszkodzone i będą musiały zostać usunięte.

Utwórz zweryfikowaną kopię zapasową danych na poziomie plików
- Kopia zapasowa oparta na blokach spowoduje przeniesienie problemu
- Kopia zapasowa na poziomie plików wskazuje uszkodzone pliki (tworzenie kopii zapasowej tych plików nie powiedzie się)
- Nie ma 100% gwarancji zachowania wszystkich danych, jeśli istnieje już pasek przebicia
Upewnij się, że wszystkie uszkodzone dyski, które wykazują stan przewidywanej awarii, zostaną wymienione
Usuń i utwórz ponownie dysk wirtualny
- Ten krok spowoduje usunięcie wszystkich danych z dysku wirtualnego
- Usuń macierz
- Odtwórz macierz w wymagany sposób
Wykonaj pełną inicjalizację dysku wirtualnego
- Upewnij się, że nie wybrano szybkiej inicjalizacji
- Tylko pełna (= powolna) inicjalizacja rozwiązuje problem
Wykonaj sprawdzanie spójności na nowym utworzonym dysku wirtualnym
- Jeśli sprawdzanie spójności nie wykaże błędów, macierz jest sprawna i przebicie zostało usunięte
Można przywrócić dane na sprawny dysk wirtualny
Zalecenie: zaktualizuj oprogramowanie wewnętrzne wszystkich dysków twardych do najnowszej wersji

4. Informacje dodatkowe

Oprogramowanie OMSA zapewnia możliwość wyczyszczenia ostrzeżeń o uszkodzonych blokach. Aby usunąć uszkodzone bloki, zaleca się wykonanie następującej procedury:

Podczas wykonywania kopii zapasowej dysku wirtualnego z wybraną opcją Verify (Weryfikuj) mogą wystąpić dwa scenariusze:
- Operacja tworzenia kopii zapasowej nie powiedzie się w przypadku jednego lub więcej plików. W takim przypadku przywróć plik z poprzedniej kopii zapasowej. Po przywróceniu pliku przejdź do następnego kroku.
- Operacja tworzenia kopii zapasowych zakończy się bez błędów. Oznacza to, że nie ma uszkodzonych bloków na zapisywanej części dysku wirtualnego.
Uwaga: jeśli nadal otrzymujesz ostrzeżenia o nieprawidłowych blokach, takie bloki znajdują się w obszarze bez danych.
Uruchom funkcję Patrol Read (w obszarze Virtual Disk Tasks w oprogramowaniu OMSA) i sprawdź dziennik zdarzeń systemowych, aby upewnić się, że nie znaleziono żadnych nowych uszkodzonych bloków. Jeśli nadal istnieją uszkodzone bloki, przejdź do następnego kroku. Jeśli nie, warunek został usunięty.

Uwaga: automatyczna funkcja Patrol Read musi zostać dezaktywowana, zanim opcja ręcznego uruchomienia tego działania zostanie wyświetlona w oprogramowaniu OMSA.
Aby usunąć te uszkodzone bloki, wykonaj zadanie Clear Virtual Disk Bad Blocks (Wyczyść uszkodzone bloki dysku wirtualnego). Można to zrobić w graficznym interfejsie użytkownika oprogramowania OMSA lub użyć polecenia CLI:
omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id

Uwaga: aby uzyskać wartości identyfikatora kontrolera i identyfikatora dysku wirtualnego, wpisz omreport storage controller, aby wyświetlić identyfikatory kontrolera, a następnie wpisz omreport storage vdisk controller=ID, aby wyświetlić identyfikatory dysków wirtualnych.

Productos afectados

Servers

Número del artículo: 000139277

Tipo de artículo: Solution

Última modificación: 01 oct 2021

Versión: 3

Compruebe si el dispositivo está cubierto por los servicios de soporte.

Jak radzić sobie z przebiciami (uszkodzonymi blokami) na dyskach wirtualnych serwerów PowerEdge

Síntomas

Causa

Resolución

Spis treści:

1. Opisy usterek

Usterka nr 1:

Usterka nr 2:

Usterka nr 3:

2. Co jest przyczyną problemu:

3. Kroki niezbędne do rozwiązania problemu:

4. Informacje dodatkowe

Productos afectados

Propiedades del artículo

Encuentre respuestas a sus preguntas de otros usuarios de Dell

Servicios de soporte

Propiedades del artículo

Encuentre respuestas a sus preguntas de otros usuarios de Dell

Servicios de soporte

Bienvenido

Bienvenido a Dell

Jak radzić sobie z przebiciami (uszkodzonymi blokami) na dyskach wirtualnych serwerów PowerEdge

Artículo detallado

Síntomas

Causa

Resolución

Productos afectados

Síntomas

Causa

Resolución

Spis treści:

1. Opisy usterek

Usterka nr 1:

Usterka nr 2:

Usterka nr 3:

2. Co jest przyczyną problemu:

3. Kroki niezbędne do rozwiązania problemu:

4. Informacje dodatkowe

Productos afectados

Propiedades del artículo

Encuentre respuestas a sus preguntas de otros usuarios de Dell

Servicios de soporte

Propiedades del artículo

Encuentre respuestas a sus preguntas de otros usuarios de Dell

Servicios de soporte