Avamar: Sprzęt Gen4S: Rozwiązywanie różnych zdarzeń i błędów na dysku
Summary: Ten artykuł dotyczy wielu typowych błędów związanych z dyskiem zgłoszonych w węźle Gen4S wraz z wymaganymi akcjami.
Symptoms
W interfejsie użytkownika lub plikach dziennika występują zdarzenia podobne do następujących:
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Information unit CRC error detected, CDB = 0x28 0x00 0xb6 0x77 0xc3 0x07 0x00 0x01 0xd0 0x00, Sense = 0x70 0x00 0x0b 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x47 0x03 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Unrecovered read error, CDB = 0x28 0x00 0xd2 0x91 0xe0 0xf7 0x00 0x00 0x40 0x00, Sense = 0xf0 0x00 0x03 0xd2 0x91 0xe0 0xf7 0x0a 0x00 0x00 0x00 0x00 0x11 0x00 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Hardware impending failure general hard drive failure, CDB = 0x03 0x00 0x00 0x00 0x40 0x00, Sense = 0x70 0x00 0x00 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x5d 0x10 0x00 0x00 0x00 0x00
Controller ID: 0 PD Reset: PD = Port 0 - 3:2:n, Error = 3, Path = 0x5001234567890
Controller ID: 0 Unexpected sense: PD = -:-:n Recovered data - recommended rewrite, CDB = 0x2f 0x00 0x01 0x09 0x80 0x00 0x00 0x10 0x00 0x00, Sense = 0xf0 0x00 0x01 0x01 0x09 0x8f 0xed 0x18 0x00 0x00 0x00 0x00 0x18 0x06 0x00 0x80 0x09 0x19
Controller ID: 0 Command timeout on PD: PD = Port 0 - 3:2:n No additional sense information, CDB = 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff, Sense = , Path = 0x5001234567890
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Logical block address out of range, CDB = 0x2a 0x00 0xac 0x64 0xcd 0xe6 0x00 0x00 0x08 0x00, Sense = 0xf0 0x00 0x05 0xac 0x64 0xcd 0xe6 0x0a 0x00 0x00 0x00 0x00 0x21 0x00 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Power on, reset, or bus device reset occurred, CDB = 0x2a 0x00 0x41 0xab 0x7a 0x00 0x00 0x00 0x80 0x00, Sense = 0x70 0x00 0x06 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00
Controller ID: 0 PD Predictive failure: Port 0 - 3:2:n
-
- 3:2:0 - 3:2:11 lub -:-:0 - -:-:11 to wewnętrzne dyski standardowe
- 3:2:12 lub -:-:12 to wewnętrzny dysk SSD.
Cause
Przyczyny i działania można znaleźć w sekcji dotyczącej rozwiązywania problemów.
Resolution
1. Zaloguj się do węzła Avamar Utility Node jako administrator.
2. Podnieś poziom uprawnień do uprawnień root.
3. Załaduj klucze główne według artykułu Avamar: Logowanie się na serwerze Avamar i ładowanie różnych kluczy.
4. Korzystając z informacji ze zdarzenia interfejsu użytkownika lub żądania serwisowego dial-home, określ węzeł, który wygenerował komunikat o błędzie.
5. Połącz się z węzłem jako użytkownik root, korzystając z poniższego polecenia:
ssn 0.# --user=root
(gdzie 0.# jest fizycznym numerem węzła)
6. W węźle, którego dotyczy problem:
a. Sprawdź bieżący stan dysków:
avsysreport pdisk
b. Zapoznaj się z /var/log/messages Plik dla zdarzeń związanych z dyskiem zgłaszającym zdarzenie.
Wymagane działania na podstawie zarejestrowanych zdarzeń:
- Dla zdarzenia "Odzyskane dane - zalecany przepis":
- Jeśli dysk nie zgłosił żadnych innych zdarzeń, można to bezpiecznie zignorować
- W przypadku wystąpienia innych zdarzeń, takich jak "Nieodzyskany błąd odczytu", należy skontaktować się z firmą Dell Technologies w celu ustalenia, czy dysk wymaga proaktywnej wymiany.
- W przypadku zdarzenia "Logical block address out of range":
- Jeśli dysk nie zgłosił żadnych innych zdarzeń, można to bezpiecznie zignorować
- W przypadku wystąpienia innych zdarzeń, takich jak "Nieodzyskany błąd odczytu", należy skontaktować się z firmą Dell Technologies w celu ustalenia, czy dysk wymaga proaktywnej wymiany.
- W przypadku zdarzenia "Unrecovered read error":
- Jeśli zdarzenie powtórzy się więcej niż trzy razy na jednym dysku, może to oznaczać problem z integralnością danego dysku. Skontaktuj się z firmą Dell Technologies , aby określić, czy dysk wymaga proaktywnej wymiany.
- W przypadku zdarzenia "Wykryto błąd CRC jednostki informacyjnej":
- Jeśli dysk zgłasza zdarzenie o czasie 3:2:12, oznacza to, że dysk SSD uległ awarii. Skontaktuj się z firmą Dell Technologies w celu wymiany węzła przy użyciu procedury przeszczepu węzła.
- Jeśli dysk zgłaszający zdarzenie ma wartość 3:2:0-3:2:11, oznacza to, że dysk twardy uległ awarii. Skontaktuj się z firmą Dell Technologies w celu proaktywnej wymiany dysku.
- W przypadku zdarzenia "Zbliżająca się awaria sprzętu, ogólna awaria dysku twardego":
-
- Jeśli dysk zgłaszający zdarzenie ma numer 3:2:12, oznacza to, że dysk SSD uległ awarii (lub uległ awarii). Skontaktuj się z firmą Dell Technologies w celu wymiany węzła przy użyciu procedury przeszczepu węzła.
- Jeśli dysk zgłaszający zdarzenie ma wartość 3:2:0-3:2:11, oznacza to, że dysk twardy uległ awarii (lub uległ awarii). Skontaktuj się z firmą Dell Technologies w celu proaktywnej wymiany dysku.
- W przypadku zdarzenia "Przewidywana awaria:
- Jeśli dysk zgłasza zdarzenie o czasie 3:2:12, dysk SSD zgłasza przestrogę dotyczącą awarii za pośrednictwem funkcji SMART i wskazuje, że dysk SSD uległ awarii. Skontaktuj się z firmą Dell Technologies w celu wymiany węzła przy użyciu procedury przeszczepu węzła.
- Jeśli dysk zgłasza zdarzenie w zakresie 3:2:0-3:2:11, dysk twardy zgłasza przestrogę dotyczącą przewidywanej awarii za pomocą funkcji SMART i wskazuje, że dysk twardy uległ awarii. Skontaktuj się z firmą Dell Technologies w celu proaktywnej wymiany dysku.
- W przypadku zdarzenia "Nastąpiło włączenie, zresetowanie lub zresetowanie urządzenia magistrali":
- Zapoznaj się z
/var/log/messages, aby sprawdzić, czy jeden dysk lub wiele dysków zgłasza błąd.- Jeśli pojedynczy dysk zgłasza błąd, może on być związany z cotygodniowymi kontrolami spójności. Skontaktuj się z firmą Dell Technologies , aby określić, czy dysk wymaga proaktywnej wymiany.
- Jeśli błąd jest zgłaszany przez wiele dysków, oprogramowanie wewnętrzne modułu rozszerzenia jest nieaktualne albo obudowa jest w stanie awarii lub awarii. Skontaktuj się z firmą Dell Technologies , aby dokonać przeglądu poziomów oprogramowania wewnętrznego lub wymienić węzeł zgodnie z procedurą przeszczepu węzła.
- Zapoznaj się z
- Dla zdarzenia "PD Reset":
- Zapoznaj się z
/var/log/messages, aby sprawdzić, czy jeden dysk lub wiele dysków zgłasza błąd.- Jeśli dysk został niedawno wymieniony, ten komunikat jest oczekiwany i można go zignorować.
- Jeśli dysk nie został wymieniony i odbudowany samodzielnie, może to oznaczać, że dysk uległ awarii lub uległ awarii. Skontaktuj się z firmą Dell Technologies w celu proaktywnej wymiany dysku.
- Zapoznaj się z
- W przypadku zdarzeń "Command timeout on PD" lub innego błędu, który nie został jeszcze wymieniony , należy skontaktować się z firmą Dell Technologies w celu ustalenia następnego sposobu działania.