Avamar: Hardware Gen4S: Jak řešit různé události a chyby na disku
Summary: Tento článek se zabývá mnoha běžnými chybami souvisejícími s diskem hlášenými na uzlu Gen4S spolu s požadovanými akcemi.
Symptoms
V uživatelském rozhraní nebo souborech protokolu jsou pozorovány události podobné následujícím událostem:
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Information unit CRC error detected, CDB = 0x28 0x00 0xb6 0x77 0xc3 0x07 0x00 0x01 0xd0 0x00, Sense = 0x70 0x00 0x0b 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x47 0x03 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Unrecovered read error, CDB = 0x28 0x00 0xd2 0x91 0xe0 0xf7 0x00 0x00 0x40 0x00, Sense = 0xf0 0x00 0x03 0xd2 0x91 0xe0 0xf7 0x0a 0x00 0x00 0x00 0x00 0x11 0x00 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Hardware impending failure general hard drive failure, CDB = 0x03 0x00 0x00 0x00 0x40 0x00, Sense = 0x70 0x00 0x00 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x5d 0x10 0x00 0x00 0x00 0x00
Controller ID: 0 PD Reset: PD = Port 0 - 3:2:n, Error = 3, Path = 0x5001234567890
Controller ID: 0 Unexpected sense: PD = -:-:n Recovered data - recommended rewrite, CDB = 0x2f 0x00 0x01 0x09 0x80 0x00 0x00 0x10 0x00 0x00, Sense = 0xf0 0x00 0x01 0x01 0x09 0x8f 0xed 0x18 0x00 0x00 0x00 0x00 0x18 0x06 0x00 0x80 0x09 0x19
Controller ID: 0 Command timeout on PD: PD = Port 0 - 3:2:n No additional sense information, CDB = 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff, Sense = , Path = 0x5001234567890
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Logical block address out of range, CDB = 0x2a 0x00 0xac 0x64 0xcd 0xe6 0x00 0x00 0x08 0x00, Sense = 0xf0 0x00 0x05 0xac 0x64 0xcd 0xe6 0x0a 0x00 0x00 0x00 0x00 0x21 0x00 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Power on, reset, or bus device reset occurred, CDB = 0x2a 0x00 0x41 0xab 0x7a 0x00 0x00 0x00 0x80 0x00, Sense = 0x70 0x00 0x06 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00
Controller ID: 0 PD Predictive failure: Port 0 - 3:2:n
-
- 3:2:0 - 3:2:11 nebo -:-:0 - -:-:11 jsou interní standardní disky
- 3:2:12 nebo -:-:12 je interní disk SSD.
Cause
Příčiny a akce naleznete v části Řešení.
Resolution
1. Přihlaste se k uzlu nástroje Avamar jako správce.
2. Zvýšení oprávnění na uživatele root.
3. Načtení kořenových klíčů na článek Avamar: Jak se přihlásit k serveru Avamar a načíst různé klíče
4. Pomocí informací z události uživatelského rozhraní nebo servisního požadavku Dial Home určete uzel, který chybovou zprávu vytvořil.
5. Připojte se k uzlu jako uživatel root pomocí následujícího příkazu:
ssn 0.# --user=root
(kde 0.# je číslo fyzického uzlu)
6. Na dotčeném uzlu:
a. Zkontrolujte aktuální stav disků:
avsysreport pdisk
b. Projděte si /var/log/messages soubor pro události související s diskem, který událost hlásí.
Požadované akce na základě zaznamenaných událostí:
- Pro událost "Obnovená data – doporučené přepsání":
- Pokud disk nehlásil žádné další události, můžete to bezpečně ignorovat
- Pokud dojde k dalším událostem, jako je například chyba "Unrestored Read Error", obraťte se na společnost Dell Technologies a zjistěte, zda je nutné disk proaktivně vyměnit.
- Pro událost "Logical block address out of range":
- Pokud disk nehlásil žádné další události, můžete to bezpečně ignorovat
- Pokud dojde k dalším událostem, jako je například chyba "Unrestored Read Error", obraťte se na společnost Dell Technologies a zjistěte, zda je nutné disk proaktivně vyměnit.
- V případě události "Neobnovená chyba čtení":
- Pokud se událost na jednom disku opakuje více než třikrát , může mít daný disk problém s integritou. Kontaktujte společnost Dell Technologies a zjistěte, zda je nutné disk proaktivně vyměnit.
- V případě události "Zjištěna chyba CRC informační jednotky":
- Pokud disk hlásící událost má hodnotu 3:2:12, znamená to, že disk SSD selhává. Kontaktujte společnost Dell Technologies a vyměňte uzel pomocí postupu transplantace uzlu.
- Pokud disk hlásící událost je 3:2:0-3:2:11, znamená to, že pevný disk selhává. Kontaktujte společnost Dell Technologies a požádejte ji o proaktivní výměnu.
- Pro případ "Hardware impending failure general hard drive failure":
-
- Pokud je disk hlásící událost v poměru 3:2:12, disk SSD selhává (nebo selhal). Kontaktujte společnost Dell Technologies a vyměňte uzel pomocí postupu transplantace uzlu.
- Pokud disk hlásící událost je 3:2:0-3:2:11, pevný disk selhává (nebo selhal). Kontaktujte společnost Dell Technologies a požádejte ji o proaktivní výměnu.
- V případě události "Prediktivní selhání:
- Pokud je disk hlásící událost v poměru 3:2:12, disk SSD ohlásil upozornění na prediktivní poruchu prostřednictvím funkce SMART a signalizuje, že disk SSD selhává. Kontaktujte společnost Dell Technologies a vyměňte uzel pomocí postupu transplantace uzlu.
- Pokud disk hlásící událost je 3:2:0-3:2:11, pevný disk ohlásil upozornění na prediktivní selhání prostřednictvím funkce SMART a indikuje, že pevný disk selhává. Kontaktujte společnost Dell Technologies a požádejte ji o proaktivní výměnu.
- V případě události "Power on, reset, or bus device reset occurred":
- Zkontrolujte
/var/log/messageszkontrolujte, zda chybu hlásí jeden nebo více disků.- Pokud chybu hlásí jeden disk, může to souviset s týdenními kontrolami konzistence. Kontaktujte společnost Dell Technologies a zjistěte, zda je nutné disk proaktivně vyměnit.
- Pokud chybu hlásí více disků, je firmware expandéru zastaralý nebo je šasi ve stavu selhání či selhání. Kontaktujte společnost Dell Technologies a požádejte ji o kontrolu úrovní firmwaru nebo výměnu uzlu pomocí postupu transplantace uzlu.
- Zkontrolujte
- Pro událost "PD Reset":
- Zkontrolujte
/var/log/messageszkontrolujte, zda chybu hlásí jeden nebo více disků.- Pokud byl disk v nedávné době vyměněn, je tato zpráva očekávána a lze ji ignorovat.
- Pokud nebyl disk vyměněn a znovu sestaven samostatně, může selhat nebo selhat. Kontaktujte společnost Dell Technologies a požádejte ji o proaktivní výměnu.
- Zkontrolujte
- V případě události "Command timeout on PD" nebo jakékoli jiné chyby, která ještě není uvedena, kontaktujte společnost Dell Technologies a určete další postup.