Avamar: Gen4S-hardware: Sådan adresseres forskellige diskhændelser og fejl
Summary: Denne artikel omhandler mange af de almindelige diskrelaterede fejl, der rapporteres på en Gen4S-node, sammen med de påkrævede handlinger.
Symptoms
Hændelser, der ligner følgende hændelser, observeres i brugergrænsefladen eller logfilerne:
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Information unit CRC error detected, CDB = 0x28 0x00 0xb6 0x77 0xc3 0x07 0x00 0x01 0xd0 0x00, Sense = 0x70 0x00 0x0b 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x47 0x03 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Unrecovered read error, CDB = 0x28 0x00 0xd2 0x91 0xe0 0xf7 0x00 0x00 0x40 0x00, Sense = 0xf0 0x00 0x03 0xd2 0x91 0xe0 0xf7 0x0a 0x00 0x00 0x00 0x00 0x11 0x00 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Hardware impending failure general hard drive failure, CDB = 0x03 0x00 0x00 0x00 0x40 0x00, Sense = 0x70 0x00 0x00 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x5d 0x10 0x00 0x00 0x00 0x00
Controller ID: 0 PD Reset: PD = Port 0 - 3:2:n, Error = 3, Path = 0x5001234567890
Controller ID: 0 Unexpected sense: PD = -:-:n Recovered data - recommended rewrite, CDB = 0x2f 0x00 0x01 0x09 0x80 0x00 0x00 0x10 0x00 0x00, Sense = 0xf0 0x00 0x01 0x01 0x09 0x8f 0xed 0x18 0x00 0x00 0x00 0x00 0x18 0x06 0x00 0x80 0x09 0x19
Controller ID: 0 Command timeout on PD: PD = Port 0 - 3:2:n No additional sense information, CDB = 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff, Sense = , Path = 0x5001234567890
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Logical block address out of range, CDB = 0x2a 0x00 0xac 0x64 0xcd 0xe6 0x00 0x00 0x08 0x00, Sense = 0xf0 0x00 0x05 0xac 0x64 0xcd 0xe6 0x0a 0x00 0x00 0x00 0x00 0x21 0x00 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Power on, reset, or bus device reset occurred, CDB = 0x2a 0x00 0x41 0xab 0x7a 0x00 0x00 0x00 0x80 0x00, Sense = 0x70 0x00 0x06 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00
Controller ID: 0 PD Predictive failure: Port 0 - 3:2:n
-
- 3:2:0 - 3:2:11 eller -:-:0 - -:-:11 er de interne standarddiske
- 3:2:12 eller -:-:12 er den interne SSD-disk.
Cause
Se afsnittet om løsning for årsager og handlinger.
Resolution
1. Log på Avamar Utility-noden som administrator.
2. Opgrader til rodrettigheder.
3. Indlæs rodnøglerne pr. Artikel Avamar: Sådan logger du på en Avamar-server og indlæser forskellige nøgler.
4. Brug oplysningerne fra UI-hændelsen eller Dial-Home-serviceanmodningen til at bestemme den node, der producerede fejlmeddelelsen.
5. Opret forbindelse til noden som root ved hjælp af kommandoen nedenfor:
ssn 0.# --user=root
(Hvor 0.# er det fysiske nodenummer)
6. På den berørte node:
en. Kontroller diskenes aktuelle status:
avsysreport pdisk
b. Gennemgå /var/log/messages fil for hændelser, der vedrører den disk, der rapporterer hændelsen.
Påkrævede handlinger baseret på loggede hændelser:
- For tilfælde "Gendannede data - anbefalet omskrivning":
- Hvis disken ikke rapporterede andre hændelser, kan dette ignoreres sikkert
- Hvis der er andre hændelser som f.eks. "Læsefejl uden gendannelse", skal du kontakte Dell Technologies for at finde ud af, om disken skal udskiftes proaktivt.
- For hændelsen "Logisk blokadresse uden for området":
- Hvis disken ikke rapporterede andre hændelser, kan dette ignoreres sikkert
- Hvis der er andre hændelser som f.eks. "Læsefejl uden gendannelse", skal du kontakte Dell Technologies for at finde ud af, om disken skal udskiftes proaktivt.
- For hændelsen "Ugendannet læsefejl":
- Hvis hændelsen gentages mere end tre gange på en enkelt disk, kan der være et integritetsproblem med den pågældende disk. Kontakt Dell Technologies for at finde ud af, om disken skal udskiftes proaktivt.
- For hændelsen "Informationsenhedens CRC-fejl registreret":
- Hvis disken, der rapporterer hændelsen, er 3:2:12, betyder det, at SSD'en fejler. Kontakt Dell Technologies for at udskifte noden ved hjælp af nodetransplantationsproceduren.
- Hvis disken, der rapporterer hændelsen, er 3:2:0-3:2:11, betyder det, at der er et problem med harddisken. Kontakt Dell Technologies for at udskifte disken proaktivt.
- For hændelsen "Hardware forestående fejl generel harddiskfejl":
-
- Hvis disken, der rapporterer hændelsen, er 3:2:12, er SSD'en defekt (eller mislykket). Kontakt Dell Technologies for at udskifte noden ved hjælp af nodetransplantationsproceduren.
- Hvis disken, der rapporterer hændelsen, er 3:2:0-3:2:11, er harddisken defekt (eller mislykket). Kontakt Dell Technologies for at udskifte disken proaktivt.
- For begivenheden "Forudsigelig fejl:
- Hvis disken, der rapporterer hændelsen, er 3:2:12, rapporterede SSD'et en advarsel om forudsigende fejl via SMART-funktionen og angiver, at SSD'et fejler. Kontakt Dell Technologies for at udskifte noden ved hjælp af nodetransplantationsproceduren.
- Hvis disken, der rapporterer hændelsen, er 3:2:0-3:2:11, har harddisken rapporteret en advarsel om forudsigende fejl via SMART-funktionen og angiver, at harddisken fejler. Kontakt Dell Technologies for at udskifte disken proaktivt.
- For hændelsen "Tænd, nulstil eller nulstilling af busenhed fandt sted":
- Gennemse
/var/log/messagesfor at kontrollere, om fejlen rapporteres af en enkelt disk eller flere diske.- Hvis en enkelt disk rapporterer fejlen, kan de være relateret til de ugentlige konsistenskontroller. Kontakt Dell Technologies for at finde ud af, om disken skal udskiftes proaktivt.
- Hvis flere diske rapporterer fejlen, er udvidelsesfirmwaren forældet, eller kabinettet er i defekt eller svigtende tilstand. Kontakt Dell Technologies for at gennemgå firmwareniveauerne eller udskifte noden ved hjælp af nodetransplantationsproceduren.
- Gennemse
- For begivenheden "PD Reset":
- Gennemse
/var/log/messagesfor at kontrollere, om fejlen rapporteres af en enkelt disk eller flere diske.- Hvis disken er blevet udskiftet for nylig, forventes denne meddelelse, og den kan ignoreres.
- Hvis drevet ikke er blevet udskiftet og genopbygget af sig selv, kan drevet svigte eller fejle. Kontakt Dell Technologies for at udskifte disken proaktivt.
- Gennemse
- For hændelserne "Command timeout on PD" eller enhver anden fejl, der ikke allerede er nævnt, skal du kontakte Dell Technologies for at fastlægge det næste handlingsforløb.