Avamar: 4. generasjons maskinvare: Hvordan håndtere ulike diskhendelser og feil
Summary: Denne artikkelen tar for seg mange av de vanlige diskrelaterte feilene som rapporteres på en Gen4S-node, sammen med de nødvendige handlingene.
Symptoms
Hendelser som ligner på følgende hendelser, observeres i brukergrensesnittet eller loggfilene:
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Information unit CRC error detected, CDB = 0x28 0x00 0xb6 0x77 0xc3 0x07 0x00 0x01 0xd0 0x00, Sense = 0x70 0x00 0x0b 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x47 0x03 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Unrecovered read error, CDB = 0x28 0x00 0xd2 0x91 0xe0 0xf7 0x00 0x00 0x40 0x00, Sense = 0xf0 0x00 0x03 0xd2 0x91 0xe0 0xf7 0x0a 0x00 0x00 0x00 0x00 0x11 0x00 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Hardware impending failure general hard drive failure, CDB = 0x03 0x00 0x00 0x00 0x40 0x00, Sense = 0x70 0x00 0x00 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x5d 0x10 0x00 0x00 0x00 0x00
Controller ID: 0 PD Reset: PD = Port 0 - 3:2:n, Error = 3, Path = 0x5001234567890
Controller ID: 0 Unexpected sense: PD = -:-:n Recovered data - recommended rewrite, CDB = 0x2f 0x00 0x01 0x09 0x80 0x00 0x00 0x10 0x00 0x00, Sense = 0xf0 0x00 0x01 0x01 0x09 0x8f 0xed 0x18 0x00 0x00 0x00 0x00 0x18 0x06 0x00 0x80 0x09 0x19
Controller ID: 0 Command timeout on PD: PD = Port 0 - 3:2:n No additional sense information, CDB = 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff, Sense = , Path = 0x5001234567890
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Logical block address out of range, CDB = 0x2a 0x00 0xac 0x64 0xcd 0xe6 0x00 0x00 0x08 0x00, Sense = 0xf0 0x00 0x05 0xac 0x64 0xcd 0xe6 0x0a 0x00 0x00 0x00 0x00 0x21 0x00 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Power on, reset, or bus device reset occurred, CDB = 0x2a 0x00 0x41 0xab 0x7a 0x00 0x00 0x00 0x80 0x00, Sense = 0x70 0x00 0x06 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00
Controller ID: 0 PD Predictive failure: Port 0 - 3:2:n
-
- 3:2:0 - 3:2:11 eller -:-:0 - -:-:11 er de interne standarddiskene
- 3:2:12 eller -:-:12 er den interne SSD-disken.
Cause
Se løsningsdelen for årsaker og handlinger.
Resolution
1. Logg på Avamar-verktøynoden som administrator.
2. Hev til rotprivilegium.
3. Last inn rotnøklene per artikkel Avamar: Slik logger du på en Avamar-server og laster inn ulike nøkler.
4. Bruk informasjonen fra UI-hendelsen eller serviceforespørselen for oppringing til hjemmet, til å finne noden som produserte feilmeldingen.
5. Koble til noden som root ved hjelp av kommandoen nedenfor:
ssn 0.# --user=root
(Der 0.# er det fysiske nodenummeret)
6. På den berørte noden:
en. Kontroller gjeldende status for diskene:
avsysreport pdisk
b. Se gjennom /var/log/messages fil for hendelser knyttet til disken som rapporterer hendelsen.
Nødvendige handlinger basert på loggede hendelser:
- For hendelsen "Gjenopprettede data - anbefalt omskriving":
- Hvis disken ikke rapporterte noen andre hendelser, kan du trygt ignorere dette
- Hvis det oppstår andre hendelser, for eksempel "Ugjenopprettet lesefeil", kan du kontakte Dell EMC for å finne ut om disken må skiftes proaktivt.
- For hendelsen "Logisk blokkadresse utenfor rekkevidde":
- Hvis disken ikke rapporterte noen andre hendelser, kan du trygt ignorere dette
- Hvis det oppstår andre hendelser, for eksempel "Ugjenopprettet lesefeil", kan du kontakte Dell EMC for å finne ut om disken må skiftes proaktivt.
- For hendelsen "Ugjenopprettet lesefeil":
- Hvis hendelsen gjentas mer enn tre ganger på én enkelt disk, kan det hende at det er et integritetsproblem for den aktuelle disken. Kontakt Dell EMC for å finne ut om disken må skiftes ut proaktivt.
- For hendelsen "Informasjonsenhet CRC-feil oppdaget":
- Hvis disken som rapporterer hendelsen er 3:2:12, indikerer det at SSD er feil. Kontakt Dell Technologies for å skifte ut noden ved hjelp av nodetransplantasjonsprosedyren.
- Hvis disken som rapporterer hendelsen er 3:2:0-3:2:11, indikerer det at harddisken er defekt. Ta kontakt med Dell EMC for å bytte ut disken proaktivt.
- For hendelsen "Maskinvare forestående feil generell harddiskfeil":
-
- Hvis disken som rapporterer hendelsen, er 3:2:12, er SSD-disken defekt (eller har sviktet). Kontakt Dell Technologies for å skifte ut noden ved hjelp av nodetransplantasjonsprosedyren.
- Hvis disken som rapporterer hendelsen er 3:2:0-3:2:11, er harddisken defekt (eller har sviktet). Ta kontakt med Dell EMC for å bytte ut disken proaktivt.
- For hendelsen "Prediktiv feil:
- Hvis disken som rapporterer hendelsen er 3:2:12, rapporterte SSD en prediktiv feiladvarsel gjennom SMART-funksjonen, og indikerer at SSD svikter. Kontakt Dell Technologies for å skifte ut noden ved hjelp av nodetransplantasjonsprosedyren.
- Hvis disken som rapporterer hendelsen er 3:2:0-3:2:11, rapporterte harddisken en prediktiv feiladvarsel gjennom SMART-funksjonen, og indikerer at harddisken svikter. Ta kontakt med Dell EMC for å bytte ut disken proaktivt.
- For hendelsen "Strøm på, tilbakestilling eller tilbakestilling av bussenhet oppstod":
- Se
/var/log/messagesfor å sjekke om en enkelt disk eller flere disker rapporterer feilen.- Hvis en enkelt disk rapporterer feilen, kan de være relatert til de ukentlige konsekvenskontrollene. Kontakt Dell EMC for å finne ut om disken må skiftes ut proaktivt.
- Hvis flere disker rapporterer feilen, er fastvaren for utvidelse utdatert, eller kabinettet er i feil eller sviktende tilstand. Kontakt Dell EMC for å gjennomgå fastvarenivåene, eller skift ut noden ved hjelp av nodetransplantasjonsprosedyren.
- Se
- For hendelsen "PD Reset":
- Se
/var/log/messagesfor å sjekke om en enkelt disk eller flere disker rapporterer feilen.- Hvis disken nylig er byttet ut, er denne meldingen forventet og kan ignoreres.
- Hvis stasjonen ikke har blitt erstattet og bygget på nytt på egen hånd, kan stasjonen mislykkes eller mislykkes. Ta kontakt med Dell EMC for å bytte ut disken proaktivt.
- Se
- For hendelsene "Tidsavbrudd for kommando på PD", eller andre feil som ikke allerede er nevnt, kan du kontakte Dell Technologies for å finne neste handlingsmåte.