VNX/Unity: Forstå ikke-retts sektorer og paritets feil (bruker rettet)

Summary: Denne artikkelen forklarer sektorer og paritets feil som ikke kunne korrigeres.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Forstå hvilke sektorer og paritets feil som er nødvendige for en CLARiiON-, VNX-eller Unity-tabell.

Hendelses Logg meldinger som følgende, kan også vises som ringe hus: VNX1-


feilkode: 0x953-korrigert paritets sektor
feil kode: 0x957-feil i data sektor som ikke kan rettes opp
: 0x68A-korrigert paritets sektor
feil kode: 0x695-feil i data sektor som ikke kan rettes opp
: 0x840-datasektor gjort ugyldig
B26 hurtig buffer har sendt CORRUPT_CRC. LUN = 309 ca_sync. c 0 309 2


VNX2
71688003-løs sektor RAID-gruppe: %2 posisjon: %3 LBA: %4 blokker: %5 feil info: %6 ekstra info: %7
71688008 løs sektor RAID-gruppe: 10 posisjon: 1 LBA: d180-blokker: 8 feil info: 0 ekstra info: e [r5_rb FLU 8224 r5_rb]
71688008 ikke-rett sektor RAID-gruppe: 10 posisjon: 1 LBA: d170-blokker: 8 feil info: 0 ekstra info: e [r5_rb FLU 8224 r5_rb]
71688001 datasektor gjort ugyldig RAID-gruppe: 10 posisjon: 1 LBA: d121-blokker: 7 feil info: 0 ekstra info: e [r5_rb FLU 8224 r5_rb]

Cause

Korrigerte feil oppstår når to forskjellige disker i samme RAID-gruppe er i samme sektor, inneholder medie feil. 
Ett eksempel, når en disk med medie feil kopieres til en HOTSPARE, og en annen disk i samme RAID-gruppe, i samme sektor, også har medie feil, vil dette føre til en feil/sektor som ikke kan korrigeres. 

Hendelses kodene som er beskrevet ovenfor, logges når systemet ikke er i stand til å lese data sektorer fra en disk, og påfølgende forsøk på å rekonstruere data fra en annen disk i RAID-gruppen mislyktes. Meldingen "melding som ikke kan rettes" viser hvilke disker som ikke kunne leses i sektorene, og at de "ugyldige" meldingene viser hvilke disk (er) sektorer som ble merket som kansellering av gyldig informasjon på et bestemt sted. Denne merkingen gjøres for å sikre at ingen ugyldige data vil bli returnert til et verts system. Forsøk på å lese fra et sted som ikke er godkjent, vil føre til at en hard feil returneres til en vert.
Forsøk på å skrive til en bekreftet plassering full føres, og vanligvis fylles (overwrite) (overskriv) den kansellerte plasseringen, slik at det er mulig å korrigere dem som ikke fungerer. Dette er grunnen til at noen ganger forbi feil som ikke kan rettes, forsvinner etter at en vert har overskrevet disse sektorene med nye, gode data.

Resolution

For VNX:
Når alle maskin vare problemene er løst, må Dell EMC tekniske støtte utføre en manuell skrivebeskyttet bakgrunns bekreftelse (ROBV) hvis de berørte interne LUN (ene) i det berørte utvalget er. ROBV leser og kontrollerer dataene for uncorrectables på hele LUN (internt), inkludert ikke brukt plass til å bestemme hvor mange uncorrectables-sektorer som fortsatt eksisterer.
Når ROBV er fullført, må den Dell EMC tekniske støtte teknikeren utføre flere tiltak, inkludert innsamling og analyse av informasjon om lager tildeling (LØR) for å identifisere de (n) bestemte bruker LUN (er) som er berørt (de interne luner der uncorrectables ble funnet, vil bli tilordnet bruker-luner).
Hvis du vil ha en komplett forklaring og nødvendige krav for å utføre en ROBV, kan du se artikkel 466638, VNX: Forklaring av skrivebeskyttet bakgrunns bekreftelse (ROBV) (bruker rettet)

Når en eventuell skadet sektor befinner seg i en bruker LUN, må bruker dataene bekreftes av verts programmet for å avgjøre om bruker dataene er skadet, eller hvis feilen befinner seg på den ubrukte plassen. En hvilken som helst prosess som vil lese dataene som for eksempel en sikkerhets kopi, passer for å identifisere eller flagge mulig skade.
Hvis det er skadet, kan dataene gjenopprettes fra en god sikkerhets kopiering, enten med full gjenoppretting eller en delvis gjenoppretting av bare de berørte filene.
Hvis det ikke finnes en god sikkerhets kopiering, vil en annen metode fra verts programmet brukes til å gjenopprette eller opprette dataene på nytt. 

Hvis det ikke finnes en feil som ikke kan korrigeres i bruker data, kan det hende at bakgrunns prosessene fortsatt oppdager feilen i fremtiden, hvis verten i/u ikke overskriver sektoren. Dette kan føre til feil vurdering at dette er en ny feil, og som for år saker forsinkelser i analyse og utbedring av en gammel feil som ikke ble fullstendig løst.
I dette tilfellet anbefales det på det sterkeste å flytte de gode dataene til en annen LUN og slette den opprinnelige berørte LUN.

For Unitykan det hende at andre metoder finnes for å forsøke å løse problemet. Se etter flere Unity-spesifikke artikler.

Additional Information

Ofte stilte spørsmål:

Har ingeniør en annen måte å gjenopprette tapte kunde data på hvis et kundens verts program ikke overskriver dataene, og hvis en gjenoppretting av sikkerhets kopiering ikke fungerer? 
Det er ikke mulig å gjenopprette andre data enn en gjenopprettings operasjon eller for å opprette dataene fra applikasjonen på nytt.
Siden de data som ikke kan rettes opp, mangler data, er det ikke mulig å vite hva dataene bør være for å skrive dem tilbake.  Dette er grunnen til at sektoren er ugyldiggjøret og en hard feil returneres til verten. Det er bedre å returnere en hard feil enn uriktige data. 

Er det mulig for en ugyldig sektor å endre plasseringene på en disk? 
For en standard LUN vil den ugyldige data sektoren alltid være den samme.
For en pulje LUN med automatisk trinn aktivert, kan det flytte seg hvis dette stykket befinner seg.

Finnes det en måte å finne den faktiske plasseringen av en ugyldiggjøret sektor på?  
Det er veldig vanskelig å finne posisjonen til en ugyldiggjøret sektor, på grunn av måten LUNer er tilordnet i RAID-gruppene eller-Puljene, samt hvilken informasjon som er tilgjengelig i hendelses logger.
Kontakt Dell EMC støtte for ytterligere hjelp til å identifisere de blokkene som inneholder den ugyldige sektoren.  Støtte teamet må først gå gjennom den ikke-retteste gjenopprettings prosessen, og deretter eskalere problemet til gjenopprettings teamet. . 

Hvis den ikke-godkjente sektoren ser ut til å ha innvirkning på kundens data område, er det mulig å kvitte deg uten å fjerne bindingen av LUN?
En suksess har blitt rapportert ved skriving av midlertidige data for å fylle LUN og deretter slette de midlertidige dataene.  Hvis det ikke-godkjente området skrives til de midlertidige dataene, fylles de anslåtte (e) plasseringene, slik at den ugyldige sektoren med gyldige data gjenopprettes. 

Kan en kunde kjøre bare en CHKDSK eller FSCK for å kontrollere integriteten til dataene i filesystem, hvis korrigerte feil rapporteres av skrivebeskyttet bakgrunns kontroll? 
Når det er et problem med skader som ikke kan rettes, bør kundens data sjekkes ut for å se om en fil er ødelagt. For å gjøre dette, må du kjøre en hvilken som helst type program eller program som leser alle de brukte sektorene i LUN plass. Den vanligste typen metode er en full sikkerhets kopiering av dataene. Det er ikke lurt å bare kjøre en FSCK (UNIX) eller CHKDSK (Windows) fordi disse verktøyene bare kontrollerer metadata-området i filene. Hvis de ikke-riktige sektorene ikke er i et tjeneste område, vil kunden igjen med inntrykk av at dataene er OK når det er mulig at det ikke er det.

Andre vanlige spørsmål:

Hvorfor er det nødvendig å deaktivere data komprimering?
Data komprimering er en funksjon som analyserer dataene på en disk og bruker algoritmer som reduserer størrelsen på de gjentatte seriene av biter som er i noen typer filer. Under komprimeringen av en RAID-gruppe LUN overfører program varen og komprimerer LUN dataene til en tynn LUN i en pulje. LUN blir en komprimert tynn LUN. Komprimerings operasjoner for utvalgs-luner (tykk og tynn) skjer i utvalget der LUN som komprimeres, befinner seg. Hver gang data komprimeres, er det en data bevegelse i utvalget som ikke vil hjelpe oss med å identifisere riktig MLU som påvirkes av Uncorrectables eller uventede coherency. Slik at funksjonen må stanses midlertidig.

Hvorfor er det nødvendig å deaktivere automatisk nivå justering?
Funksjonen for automatisk bruk overfører data mellom lagrings enheter eller forskjellige lagrings medier (EFD, FC & SATA). Formålet med lagdelt lagring er å beholde de mest brukte eller viktige dataene på rask, høy ytelse (dyrere) stasjoner og flytte mindre hyppig mulig tilgang og mindre viktig data til lav ytelse (billigere) stasjoner. På samme måte som data komprimering, er det noen data bevegelse som er involvert i automatisk bruk, og som ikke kan hjelpe oss med å identifisere sektoren på MLU som er påvirket, på grunn av Uncorrectables eller uventede coherency hvis den ikke er deaktivert. Derfor må stedet stoppes og tids planen må deaktiveres.

Hvorfor er det nødvendig å DEAKTIVERE rask hurtigbufring?
Hurtig bufferen må bare deaktiveres hvis den korrigerte sektor feil rapporteres i hurtig bufferen

Hvorfor er det nødvendig å kjøre ROBV på hele RAID-gruppen (RG) og ikke på den bestemte LUN?
Du må kjøre ROBV på hele RG for å gjøre visse andre kundelun-er i samme RG ikke påvirket.

Hvorfor er det nødvendig å kjøre ROBV på puljen og ikke bare RAID-gruppen?
Du må kjøre ROBV på et helt utvalg hvis en tids plan for automatisk nivå har kjørt siden en feil som ikke kunne rettes, ble rapportert og ROBV er planlagt for start.  Dette er nødvendig siden data slicer kan flytte det som ikke er rettet til en annen sektor, hvis den delen av data som flyttes til et annet nivå.
 
Hvorfor er det nødvendig å samle tabell informasjon for Lør-lagringsplass?
Informasjon om LØR når de kjøres gjennom verktøyene som brukes av Dell EMC-støtte, vil avgjøre kundens LUN/MLU at det er en løs sektor som ligger i.  Dette indikerer også om problemet befinner deg i data området eller i kundens hovedLUN.

Affected Products

VNX1 Series

Products

CLARiiON, CLARiiON CX4 Series, Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity Family, Dell EMC Unity Hybrid, VNX1 Series, VNX2 Series
Article Properties
Article Number: 000046044
Article Type: Solution
Last Modified: 06 Nov 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.