VNX/enhed: Forståelse af ikke-rette sektorer og paritetsfejl (bruger korrigerende)
Summary: Denne artikel beskriver forkerte sektorer og paritetsfejl.
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Forståelse af ikke-rette sektorer og paritetsfejl på en CLARiiON-, VNX-eller Unit array.
Meddelelser i hændelseslog som f. eks. det følgende kan også blive vist som ring hjem:
VNX1-
fejlkode: 0x953 fejlkode, der ikke rettes om paritets sektor
: 0x957 ikke-rettelses fejlkode for data sektor
: 0x68A fejlkode, der ikke rettes om paritets sektor
: 0x695 ikke-rettelses fejlkode for data sektor
: 0x840-data sektoren invalideret
B26-cachen har udstedt CORRUPT_CRC. LUN = 309 ca_sync. c 0 309 2
VNX2 71688003 ikke-
korrekt sektor-RAID-gruppe: %2 position: %3 LBA: %4 blokke: %5 fejloplysninger: %6 ekstra oplysninger: %7
71688008 uoprettelig sektor-RAID-gruppe: 10-position: 1 LBA: d180-blokke: 8-fejloplysninger: 0 ekstra oplysninger: e [r5_rb FLU 8224 r5_rb]
71688008 ikke-korrekt sektor-RAID-gruppe: 10-position: 1 LBA: d170-blokke: 8-fejloplysninger: 0 ekstra oplysninger: e [r5_rb FLU 8224 r5_rb]
71688001 data sektor ugyldig RAID-gruppe: 10-position: 1 LBA: D121-blokke: 7 fejloplysninger: 0 ekstra oplysninger: e [r5_rb FLU 8224 r5_rb]
Meddelelser i hændelseslog som f. eks. det følgende kan også blive vist som ring hjem:
VNX1-
fejlkode: 0x953 fejlkode, der ikke rettes om paritets sektor
: 0x957 ikke-rettelses fejlkode for data sektor
: 0x68A fejlkode, der ikke rettes om paritets sektor
: 0x695 ikke-rettelses fejlkode for data sektor
: 0x840-data sektoren invalideret
B26-cachen har udstedt CORRUPT_CRC. LUN = 309 ca_sync. c 0 309 2
VNX2 71688003 ikke-
korrekt sektor-RAID-gruppe: %2 position: %3 LBA: %4 blokke: %5 fejloplysninger: %6 ekstra oplysninger: %7
71688008 uoprettelig sektor-RAID-gruppe: 10-position: 1 LBA: d180-blokke: 8-fejloplysninger: 0 ekstra oplysninger: e [r5_rb FLU 8224 r5_rb]
71688008 ikke-korrekt sektor-RAID-gruppe: 10-position: 1 LBA: d170-blokke: 8-fejloplysninger: 0 ekstra oplysninger: e [r5_rb FLU 8224 r5_rb]
71688001 data sektor ugyldig RAID-gruppe: 10-position: 1 LBA: D121-blokke: 7 fejloplysninger: 0 ekstra oplysninger: e [r5_rb FLU 8224 r5_rb]
Se artikel 382528 VNX2: Array rapporterer hændelser som 0x71688001, 0x71688002, 0x71688003, 0x71688007 eller 0x71688008 (bruger korrigerende) for yderligere Hændelseskoder.
Cause
Fejl løses, når to forskellige diske i samme RAID-gruppe inden for samme sektor har mediefejl.
Et eksempel er, at når en disk med mediefejl kopierer til en hotspare, og en anden disk i samme RAID-gruppe i samme sektor også har mediefejl, vil dette resultere i en fejl/sektor, der ikke kan rettes.
De ovenfor beskrevne Hændelseskoder logføres, når systemet ikke kan læse data sektorer fra en disk, og efterfølgende forsøg på at rekonstruere dataene fra en anden disk i RAID-gruppen mislykkedes. "Ikke-korrekte" meddelelser indikerer, hvilke disk (e) der ikke kunne læse sektorerne fra, og meddelelserne "invaliderede", hvilke disksektorer, der blev markeret til at være ugyldige i en specifik placering. Dette mærke er gjort for at sikre, at der ikke returneres ugyldige data til et værtssystem. Forsøg på at læse fra en ugyldig placering vil resultere i en hardwarefejl, der returneres til en vært.
Forsøg på at skrive til en ugyldig placering vil blive fuldført og generelt "udfyldning" (Overskriv) annullerings placeringen, således at den ikke kan rettes. Det er årsagen til, at tidligere fejl løses, forsvinder efter en vært har overskrevet disse sektorer med nye gode data.
Et eksempel er, at når en disk med mediefejl kopierer til en hotspare, og en anden disk i samme RAID-gruppe i samme sektor også har mediefejl, vil dette resultere i en fejl/sektor, der ikke kan rettes.
De ovenfor beskrevne Hændelseskoder logføres, når systemet ikke kan læse data sektorer fra en disk, og efterfølgende forsøg på at rekonstruere dataene fra en anden disk i RAID-gruppen mislykkedes. "Ikke-korrekte" meddelelser indikerer, hvilke disk (e) der ikke kunne læse sektorerne fra, og meddelelserne "invaliderede", hvilke disksektorer, der blev markeret til at være ugyldige i en specifik placering. Dette mærke er gjort for at sikre, at der ikke returneres ugyldige data til et værtssystem. Forsøg på at læse fra en ugyldig placering vil resultere i en hardwarefejl, der returneres til en vært.
Forsøg på at skrive til en ugyldig placering vil blive fuldført og generelt "udfyldning" (Overskriv) annullerings placeringen, således at den ikke kan rettes. Det er årsagen til, at tidligere fejl løses, forsvinder efter en vært har overskrevet disse sektorer med nye gode data.
Resolution
For VNX:
Når alle hardware problemerne er løst, skal Dell EMC teknisk support udføre en manuel skrivebeskyttet baggrunds verificering (ROBV), hvis de berørte interne LUN i den berørte pulje. ROBV læser og kontrollerer dataene for uncorrectables på hele LUN (intern), herunder ikke-anvendt plads til at bestemme hvor mange uncorrectables-sektorer, der stadig kan findes.
Når ROBV er gennemført, og hvis uncorrectables stadig er der, skal din Dell EMC tekniske support tekniker udføre yderligere trin, herunder indsamling og analyse af Storage Allocation Table information (SAT) for at identificere den eller de specifikke bruger-LUN (e), der er berørt (de interne LUN'er, hvor uncorrectables blev fundet, vil blive knyttet til bruger-Lun'erne).
Hvis du vil have en fuldstændig forklaring og de krav, der er nødvendige for at udføre en ROBV, skal du se i artikel 466638 VNX: Forklaring af skrivebeskyttet baggrundskontrol (ROBV) (bruger rettelse)
Når der findes en ikke-rettelses sektor i en bruger LUN, skal brugerdataene godkendes af værtsprogrammet for at afgøre, om brugerdataene er beskadigede, eller om fejlen er placeret i et ubenyttet område. Alle processer, der vil læse data som f. eks. en sikkerhedskopiering, vil passe til at identificere/markere eventuelt beskadigelse.
Hvis der er beskadigelse, kan dataene gendannes fra en god sikkerhedskopi, enten en fuld gendannelse eller en delvis gendannelse af de påvirkede filer.
Hvis der ikke er en god sikkerhedskopiering, bør en anden metode fra værtsprogrammet bruges til at gendanne eller genoprette dataene.
Hvis der ikke findes en uoprettelig fejl i brugerdataene, kan baggrunds processerne stadig finde fejlen i fremtiden, hvis Host I/O ikke overskriver sektoren. Dette kan medføre en ukorrekt vurdering af, at dette er en ny fejl, og give forsinkelser i analysen og afhjælpning af en gammel fejl, der ikke blev fuldstændigt løst.
I dette tilfælde anbefales det, at du flytter gode data til en anden LUN og sletter den oprindelige LUN.
Forenheds beholdere kan der være andre metoder til at forsøge at løse problemet. Kontroller, om der er flere enhedsspecifikke artikler.
Når alle hardware problemerne er løst, skal Dell EMC teknisk support udføre en manuel skrivebeskyttet baggrunds verificering (ROBV), hvis de berørte interne LUN i den berørte pulje. ROBV læser og kontrollerer dataene for uncorrectables på hele LUN (intern), herunder ikke-anvendt plads til at bestemme hvor mange uncorrectables-sektorer, der stadig kan findes.
Når ROBV er gennemført, og hvis uncorrectables stadig er der, skal din Dell EMC tekniske support tekniker udføre yderligere trin, herunder indsamling og analyse af Storage Allocation Table information (SAT) for at identificere den eller de specifikke bruger-LUN (e), der er berørt (de interne LUN'er, hvor uncorrectables blev fundet, vil blive knyttet til bruger-Lun'erne).
Hvis du vil have en fuldstændig forklaring og de krav, der er nødvendige for at udføre en ROBV, skal du se i artikel 466638 VNX: Forklaring af skrivebeskyttet baggrundskontrol (ROBV) (bruger rettelse)
Når der findes en ikke-rettelses sektor i en bruger LUN, skal brugerdataene godkendes af værtsprogrammet for at afgøre, om brugerdataene er beskadigede, eller om fejlen er placeret i et ubenyttet område. Alle processer, der vil læse data som f. eks. en sikkerhedskopiering, vil passe til at identificere/markere eventuelt beskadigelse.
Hvis der er beskadigelse, kan dataene gendannes fra en god sikkerhedskopi, enten en fuld gendannelse eller en delvis gendannelse af de påvirkede filer.
Hvis der ikke er en god sikkerhedskopiering, bør en anden metode fra værtsprogrammet bruges til at gendanne eller genoprette dataene.
Hvis der ikke findes en uoprettelig fejl i brugerdataene, kan baggrunds processerne stadig finde fejlen i fremtiden, hvis Host I/O ikke overskriver sektoren. Dette kan medføre en ukorrekt vurdering af, at dette er en ny fejl, og give forsinkelser i analysen og afhjælpning af en gammel fejl, der ikke blev fuldstændigt løst.
I dette tilfælde anbefales det, at du flytter gode data til en anden LUN og sletter den oprindelige LUN.
Forenheds beholdere kan der være andre metoder til at forsøge at løse problemet. Kontroller, om der er flere enhedsspecifikke artikler.
Additional Information
Ofte stillede spørgsmål:
Giver teknikeren en anden mulighed for at gendanne tabte kundedata, hvis et kunde værtsprogram ikke overskriver dataene, og hvis en gendannelse fra en sikkerhedskopi ikke fungerer?
Der er ingen anden måde at genoprette de data, som er en gendannelseshandling, eller genskabe dataene fra programmet.
Da data, der ikke kan rettes, mangler data, er der ingen måde at kende dem på, hvad dataene skal være for at skrive dem tilbage. Det er grunden til, at sektoren er ' ugyldiggjort ', og en harddisk bliver returneret til værten. Det er bedre at returnere en hardwarefejl end forkerte data.
Er det muligt for en ugyldig sektor at ændre placeringer på en disk?
For en standard LUN vil den ugyldige data sektor altid være den samme.
For en pulje LUN med automatisk modulering aktiveret, kan den bevæge sig, hvis det pågældende udsnit flyttes.
Er der en metode til at finde den faktiske placering af en ugyldig sektor?
Det er meget vanskeligt at finde placeringen af en ugyldig sektor, på grund af hvordan LUN'er tilkobles inden for RAID-grupper eller puljer, og hvilke oplysninger der er tilgængelige i hændelseslogfilerne.
Kontakt Dell EMC support for at få yderligere hjælp til at identificere de blokke, der indeholder den invaliderede sektor. Supportteamet skal først gennemgå den rettede gendannelsesproces og derefter eskalere problemet til gendannelses teamet. .
Hvis den invaliderede sektor ikke ser ud til at påvirke kundedata området, kan du slippe det uden at fjerne bindingen af LUN?
Nogle gunstige handlinger er blevet rapporteret under skrivning af midlertidige data for at udfylde LUN og derefter slette de midlertidige data. Hvis det område, der er gjort ugyldigt, skrives til med midlertidige data, udfyldes den eller de annullerede placeringer, hvorved den ugyldige sektor gendannes med gyldige data.
Kan en kunde kun køre en CHKDSK-eller FSCK for at kontrollere integriteten af dataene i filsystemet, hvis der rapporteres om fejl, der ikke kan rettes, efter læselige baggrunds bekræftelse?
Når der er et problem med ikke-korrekte sektorer, skal kundens data kontrolleres for at se, om en fil beskadiges. For at gøre dette, skal du køre en type applikation eller et program, der læser alle de anvendte sektorer, i den LUN plads. Den mest almindelige type metode er en fuld sikkerhedskopiering af dataene. Det anbefales ikke blot at køre en FSCK (UNIX) eller CHKDSK (Windows), da disse hjælpeprogrammer kun kontrollerer metadata-området for filerne. Hvis de ikke-rettede sektorer ikke er i Metadataområde, vil kunden efterkomme det indtryk, at dataene er tilstede, når det er i orden.
Andre ofte stillede spørgsmål:
Hvorfor er det nødvendigt at deaktivere data komprimering?
Data komprimering er en funktion, der analyserer data på en disk og anvender algoritmer, der reducerer størrelsen af gentagne sekvenser af bit, der er indbygget i visse typer filer. Under komprimeringsprocessen for en RAID-gruppe LUN overflytter og komprimerer softwaren LUNs dataene til en tynd LUN i en gruppe. LUN bliver en komprimeret tynd LUN. Komprimerings handlinger for pulje-LUN'er (tyk og tynd) finder sted i den pulje, hvor de LUN, der skal komprimeres, er placeret. Når data komprimeres, er der en dataflytning i puljen, som ikke hjælper os med at identificere den korrekte MLU, der påvirkes på grund af Uncorrectables eller uventede Coherency. Funktionen skal afbrydes midlertidigt.
Hvorfor er det nødvendigt at deaktivere automatisk modulering?
Funktionen til automatisk-lagdelt flytning af data mellem lagerniveauer eller forskellige lagringsmedier (FC EFD & SATA). Formålet med det lagdelte lager er at bevare de mest anvendte eller vigtige data på hurtige, High Performance (dyrere) drev og flytte de mindre hyppigt anvendte og mindre vigtige data til harddiske med lav ydeevne (mindre dyrt). På samme måde som datakomprimering er der en funktion, der er involveret i automatisk indpakning, der ikke vil hjælpe os med at identificere sektoren for den MLU, der påvirkes på grund af Uncorrectables eller en uventet Coherency, hvis den ikke er deaktiveret. GenPlace ring skal være stoppet, og planen skal deaktiveres.
Hvorfor er det nødvendigt at DEAKTIVERE hurtig cache lagring?
Hurtig cachelagring skal kun deaktiveres, hvis den ikke-rettede sektorfejl rapporteres i hurtig cache,
Hvorfor er det nødvendigt at køre ROBV på hele RAID-gruppen (rg) og ikke på den bestemte LUN?
Du skal køre ROBV på hele RG for at gøre visse andre bruger-LUN'er i samme RG ikke blevet påvirket.
Hvorfor er det nødvendigt at køre ROBV på puljen og ikke kun i RAID-gruppen?
Du skal køre ROBV på en hel gruppe, hvis der er kørt en automatisk planlægning, siden der blev rapporteret et problem, og ROBV er planlagt til at begynde. Dette er nødvendigt, da data udsnit kan flytte det forkerte til en anden sektor, hvis det pågældende udsnit af data flyttes til et andet niveau.
Hvorfor er det nødvendigt at indsamle oplysninger om indhentning af lager allokerings tabel?
SAT-oplysningerne når du kører med de værktøjer, der anvendes af Dell EMC support, bestemmer kunden LUN/MLU, som den ikke-korrekte sektor ligger i. Det vil også være opmærksom på, om problemet er i dataområdet eller i kundens metadata LUN.
Giver teknikeren en anden mulighed for at gendanne tabte kundedata, hvis et kunde værtsprogram ikke overskriver dataene, og hvis en gendannelse fra en sikkerhedskopi ikke fungerer?
Der er ingen anden måde at genoprette de data, som er en gendannelseshandling, eller genskabe dataene fra programmet.
Da data, der ikke kan rettes, mangler data, er der ingen måde at kende dem på, hvad dataene skal være for at skrive dem tilbage. Det er grunden til, at sektoren er ' ugyldiggjort ', og en harddisk bliver returneret til værten. Det er bedre at returnere en hardwarefejl end forkerte data.
Er det muligt for en ugyldig sektor at ændre placeringer på en disk?
For en standard LUN vil den ugyldige data sektor altid være den samme.
For en pulje LUN med automatisk modulering aktiveret, kan den bevæge sig, hvis det pågældende udsnit flyttes.
Er der en metode til at finde den faktiske placering af en ugyldig sektor?
Det er meget vanskeligt at finde placeringen af en ugyldig sektor, på grund af hvordan LUN'er tilkobles inden for RAID-grupper eller puljer, og hvilke oplysninger der er tilgængelige i hændelseslogfilerne.
Kontakt Dell EMC support for at få yderligere hjælp til at identificere de blokke, der indeholder den invaliderede sektor. Supportteamet skal først gennemgå den rettede gendannelsesproces og derefter eskalere problemet til gendannelses teamet. .
Hvis den invaliderede sektor ikke ser ud til at påvirke kundedata området, kan du slippe det uden at fjerne bindingen af LUN?
Nogle gunstige handlinger er blevet rapporteret under skrivning af midlertidige data for at udfylde LUN og derefter slette de midlertidige data. Hvis det område, der er gjort ugyldigt, skrives til med midlertidige data, udfyldes den eller de annullerede placeringer, hvorved den ugyldige sektor gendannes med gyldige data.
Kan en kunde kun køre en CHKDSK-eller FSCK for at kontrollere integriteten af dataene i filsystemet, hvis der rapporteres om fejl, der ikke kan rettes, efter læselige baggrunds bekræftelse?
Når der er et problem med ikke-korrekte sektorer, skal kundens data kontrolleres for at se, om en fil beskadiges. For at gøre dette, skal du køre en type applikation eller et program, der læser alle de anvendte sektorer, i den LUN plads. Den mest almindelige type metode er en fuld sikkerhedskopiering af dataene. Det anbefales ikke blot at køre en FSCK (UNIX) eller CHKDSK (Windows), da disse hjælpeprogrammer kun kontrollerer metadata-området for filerne. Hvis de ikke-rettede sektorer ikke er i Metadataområde, vil kunden efterkomme det indtryk, at dataene er tilstede, når det er i orden.
Andre ofte stillede spørgsmål:
Hvorfor er det nødvendigt at deaktivere data komprimering?
Data komprimering er en funktion, der analyserer data på en disk og anvender algoritmer, der reducerer størrelsen af gentagne sekvenser af bit, der er indbygget i visse typer filer. Under komprimeringsprocessen for en RAID-gruppe LUN overflytter og komprimerer softwaren LUNs dataene til en tynd LUN i en gruppe. LUN bliver en komprimeret tynd LUN. Komprimerings handlinger for pulje-LUN'er (tyk og tynd) finder sted i den pulje, hvor de LUN, der skal komprimeres, er placeret. Når data komprimeres, er der en dataflytning i puljen, som ikke hjælper os med at identificere den korrekte MLU, der påvirkes på grund af Uncorrectables eller uventede Coherency. Funktionen skal afbrydes midlertidigt.
Hvorfor er det nødvendigt at deaktivere automatisk modulering?
Funktionen til automatisk-lagdelt flytning af data mellem lagerniveauer eller forskellige lagringsmedier (FC EFD & SATA). Formålet med det lagdelte lager er at bevare de mest anvendte eller vigtige data på hurtige, High Performance (dyrere) drev og flytte de mindre hyppigt anvendte og mindre vigtige data til harddiske med lav ydeevne (mindre dyrt). På samme måde som datakomprimering er der en funktion, der er involveret i automatisk indpakning, der ikke vil hjælpe os med at identificere sektoren for den MLU, der påvirkes på grund af Uncorrectables eller en uventet Coherency, hvis den ikke er deaktiveret. GenPlace ring skal være stoppet, og planen skal deaktiveres.
Hvorfor er det nødvendigt at DEAKTIVERE hurtig cache lagring?
Hurtig cachelagring skal kun deaktiveres, hvis den ikke-rettede sektorfejl rapporteres i hurtig cache,
Hvorfor er det nødvendigt at køre ROBV på hele RAID-gruppen (rg) og ikke på den bestemte LUN?
Du skal køre ROBV på hele RG for at gøre visse andre bruger-LUN'er i samme RG ikke blevet påvirket.
Hvorfor er det nødvendigt at køre ROBV på puljen og ikke kun i RAID-gruppen?
Du skal køre ROBV på en hel gruppe, hvis der er kørt en automatisk planlægning, siden der blev rapporteret et problem, og ROBV er planlagt til at begynde. Dette er nødvendigt, da data udsnit kan flytte det forkerte til en anden sektor, hvis det pågældende udsnit af data flyttes til et andet niveau.
Hvorfor er det nødvendigt at indsamle oplysninger om indhentning af lager allokerings tabel?
SAT-oplysningerne når du kører med de værktøjer, der anvendes af Dell EMC support, bestemmer kunden LUN/MLU, som den ikke-korrekte sektor ligger i. Det vil også være opmærksom på, om problemet er i dataområdet eller i kundens metadata LUN.
Affected Products
VNX1 SeriesProducts
CLARiiON, CLARiiON CX4 Series, Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity Family, Dell EMC Unity Hybrid, VNX1 Series, VNX2 SeriesArticle Properties
Article Number: 000046044
Article Type: Solution
Last Modified: 06 Nov 2025
Version: 6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.