VNX/Unity: Inzicht in onherstelbare sectoren en Pariteitsfouten (op te lossen door gebruiker)

Summary: In dit artikel worden onherstelbare sectoren en Pariteitsfouten uitgelegd.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Inzicht in onherstelbare sectoren en Pariteitsfouten op een CLARiiON-, VNX-of Unity-array.

Gebeurtenislogboekberichten, zoals hieronder, kunnen ook als Kies thuis worden weergegeven:

VNX1-
foutcode: foutcode voor 0x953 onherstelbare pariteits sector
: foutcode van onherstelbare gegevens sector van 0x957
: foutcode voor 0x68A onherstelbare pariteits sector
: foutcode van onherstelbare gegevens sector van 0x695
: 0x840-gegevens sector invalideerde
B26-cache heeft CORRUPT_CRC uitgegeven. LUN = 309 ca_sync. c 0 309 2


VNX2
71688003 onherstelbare sector RAID-groep: %2 positie: %3 LBA: %4 blokken: %5 foutgegevens: %6 extra info: %7
71688008 onherstelbare sector RAID-groep: 10 positie: 1 LBA: D180-blokken: 8 foutgegevens: 0 extra info: e [r5_rb FLU 8224 r5_rb]
71688008 onherstelbare RAID-groep: 10 positie: 1 LBA: d170-blokken: 8 foutgegevens: 0 extra info: e [r5_rb FLU 8224 r5_rb]
71688001 gegevens sector niet-valideren RAID-groep: 10 positie: 1 LBA: D121-blokken: 7 foutgegevens: 0 extra info: e [r5_rb FLU 8224 r5_rb]

Cause

Onherstelbare fouten treden op wanneer twee verschillende schijven in dezelfde RAID-groep, in dezelfde sector, media fouten hebben. 
Een voorbeeld: wanneer een schijf met media fouten naar een hotspare wordt gekopieerd en een andere schijf in dezelfde RAID-groep, in dezelfde sector, ook media fouten bevat, kan dit leiden tot een onherstelbare fout/sector. 

De hierboven beschreven Gebeurteniscodes worden in het logboek opgenomen wanneer het systeem geen gegevens sectoren van een schijf kan lezen en volgende pogingen om de gegevens van een andere schijf in de RAID-groep te reconstrueren, mislukt. De "onherstelbare" berichten geven aan op welke schijf (en) de sectoren niet konden worden gelezen en de "invalidated"-berichten geven aan welke schijf (en) sectoren zijn gemarkeerd als nietig verklaard van geldige informatie op een specifieke locatie. Deze markering wordt uitgevoerd om ervoor te zorgen dat er geen ongeldige gegevens naar een host-systeem zullen worden teruggegeven. Pogingen om te lezen van een niet-valideren locatie zullen leiden tot een harde fout die wordt geretourneerd aan een host.
Pogingen om naar een niet-valideren locatie te schrijven, zullen succesvol worden uitgevoerd en meestal "Fill" (overschrijven) de lege locatie, waardoor het onherstelbare doeltreffend wordt. Dit is de reden waarom eerdere onherstelbare fouten verdwijnen nadat een host deze sectoren heeft overschreven met nieuwe goede gegevens.

Resolution

Voor VNX:
Nadat alle hardwareproblemen zijn opgelost, moet Dell EMC technische ondersteuning een handmatige alleen-lezen achtergrondcontrole (ROBV) uitvoeren als de betreffende interne LUN (s) in de betreffende groep. ROBV leest en controleert de gegevens voor uncorrectables op de volledige LUN (intern), inclusief niet-gebruikte ruimte om te bepalen hoeveel uncorrectables-sectoren er nog bestaan.
Zodra ROBV is voltooid, moet uw Dell EMC technische support technicus extra stappen uitvoeren, zoals het verzamelen en analyseren van gegevens van de opslag toewijzingstabel (SAT) om de betreffende specifieke gebruikers LUN (en) te identificeren (de interne Lun's waar de uncorrectables zijn gevonden, worden toegewezen aan de gebruikers Lun's).
Voor een volledige uitleg en de vereisten die nodig zijn om een ROBV uit te voeren, zie artikel 466638, VNX: Uitleg van alleen-lezen achtergrond verificatie (ROBV) (op te lossen door gebruiker)

Wanneer een onherstelbare sector wordt aangetroffen in een gebruikers LUN, moeten de gebruikersgegevens worden geverifieerd door de hosttoepassing om te bepalen of de gebruikersgegevens beschadigd zijn of dat de fout zich in ongebruikte ruimte bevindt. Elk proces dat de gegevens zou lezen, zoals een back-up, zou moeten zijn om de mogelijke beschadiging te identificeren of te markeren.
Als er sprake is van een beschadiging, kunnen de gegevens worden teruggezet van een goede back-up, met een volledige terugzetbewerking of een gedeeltelijke terugzetbewerking van alleen de getroffen bestanden.
Als er geen goede back-up is, moet u een andere manier van de hosttoepassing gebruiken om de gegevens terug te zetten of opnieuw te maken. 

Als de onherstelbare fout niet wordt gevonden in gebruikersgegevens, kan het zijn dat de achtergrondprocessen de fout nog steeds detecteren als host I/O de sector niet overschrijft. Dit kan leiden tot een onjuiste beoordeling dat dit een nieuwe fout is en leidt tot vertragingen in analyse en probleemoplossing voor een oude fout die niet volledig is opgelost.
In dit geval wordt nadrukkelijk aangeraden om de goede gegevens naar een andere LUN te verplaatsen en de oorspronkelijke LUN te verwijderen.

Voor Unitybestaat er ook andere methoden om te proberen dit probleem op te lossen. Controleer of u meer specifieke artikelen hebt voor Unity.

Additional Information

Veelgestelde vragen:

Heeft engineering een andere manier om verloren klantgegevens terug te zetten als een hosttoepassing de gegevens niet overschrijft, en als een terugzetbewerking van een back-up niet werkt? 
Er is geen andere manier om de gegevens te herstellen, behalve een terugzetbewerking, of het opnieuw maken van de gegevens van de toepassing.
Omdat de gegevens die niet kunnen worden gecorrigeerd, gegevens bevatten, is er geen manier om te weten wat de gegevens zijn om deze terug te zetten.  Dit is de reden waarom de sector ' ongeldig ' is en er wordt een harde fout geretourneerd naar de host. Het is beter om een harde fout te retourneren dan onjuiste gegevens. 

Is het mogelijk dat een niet-valideren sector de locaties op een schijf wijzigt? 
Voor een standaard LUN zal de ongeldige gegevens sector altijd hetzelfde blijven.
Voor een groep LUN met automatische Tiering ingeschakeld, kan deze worden verplaatst als het betreffende segment opnieuw wordt geplaatst.

Is er een manier om de werkelijke locatie van een niet-valideren sector te vinden?  
Het is zeer moeilijk om de positie van een niet-valideren sector te vinden, omdat de Lun's binnen RAID-groepen of groepen zijn toegewezen en welke informatie beschikbaar is in de gebeurtenislogboeken.
Neem contact op met de ondersteuningsafdeling van Dell EMC voor verdere hulp bij het identificeren van de blokken met de niet-valideren sector.  Het ondersteuningsteam moet eerst het onherstelbare herstelproces eerst doorlopen en het probleem vervolgens escaleren naar het herstel team. . 

Als de niet-gevalideerde sector niet lijkt op de invloed van het gegevensgebied van de klant, dan is er een manier om deze te verwijderen zonder de LUN te ontkoppelen?
Er is een melding gerapporteerd bij het schrijven van tijdelijke gegevens om de LUN te vullen en de tijdelijke gegevens te verwijderen.  Als het niet-validerene gebied naar tijdelijke gegevens wordt geschreven, worden de geannuleerde locatie (s) ingevuld en wordt daarmee de ongeldige sector teruggezet met geldige gegevens. 

Kan een klant alleen een CHKDSK-of FSCK uitvoeren om de integriteit van de gegevens in het bestandssysteem te controleren als onherstelbare fouten worden gemeld door alleen-lezen achtergrond verificatie? 
Wanneer er een probleem is met onherstelbare sectoren, moeten de klantgegevens worden gecontroleerd om te zien of er beschadigde bestanden zijn. U kunt dit doen door een toepassing of programma uit te voeren dat alle gebruikte sectoren in de LUN ruimte leest. Het meest voorkomende type methode is een volledige back-up van de gegevens. Het is niet raadzaam om eenvoudigweg een FSCK (UNIX) of CHKDSK (Windows) uit te voeren, omdat deze hulpprogramma's alleen het metagegevens gedeelte van de bestanden controleren. Als de onherstelbare sectoren niet in de metadata ruimte staan, zal de klant de indruk hebben op het moment dat de gegevens onwaar zijn.

Overige veelgestelde vragen:

Waarom is het noodzakelijk om gegevenscompressie uit te schakelen?
Gegevenscompressie is een functie waarmee de gegevens op een schijf worden geanalyseerd en waarmee algoritmen worden toegepast waarmee de omvang van repeterende bits die inherent zijn aan bepaalde bestandstypen wordt beperkt. Tijdens de compressiebewerking voor een RAID-groeps LUN wordt de LUN-gegevens door de-software gemigreerd en gecomprimeerd tot een dun LUN in een groep. Het LUN wordt een gecomprimeerde, dunne LUN. Compressie bewerkingen voor pool-Lun's (dik en dun) vinden plaats in de groep waarin de LUN worden gecomprimeerd. Wanneer gegevens worden gecomprimeerd, is er een gegevensverplaatsing binnen de groep die ons niet helpt bij het identificeren van de juiste MLU die wordt beïnvloed vanwege Uncorrectables of onverwachte Coherency. Zodat de functie moet worden gepauzeerd.

Waarom is het noodzakelijk automatische Aflaaging uit te schakelen?
Met de functie Automatische laag worden gegevens gemigreerd tussenopslag lagen of verschillende opslagmedia (EFD, FC & SATA). Het doel van gelaagde opslag is het behouden van de meest gebruikte of belangrijke gegevens over snelle, hoge prestaties (duurder)-schijven en het minder vaak gebruikte en minder belangrijke gegevens te verplaatsen naar lage prestatie (goedkopere) schijven. Net als bij gegevenscompressie is er een gegevensverplaatsing die betrekking heeft op auto-Tiers die ons niet helpt bij het identificeren van de sector van de MLU die wordt beïnvloed vanwege Uncorrectables of onverwachte Coherency als deze niet is uitgeschakeld. De verplaatsing moet dus worden gestopt en de planning moet worden uitgeschakeld.

Waarom is het nodig om snelle caching uit te schakelen?
Snelle cache hoeft alleen te worden uitgeschakeld als de onherstelbare sector fout wordt gemeld in de snelle cache

waarom het nodig is om ROBV uit te voeren op de gehele RAID-groep (RG) en niet op de specifieke LUN?
U moet ROBV op de gehele RG uitvoeren om bepaalde andere klant-Lun's in dezelfde RG te kunnen gebruiken.

Waarom is het nodig om ROBV op de groep uit te voeren en niet alleen de RAID-groep?
U moet ROBV op een hele pool uitvoeren als een automatische afstelings planning is uitgevoerd sinds de tijd dat een onherstelbare melding is gerapporteerd en de ROBV volgens de planning begint te beginnen.  Dit is noodzakelijk, omdat data segmenten de onherstelbare gegevens naar een andere sector kunnen verplaatsen als dat gegevenssegment naar een andere laag wordt verplaatst.
 
Waarom is het nodig om SAT-opslag toewijzingstabel gegevens te verzamelen?
De SAT-informatie bij uitvoering door de hulpmiddelen die door Dell EMC support worden gebruikt, bepaalt de klant LUN/MLU waar de onherstelbare sector zich bevindt.  Dit zal ook aangeven of het probleem zich in de gegevensruimte bevindt of in de metagegevens ruimte van de klant LUN.

Affected Products

VNX1 Series

Products

CLARiiON, CLARiiON CX4 Series, Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity Family, Dell EMC Unity Hybrid, VNX1 Series, VNX2 Series
Article Properties
Article Number: 000046044
Article Type: Solution
Last Modified: 06 Nov 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.