VNX/Unity: Förstå områden och paritets fel som inte kan korrigeras (kan korrigeras av användaren)
Summary: I den här artikeln beskrivs icke korrigerade sektorer och paritets fel.
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Förstå områden och paritets fel som inte kan korrigeras på en CLARiiON-, VNX-eller Unity-matris.
Händelse logg meddelanden, till exempel följande, kan även visas som Dial-bostäder:
VNX1-
felkod: Felkod för 0x953-avkorrigerande paritets sektor
: Felkod för 0x957-felkorrigerad data sektor
: Felkod för 0x68A-avkorrigerande paritets sektor
: Felkod för 0x695-felkorrigerad data sektor
: 0x840 data sektor invalidated
B26 cache har utfärdat CORRUPT_CRC. LUN = 309 ca_sync. c 0 309 2
VNX2
71688003 icke Rättaste sektor RAID-grupp: %2 position: %3 LBA: %4 block: %5 fel information: %6 extra information: %7
71688008 icke korrektions bara sektor RAID-grupp: 10 position: 1 LBA: d180-block: 8 fel information: 0 extra info: e [r5_rb FLU 8224 r5_rb]
71688008 icke korrektions bara sektor RAID-grupp: 10 position: 1 LBA: D170-block: 8 fel information: 0 extra info: e [r5_rb FLU 8224 r5_rb]
71688001 data sektorns ogiltiga RAID-grupp: 10 position: 1 LBA: D121-block: 7 fel information: 0 extra info: e [r5_rb FLU 8224 r5_rb]
Händelse logg meddelanden, till exempel följande, kan även visas som Dial-bostäder:
VNX1-
felkod: Felkod för 0x953-avkorrigerande paritets sektor
: Felkod för 0x957-felkorrigerad data sektor
: Felkod för 0x68A-avkorrigerande paritets sektor
: Felkod för 0x695-felkorrigerad data sektor
: 0x840 data sektor invalidated
B26 cache har utfärdat CORRUPT_CRC. LUN = 309 ca_sync. c 0 309 2
VNX2
71688003 icke Rättaste sektor RAID-grupp: %2 position: %3 LBA: %4 block: %5 fel information: %6 extra information: %7
71688008 icke korrektions bara sektor RAID-grupp: 10 position: 1 LBA: d180-block: 8 fel information: 0 extra info: e [r5_rb FLU 8224 r5_rb]
71688008 icke korrektions bara sektor RAID-grupp: 10 position: 1 LBA: D170-block: 8 fel information: 0 extra info: e [r5_rb FLU 8224 r5_rb]
71688001 data sektorns ogiltiga RAID-grupp: 10 position: 1 LBA: D121-block: 7 fel information: 0 extra info: e [r5_rb FLU 8224 r5_rb]
Se artikel 382528 VNX2: I mat ris rapporteras händelser som 0x71688001, 0x71688002, 0x71688003, 0x71688007 eller 0x71688008 (kan korrigeras av användaren) för ytterligare händelse koder.
Cause
Fel som inte kan korrigeras uppstår när två olika diskar i samma RAID-grupp inom samma sektor har ett problem med medie fel.
Ett exempel: när en disk med medie fel kopieras till en hotspare, och en annan disk i samma RAID-grupp, i samma sektor, även har medie fel, resulterar detta i ett icke korrigerande fel/sektor.
Händelse koderna som beskrivs ovan loggas när systemet inte kan läsa data sektorer från en disk, och efterföljande försök att rekonstruera data från en annan disk i RAID-gruppen misslyckades. Meddelanden som inte kan korrigeras indikerar vilka diskar som inte kunde läsa sektorerna från, och "Disabled"-meddelandena indikerar vilka disk (er) sektorer som var markerade som ogiltiga uppgifter på en specifik plats. Markeringen görs för att säkerställa att inga ogiltiga data returneras till ett värd system. Försök att läsa från en ogiltig plats innebär att ett hårt fel returneras till en värd.
Försök att skriva till en ogiltig plats slutförs korrekt och normalt "Fill" (skriver över) den annullerade platsen, vilket gör att den inte kan korrigeras. Detta är orsaken till att ibland förbi tidigare icke korrigerade fel försvinner när en värd har skrivit över dessa sektorer med nya bra data.
Ett exempel: när en disk med medie fel kopieras till en hotspare, och en annan disk i samma RAID-grupp, i samma sektor, även har medie fel, resulterar detta i ett icke korrigerande fel/sektor.
Händelse koderna som beskrivs ovan loggas när systemet inte kan läsa data sektorer från en disk, och efterföljande försök att rekonstruera data från en annan disk i RAID-gruppen misslyckades. Meddelanden som inte kan korrigeras indikerar vilka diskar som inte kunde läsa sektorerna från, och "Disabled"-meddelandena indikerar vilka disk (er) sektorer som var markerade som ogiltiga uppgifter på en specifik plats. Markeringen görs för att säkerställa att inga ogiltiga data returneras till ett värd system. Försök att läsa från en ogiltig plats innebär att ett hårt fel returneras till en värd.
Försök att skriva till en ogiltig plats slutförs korrekt och normalt "Fill" (skriver över) den annullerade platsen, vilket gör att den inte kan korrigeras. Detta är orsaken till att ibland förbi tidigare icke korrigerade fel försvinner när en värd har skrivit över dessa sektorer med nya bra data.
Resolution
För VNX:
När alla maskin varu problem har lösts måste Dell EMC tekniska support köra en manuell och skrivskyddad bakgrund (ROBV) om de aktuella interna LUN i den berörda poolen. ROBV läser och kontrollerar data för uncorrectables på hela LUN (internt), inklusive icke-Använd utrymme för att avgöra hur många uncorrectables sektorer som kan finnas kvar.
När ROBV har slutförts kommer din Dell EMC tekniska support ingenjör att behöva utföra ytterligare steg, bland annat samla och analysera information om Storage Allocation Table (SAT) för att identifiera specifika användar LUN (er) som påverkas (interna LUN där uncorrectables hittades kommer att mappas till användarens LUN).
En fullständig förklaring och de före nödvändiga kraven för att köra en ROBV finns i artikel 466638, VNX: Förklaring av skrivskyddad bakgrunds verifiering (ROBV) (kan korrigeras av användaren)
När en icke-rättbar sektor påträffas i en användare LUN måste användar data verifieras av värd programmet för att avgöra om användar data är skadade eller om felet ligger i oanvänt utrymme. Alla processer som skulle läsa data såsom en säkerhets kopiering skulle passa till att identifiera/flagga möjliga skador.
Om det föreligger skador kan data återställas från en bra säkerhets kopia, med antingen en fullständig återställning eller en delvis återställning av bara de berörda filerna.
Om det inte finns någon bra säkerhets kopiering bör du använda en annan metod från värd programmet för att återställa eller återskapa data.
Om det inte går att hitta ett fel som inte kan korrigeras i användar data kan bakgrunds processerna fortfarande upptäcka felet i framtiden, om värd I/O inte skriver över sektorn. Detta kan leda till en felaktig bedömning om det är ett nytt fel och orsaka fördröjningar i analyser och reparation för ett tidigare fel som inte har lösts helt.
I det här fallet rekommenderar vi starkt att du flyttar bra data till en annan LUN och tar bort de ursprungligen berörda LUN.
För Unityfinns det kanske andra metoder för att hjälpa till att lösa problemet. Kontrol lera om du har fler Unity-specifika artiklar.
När alla maskin varu problem har lösts måste Dell EMC tekniska support köra en manuell och skrivskyddad bakgrund (ROBV) om de aktuella interna LUN i den berörda poolen. ROBV läser och kontrollerar data för uncorrectables på hela LUN (internt), inklusive icke-Använd utrymme för att avgöra hur många uncorrectables sektorer som kan finnas kvar.
När ROBV har slutförts kommer din Dell EMC tekniska support ingenjör att behöva utföra ytterligare steg, bland annat samla och analysera information om Storage Allocation Table (SAT) för att identifiera specifika användar LUN (er) som påverkas (interna LUN där uncorrectables hittades kommer att mappas till användarens LUN).
En fullständig förklaring och de före nödvändiga kraven för att köra en ROBV finns i artikel 466638, VNX: Förklaring av skrivskyddad bakgrunds verifiering (ROBV) (kan korrigeras av användaren)
När en icke-rättbar sektor påträffas i en användare LUN måste användar data verifieras av värd programmet för att avgöra om användar data är skadade eller om felet ligger i oanvänt utrymme. Alla processer som skulle läsa data såsom en säkerhets kopiering skulle passa till att identifiera/flagga möjliga skador.
Om det föreligger skador kan data återställas från en bra säkerhets kopia, med antingen en fullständig återställning eller en delvis återställning av bara de berörda filerna.
Om det inte finns någon bra säkerhets kopiering bör du använda en annan metod från värd programmet för att återställa eller återskapa data.
Om det inte går att hitta ett fel som inte kan korrigeras i användar data kan bakgrunds processerna fortfarande upptäcka felet i framtiden, om värd I/O inte skriver över sektorn. Detta kan leda till en felaktig bedömning om det är ett nytt fel och orsaka fördröjningar i analyser och reparation för ett tidigare fel som inte har lösts helt.
I det här fallet rekommenderar vi starkt att du flyttar bra data till en annan LUN och tar bort de ursprungligen berörda LUN.
För Unityfinns det kanske andra metoder för att hjälpa till att lösa problemet. Kontrol lera om du har fler Unity-specifika artiklar.
Additional Information
Vanliga frågor och svar:
Har teknikerna ett annat sätt att återställa förlorade kunddata om ett kund värd program inte skriver över data, och om en återställning från säkerhets kopieringen inte fungerar?
Det finns inget annat sätt att återställa data än en återställnings operation eller att skapa data från programmet.
Eftersom data som inte kan korrigeras faktiskt saknas, finns det inget sätt att känna till vad data ska vara för att kunna skriva tillbaka den. Detta är orsaken till att sektorn är "invalidated" och att ett hårt fel returneras till värden. Det är bättre att returnera ett fel på hård disken än felaktiga data.
Är det möjligt att en ogiltig sektor byter plats på en disk?
För en vanlig LUN är den ogiltiga data sektorn alltid densamma.
För en pool LUN när automatisk nivå är aktive rad kan den flyttas om detta segment befinner sig.
Finns det något sätt att hitta den faktiska platsen för en ogiltig validerad sektor?
Det är mycket svårt att hitta positionen för en ogiltig val IDE rad sektor, beroende på hur LUN mappas inom RAID-grupper eller pooler, och vilken information som finns tillgänglig i händelse loggarna.
Kontakta Dell EMC support om du vill ha hjälp med att identifiera de block som innehåller den invaliderade sektorn. Support teamet kommer först att behöva gå igenom den icke korrigerade återställnings processen och sedan eskalera problemet till återställnings teamet. .
Om den invaliderade sektorn inte verkar påverka kundens data område finns det ett sätt att ta bort den utan att du behöver binda LUN?
En del framgång har rapporter ATS när tillfälliga data skrevs för att fylla LUN och sedan ta bort tillfälliga data. Om det avvaliderade området är skrivet till med tillfälliga data, fylls de annullerade platserna i, vilket återställer den ogiltiga sektorn med en giltig data.
Kan en kund bara köra en CHKDSK eller FSCK för att kontrol lera integriteten av data i fil systemet om icke korrigerade fel rapporteras av en skrivskyddad bakgrund verifiera?
När det finns ett problem med områden som inte kan korrigeras ska kunddata kontrol leras för att se om det finns några skadade filer. För att göra detta ska du köra någon typ av program eller program som läser alla använda sektorer i LUNs utrymmet. Den vanligaste typen av metod är en fullständig säkerhets kopiering av data. Det är inte tillrådligt att bara köra en FSCK (UNIX) eller CHKDSK (Windows) eftersom dessa verktyg endast kontrollerar metadata-området för filerna. Om de områden som inte kan korrigeras inte finns i metadata-utrymmet kommer kunden att bli kvar med intryck av att data är OK när det i själva verket kanske inte är det.
Övriga vanliga frågor och svar:
Varför är det nödvändigt att inaktivera data komprimeringen?
Data komprimering är en funktion som analyserar data på en disk och tillämpar algoritmer som minskar storleken på de repetitiva sekvenser av bitar som finns i vissa typer av filer. Under komprimeringen för en RAID-grupp LUN migrerar och komprimerar program varan LUN data till en tunn LUN i en pool. LUN blir en komprimerad tunn LUN. Komprimerings åtgärder för poolens LUN (tjocka och tunna) äger rum i poolen där LUN som komprimeras finns. När data är komprimerade finns det en data förflyttning i poolen som inte hjälper oss att identifiera rätt MLU som påverkas på grund av Uncorrectables eller oväntade coherency. Funktionen måste pausas.
Varför är det nödvändigt att inaktivera automatisk nivåing?
Funktionen automatisk skiktning migrerar data mellan lagrings nivåer eller olika lagrings medier (EFD, FC & SATA). Syftet med skiktad lagring är att behålla de ofta använda eller viktiga data som finns på snabba, högpresterande enheter (dyrare) och flytta mindre sällan använda och mindre viktiga data till låg prestanda (billigare) diskar. På samma sätt som för data komprimering är data förflyttning i automatisk skiktning för att hjälpa oss att identifiera sektorn för MLU som påverkas på grund av Uncorrectables eller oväntade coherency om den inte är inaktive rad. Därför måste flyttningen stoppas och schemat måste inaktive ras.
Varför är det nödvändigt att inaktivera snabb cachelagring?
Snabb cacheminne behöver bara inaktive ras om det icke korrigerande sektors felet rapporteras i snabb cache
Varför är det nödvändigt att köra ROBV på hela RAID-gruppen (RG) och inte på den specifika LUNen?
Du måste köra ROBV på hela RG för att vissa andra kund-LUN i samma RG inte har påverkats.
Varför är det nödvändigt att köra ROBV på poolen och inte bara RAID-gruppen?
Du måste köra ROBV på en hel pool om ett schema för automatisk nivå körning har körts sedan den tid som inte kan korrigeras har rapporter ATS och ROBV är schemalagd att börja. Detta är nödvändigt eftersom data sektorer kan flyttas från den felaktiga sektorn till en annan sektor om data sektorn flyttas till en annan nivå.
Varför är det nödvändigt att samla in information om en SAT-förvarings fördelnings tabell?
Information om SAT-informationen när du kör de verktyg som används av Dell EMC support, fastställer vilken kund LUN/MLU som den icke-specifika sektorn ligger i. Detta visar även om problemet finns i data utrymmet eller i metadata-rymden för kundens LUN.
Har teknikerna ett annat sätt att återställa förlorade kunddata om ett kund värd program inte skriver över data, och om en återställning från säkerhets kopieringen inte fungerar?
Det finns inget annat sätt att återställa data än en återställnings operation eller att skapa data från programmet.
Eftersom data som inte kan korrigeras faktiskt saknas, finns det inget sätt att känna till vad data ska vara för att kunna skriva tillbaka den. Detta är orsaken till att sektorn är "invalidated" och att ett hårt fel returneras till värden. Det är bättre att returnera ett fel på hård disken än felaktiga data.
Är det möjligt att en ogiltig sektor byter plats på en disk?
För en vanlig LUN är den ogiltiga data sektorn alltid densamma.
För en pool LUN när automatisk nivå är aktive rad kan den flyttas om detta segment befinner sig.
Finns det något sätt att hitta den faktiska platsen för en ogiltig validerad sektor?
Det är mycket svårt att hitta positionen för en ogiltig val IDE rad sektor, beroende på hur LUN mappas inom RAID-grupper eller pooler, och vilken information som finns tillgänglig i händelse loggarna.
Kontakta Dell EMC support om du vill ha hjälp med att identifiera de block som innehåller den invaliderade sektorn. Support teamet kommer först att behöva gå igenom den icke korrigerade återställnings processen och sedan eskalera problemet till återställnings teamet. .
Om den invaliderade sektorn inte verkar påverka kundens data område finns det ett sätt att ta bort den utan att du behöver binda LUN?
En del framgång har rapporter ATS när tillfälliga data skrevs för att fylla LUN och sedan ta bort tillfälliga data. Om det avvaliderade området är skrivet till med tillfälliga data, fylls de annullerade platserna i, vilket återställer den ogiltiga sektorn med en giltig data.
Kan en kund bara köra en CHKDSK eller FSCK för att kontrol lera integriteten av data i fil systemet om icke korrigerade fel rapporteras av en skrivskyddad bakgrund verifiera?
När det finns ett problem med områden som inte kan korrigeras ska kunddata kontrol leras för att se om det finns några skadade filer. För att göra detta ska du köra någon typ av program eller program som läser alla använda sektorer i LUNs utrymmet. Den vanligaste typen av metod är en fullständig säkerhets kopiering av data. Det är inte tillrådligt att bara köra en FSCK (UNIX) eller CHKDSK (Windows) eftersom dessa verktyg endast kontrollerar metadata-området för filerna. Om de områden som inte kan korrigeras inte finns i metadata-utrymmet kommer kunden att bli kvar med intryck av att data är OK när det i själva verket kanske inte är det.
Övriga vanliga frågor och svar:
Varför är det nödvändigt att inaktivera data komprimeringen?
Data komprimering är en funktion som analyserar data på en disk och tillämpar algoritmer som minskar storleken på de repetitiva sekvenser av bitar som finns i vissa typer av filer. Under komprimeringen för en RAID-grupp LUN migrerar och komprimerar program varan LUN data till en tunn LUN i en pool. LUN blir en komprimerad tunn LUN. Komprimerings åtgärder för poolens LUN (tjocka och tunna) äger rum i poolen där LUN som komprimeras finns. När data är komprimerade finns det en data förflyttning i poolen som inte hjälper oss att identifiera rätt MLU som påverkas på grund av Uncorrectables eller oväntade coherency. Funktionen måste pausas.
Varför är det nödvändigt att inaktivera automatisk nivåing?
Funktionen automatisk skiktning migrerar data mellan lagrings nivåer eller olika lagrings medier (EFD, FC & SATA). Syftet med skiktad lagring är att behålla de ofta använda eller viktiga data som finns på snabba, högpresterande enheter (dyrare) och flytta mindre sällan använda och mindre viktiga data till låg prestanda (billigare) diskar. På samma sätt som för data komprimering är data förflyttning i automatisk skiktning för att hjälpa oss att identifiera sektorn för MLU som påverkas på grund av Uncorrectables eller oväntade coherency om den inte är inaktive rad. Därför måste flyttningen stoppas och schemat måste inaktive ras.
Varför är det nödvändigt att inaktivera snabb cachelagring?
Snabb cacheminne behöver bara inaktive ras om det icke korrigerande sektors felet rapporteras i snabb cache
Varför är det nödvändigt att köra ROBV på hela RAID-gruppen (RG) och inte på den specifika LUNen?
Du måste köra ROBV på hela RG för att vissa andra kund-LUN i samma RG inte har påverkats.
Varför är det nödvändigt att köra ROBV på poolen och inte bara RAID-gruppen?
Du måste köra ROBV på en hel pool om ett schema för automatisk nivå körning har körts sedan den tid som inte kan korrigeras har rapporter ATS och ROBV är schemalagd att börja. Detta är nödvändigt eftersom data sektorer kan flyttas från den felaktiga sektorn till en annan sektor om data sektorn flyttas till en annan nivå.
Varför är det nödvändigt att samla in information om en SAT-förvarings fördelnings tabell?
Information om SAT-informationen när du kör de verktyg som används av Dell EMC support, fastställer vilken kund LUN/MLU som den icke-specifika sektorn ligger i. Detta visar även om problemet finns i data utrymmet eller i metadata-rymden för kundens LUN.
Affected Products
VNX1 SeriesProducts
CLARiiON, CLARiiON CX4 Series, Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity Family, Dell EMC Unity Hybrid, VNX1 Series, VNX2 SeriesArticle Properties
Article Number: 000046044
Article Type: Solution
Last Modified: 06 Nov 2025
Version: 6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.