Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Omgaan met Puncturing (Bad Blocks) op virtuele schijven voor PowerEdge servers

Summary: stappen voor probleemoplossing van slechte blokken (punctures) op HDD's in PowerEdge servers met PERC-controllers. Vooral wanneer er geen back-up mogelijk is, kan de volgende informatie helpen een aangetaste virtuele schijf terug te brengen naar een optimale status. ...

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

-

Cause

-

Resolution

Dit artikel bevat stappen voor probleemoplossing voor (puncturing) slechte blokken op HDD's in PowerEdge servers met PERC-controllers. Vooral wanneer er geen back-up mogelijk is, kan de volgende informatie helpen een aangetaste virtuele schijf terug te brengen naar een optimale status.



Inhoudsopgave:

  1. Omschrijving storing

  2. Wat is de oorzaak?

  3. Stappen om het probleem op te lossen

  4. Aanvullende informatie


 



1. Omschrijving storing

 

Fout nr. 1:


De OpenManage Server Administrator (OMSA) toont een rood kruisje voor een virtuele schijf (afbeelding 1).  

SLN111146_en_US__11343098652871.1
Afbeelding 1: Virtuele schijf met rood kruis in status (voorbeeld H800)

SLN111146_en_US__2icon Opmerking: Dell OpenManage Server Administrator (OMSA) biedt een complete, één-op-één oplossing voor systeembeheer. OMSA kan worden gecategoriseerd in twee applicaties:
- Geïntegreerd - Web browser-based Graphical User Interface (GUI) - Command
Line Interface (CLI) - Via het besturingssysteem


 


Fout nr. 2:


In het Windows-systeemlogboek worden beschadigde blok-fouten weergegeven (afbeelding 2).  

SLN111146_en_US__31343098674763.2 
Afbeelding 2: Fout met slechte blokkering in Windows-systeemlogboek weergegeven
 


 


Fout nr. 3:


Het RAID-controllerlogboek (TTYLOG) toont fouten zoals:  

02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f

Waarschuwing: Het controllerlogboek (TTYLOG) geeft mogelijk geen fouten weer.

Meer informatie over het ontvangen van deze specifieke logbestanden vindt u in ons artikel over het verzamelen van logbestanden.
 



2. Wat is de oorzaak?


RAID-arrays zijn niet immuun voor datafouten.  Firmware voor RAID-controllers en harde schijven bevatten functionaliteit waarmee verschillende soorten datafouten kunnen worden gedetecteerd en gecorrigeerd voordat ze naar een array/schijf worden geschreven.  Het gebruik van verouderde firmware kan ertoe leiden dat onjuiste data naar een array/schijf worden geschreven omdat de functies voor foutafhandeling/foutcorrectie die beschikbaar zijn in de nieuwste firmwareversies ontbreken.
Datafouten kunnen ook worden veroorzaakt door fysieke slechte blokken.  Dit kan bijvoorbeeld gebeuren wanneer de lees-/schrijfkop het draaiplateau raakt (ook wel 'head crash' genoemd).  Blokken kunnen na een tijdje verslechteren doordat het plateau op een specifieke locatie minder goed bits magnetisch kan opslaan.  Slechte blokken als gevolg van een minder goed functionerend plateau kunnen vaak wel gelezen worden.  Zo'n slecht blok kan alleen af en toe of via een uitgebreide diagnose op de schijven worden gedetecteerd.  

Een slecht blok, ook wel een slecht logisch blokadres (LBA) genoemd, kan ook door logische datafouten worden veroorzaakt.  Dit gebeurt wanneer data verkeerd naar een schijf worden geschreven terwijl dit wel als juist wordt gerapporteerd.  Daarnaast kunnen goede data op een schijf per ongeluk worden gewijzigd.  Een voorbeeld hiervan is 'bitmanipulatie' die kan optreden wanneer de lees-/schrijfkop overgaat of schrijft naar een nabijgelegen locatie waardoor data, bestaande uit nullen en enen, een andere waarde krijgen.  Hierdoor wordt de 'consistentie' van de data beschadigd.  De waarde van de data op een specifiek blok wijkt af van de oorspronkelijke data en komt niet meer overeen met de checksum van de data.  De fysieke LBA is goed en kan met succes worden geschreven, maar bevat momenteel onjuiste data en kan worden geïnterpreteerd als een slecht blok.

Lees ons artikel over dubbele storingen en punctures in RAID-arraysvoor meer informatie.
 



3. Stappen om het probleem op te lossen:
 

SLN111146_en_US__2icon Opmerking: Huidige data op de virtuele schijf zijn beschadigd en moeten worden verwijderd
  1. Een gevalideerde databack-up maken op bestandsniveau
     

    • Een back-up op basis van blokken zou het probleem verschuiven
    • Een back-up op bestandsniveau geeft beschadigde bestanden aan (deze bestanden zouden niet meegenomen moeten worden in een back-up)
    • Er is nooit een garantie van 100% voor het behouden van alle data, als er reeds een ‘puncture stripe’ aanwezig is
     

     

  2. Ervoor zorgen dat alle defecte schijven met voorspellende fouten worden vervangen
     

  3. De virtuele schijf verwijderen en opnieuw maken
     

    • Met deze stap worden alle data verwijderd van de virtuele schijf
    • Verwijder de array
    • Stel de array desgewenst opnieuw samen
     

     

  4. Voer een volledige initialisatie van de virtuele schijf uit
     

    • Ervoor zorgen dat er geen snelle initialisatie wordt gekozen
    • Alleen een volledige (= langzame) initialisatie lost het probleem op
     

     

  5. Controleer de consistentie op de nieuwe gemaakte virtuele schijf
     

    • Als consistentiecontrole geen fouten oplevert, kunt u ervan uitgaan dat de array in goede staat is en de puncture is verwijderd
     

     

  6. Data kan nu naar de gezonde virtuele schijf hersteld worden
     

  7. Aanbeveling: Upgrade alle firmware van de harde schijf naar de nieuwste versie
     



4. Aanvullende informatie

OMSA biedt de mogelijkheid om de waarschuwingen voor slechte blokken te wissen. Als u slechte blokken wilt wissen, wordt de volgende procedure aanbevolen:

  • Wanneer een back-up van de virtuele schijf wordt uitgevoerd terwijl de optie verifiëren is geselecteerd, kunnen er twee scenario's optreden:

    • De back-upbewerking mislukt op een of meer bestanden. In dit geval herstelt u het bestand van een eerdere back-up. Nadat het bestand is hersteld, gaat u verder naar de volgende stap.
    • De back-upbewerking wordt zonder fouten voltooid. Dit geeft aan dat er geen slechte blokken zijn op het geschreven gedeelte van uw virtuele schijf.
    SLN111146_en_US__2icon Opmerking: Als u nog steeds slechte blokwaarschuwingen ontvangt, bevinden de beschadigde blokken zich in een niet-datagebied.

     
  • Voer Patrol Read uit (onder Virtual Disk Tasks in OMSA) en controleer het systeemlogboek om er zeker van te zijn dat er geen nieuwe beschadigde blokken worden gevonden. Als er nog steeds slechte blokken zijn, gaat u verder naar de volgende stap. Als dit niet het geval is, wordt de voorwaarde gewist.

    SLN111146_en_US__2icon Opmerking: De geautomatiseerde Patrol Read moet worden gedeactiveerd voordat de optie om deze actie handmatig uit te voeren in OMSA wordt weergegeven.

     
  • Om deze slechte blokken te wissen, voert u de taak Clear Virtual Disk Bad Blocks uit. Dit kan worden gedaan in de OMSA GUI of gebruik de CLI-opdracht:
    omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id

    SLN111146_en_US__2icon Opmerking: Voor het verkrijgen van de waarden voor controller-ID en virtuele schijf-ID typt u omreport storage controller om de controller-ID's weer te geven en typt u vervolgens omreport storage vdisk controller=ID om de ID's voor de virtuele schijven weer te geven

     

Article Properties


Affected Product

Servers

Last Published Date

01 Oct 2021

Version

3

Article Type

Solution