PowerEdge: Come risolvere i doppi errori e le lacune negli array RAID

Summary: Questo articolo fornisce informazioni su doppi errori e lacune in un array RAID e fornisce anche consigli su come risolvere il problema.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Sommario

  1. Correzione di doppi errori e lacune RAID
  2. Errori dei dati e doppi errori
  3. Lacune: cosa sono e a cosa sono dovute?
  4. Prevenzione dei problemi prima della loro insorgenza e risoluzione delle lacune dopo il loro verificarsi
  5. Video dimostrativi per creare/eliminare un array o importare/esportare una configurazione esterna
Avvertenza: La seguente procedura comporta la perdita di tutti i dati sull'array; prima di eseguirli, assicurarsi di aver completato un backup a livello di file dei dati dell'array e che la seguente procedura non influisca su altri array.  
 

Correzione di doppi errori e lacune RAID

  1. Eliminare la cache conservata (se presente)
  2. Cancellare le configurazioni esterne (se presenti)
  3. Eliminare l'array
  4. Verificare la presenza di eventuali unità guaste
  5. Ricollocare eventuali unità guaste
  6. Cancellare nuovamente qualsiasi configurazione esterna
  7. Sostituire tutte le unità guaste, incluse quelle predittive
  8. Aggiornare il firmware (controller, backplane (BP), unità) se necessario
  9. Creare l'array
  10. Eseguire un'inizializzazione completa (non un'inizializzazione rapida)
  11. In questa fase, l'array deve essere pronto per l'uso

 

Errori dei dati e doppi errori

Gli array RAID non sono immuni da errori dei dati. Il firmware del controller RAID e dei dischi rigidi contiene funzionalità volte a rilevare e correggere molti tipi di errori dei dati prima che vengano scritti su un array o su un'unità.

  • Gli errori dei dati possono essere causati da blocchi fisici danneggiati, ad esempio un "head crash" o una riduzione della capacità del piatto di memorizzare magneticamente i bit in una posizione specifica.
  • Un blocco danneggiato, detto anche indirizzo LBA (Logical Block Address) danneggiato, può essere causato anche da errori logici dei dati, come un "bit flip" o dati scritti in modo errato su un unità.
  • Gli indirizzi LBA danneggiati vengono solitamente registrati come Sense Code 3/11/0.
  • I controller RAID basati su hardware di Dell offrono funzioni come Patrol Read e Check Consistency che consentono di correggere molti scenari di errore dei dati.

L'esecuzione regolare di operazioni di Check Consistency consente di correggere i singoli errori, che si tratti di un blocco fisico danneggiato o di un errore logico dei dati.

Check Consistency ridurrà inoltre il rischio di una condizione di doppio errore in caso di ulteriori errori.

 

Errore singolo multiplo in un array RAID 5 - Array ottimale

Figura 1 Errore singolo multiplo in un array RAID 5 - Array ottimale

 

Doppio errore con un unità guasta (i dati negli stripe 1 e 2 vengono persi) - Array danneggiato.

Figura 2 Doppio errore con un unità guasta (i dati negli stripe 1 e 2 vengono persi) - Array danneggiato.

 

Stripe con lacune (i dati negli stripe 1 e 2 vengono persi a causa di una condizione di doppio errore): array ottimale.

Figura 3 Stripe con lacune (i dati negli stripe 1 e 2 vengono persi a causa di una condizione di doppio errore): array ottimale.

Torna alla tabella al contenuto

Lacune: cosa sono e a cosa sono dovute?

Una lacuna è una funzione dei controller PERC di Dell progettata per consentire al controller di ripristinare la ridondanza dell'array nonostante la perdita di dati causata da una condizione di doppio errore.

  • Una lacuna è nota anche come "ricostruzione con errori".
  • Una lacuna può verificarsi in una delle due situazioni seguenti: un doppio errore esiste già o un doppio errore non esiste.
  • Una lacuna può avvenire in tre posizioni: uno spazio vuoto, uno spazio dati non critico o uno spazio dati a cui si accede.
  • Qualsiasi condizione che generi l'inaccessibilità dei dati nello stesso stripe su più di un'unità è un doppio errore.
  • I doppi errori causano la perdita di tutti i dati all'interno dello stripe interessato.
  • Tutte le lacune sono doppi errori, ma NON tutti i doppi errori sono lacune.

 

Torna alla tabella al contenuto

Prevenzione dei problemi prima della loro insorgenza e risoluzione delle lacune dopo il loro verificarsi

La manutenzione proattiva può correggere gli errori esistenti e prevenirne l'insorgenza.

  • Aggiornare driver e firmware su controller, dischi rigidi, backplane e altri dispositivi.
  • Eseguire le operazioni di Check Consistency di routine.
  • Esaminare i registri per individuare eventuali indicazioni di problemi.
Nota: Se la verifica della coerenza viene completata senza errori, è lecito presumere che l'array sia ora integro e che la lacuna sia stata risolta. I dati possono quindi essere ripristinati sull'array integro.
 
Attenzione: Se esiste una condizione di doppio errore o lacuna, nota o sospetta, attenersi alla seguente procedura per ridurre al minimo il rischio di problemi più gravi:
  • Eseguire una verifica di coerenza di routine (l'array deve essere in stato ottimale)
  • Determinare se esistono problemi di hardware
  • Verificare il registro del controller
  • Eseguire una diagnostica dell'hardware
  • Contattare il supporto tecnico Dell se necessario
Nota: Dopo aver eseguito queste operazioni, possono sussistere ulteriori problemi. Le lacune possono indurre nel tempo uno stato di errore previsto dei dischi rigidi. Gli errori dei dati che vengono propagati a un'unità verranno registrati come errori dei supporti sull'unità, anche se non esistono problemi hardware.
 
Nota: Il monitoraggio del sistema consente di rilevare e correggere i problemi in modo tempestivo, riducendo anche il rischio di problemi più gravi.

Torna alla tabella al contenuto

 

Video dimostrativi per creare/eliminare un array o importare/esportare una configurazione esterna

 

Come creare o eliminare un disco virtuale in iDRAC 9

Durata: 00:01:53
Se disponibili, è possibile scegliere le impostazioni della lingua dei sottotitoli (sottotitoli) utilizzando l'icona CC su questo lettore video.

 

Come importare la configurazione esterna per Dell PERC

Durata: 00:02:07
Se disponibili, è possibile scegliere le impostazioni della lingua dei sottotitoli (sottotitoli) utilizzando l'icona CC su questo lettore video.

Come cancellare la configurazione esterna per Dell PERC

Durata: 00:02:02
Se disponibili, è possibile scegliere le impostazioni della lingua dei sottotitoli (sottotitoli) utilizzando l'icona CC su questo lettore video.

Torna alla tabella al contenuto

Affected Products

OEMR R240, OEMR R250, OEMR R260, OEMR R340, OEMR R350, OEMR XE R350, OEMR R360, OEMR XE R360, OEMR R440, OEMR R450, OEMR R540, OEMR R550, OEMR R640, OEMR XL R640, OEMR R6415, OEMR R650, OEMR R650xs, OEMR R6515, OEMR R6525, OEMR R660, OEMR XL R660 , OEMR R660xs, OEMR R6615, OEMR R6625, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R7415, OEMR R7425, OEMR R750, OEMR R750xa, OEMR R750xs, OEMR R7515, OEMR R7525, OEMR R760, OEMR R760xa, OEMR R760XD2, OEMR XL R760, OEMR R760xs, OEMR R7615, OEMR R7625, OEMR R840, OEMR R860, OEMR R940, OEMR R940xa, OEMR R960, OEMR T340, OEMR T350, OEMR T360, OEMR T440, OEMR T550, OEMR T560, OEMR T640, OEMR XL T640, OEMR XL R240, OEMR XL R340, OEMR XL R660xs, OEMR XL R6615, OEMR XL R6625, OEMR XL R760xs, OEMR XL R7615, OEMR XL R7625, PowerEdge RAID Controller H345, PowerEdge RAID Controller H355 Front SAS, PowerEdge RAID Controller H355 Adapter SAS, PowerEdge RAID Controller H750 Adapter SAS, PowerEdge RAID Controller H755 Adapter, PowerEdge RAID Controller H755 Front SAS, PowerEdge RAID Controller H965i Adapter, Poweredge C4140, PowerEdge C6400, PowerEdge C6420, PowerEdge C6520, PowerEdge C6525, PowerEdge C6600, PowerEdge C6615, PowerEdge C6620, PowerEdge FC640, PowerEdge HS5610, PowerEdge HS5620, PowerEdge M640, PowerEdge M640 (for PE VRTX), PowerEdge MX5016s, PowerEdge MX7000, PowerEdge MX740C, PowerEdge MX750c, PowerEdge MX760c, PowerEdge MX840C, PowerEdge R240, PowerEdge R250, PowerEdge R260, PowerEdge R340, PowerEdge R350, PowerEdge R360, PowerEdge R440, PowerEdge R450, PowerEdge R540, PowerEdge R550, PowerEdge R640, PowerEdge R6415, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R660, PowerEdge R660xs, PowerEdge R6615, PowerEdge R6625, PowerEdge R670, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R7415, PowerEdge R7425, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R760, PowerEdge R760XA, PowerEdge R760xd2, PowerEdge R760xs, PowerEdge R7615, PowerEdge R7625, PowerEdge R770, PowerEdge R840, PowerEdge R860, PowerEdge R940, PowerEdge R940xa, PowerEdge R960, PowerEdge RAID Controller H330, PowerEdge RAID Controller H730P, PowerEdge RAID Controller H740P, PowerEdge RAID Controller H965e Adapter, PowerEdge T340, PowerEdge T350, PowerEdge T360, PowerEdge T440, PowerEdge T550, PowerEdge T560, PowerEdge T640 ...
Article Properties
Article Number: 000139251
Article Type: How To
Last Modified: 02 Sep 2025
Version:  11
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.