PowerEdge: Come risolvere i doppi errori e le lacune negli array RAID
Summary: Questo articolo fornisce informazioni su doppi errori e lacune in un array RAID e fornisce anche consigli su come risolvere il problema.
Instructions
Sommario
- Correzione di doppi errori e lacune RAID
- Errori dei dati e doppi errori
- Lacune: cosa sono e a cosa sono dovute?
- Prevenzione dei problemi prima della loro insorgenza e risoluzione delle lacune dopo il loro verificarsi
- Video dimostrativi per creare/eliminare un array o importare/esportare una configurazione esterna
Correzione di doppi errori e lacune RAID
- Eliminare la cache conservata (se presente)
- Cancellare le configurazioni esterne (se presenti)
- Eliminare l'array
- Verificare la presenza di eventuali unità guaste
- Ricollocare eventuali unità guaste
- Cancellare nuovamente qualsiasi configurazione esterna
- Sostituire tutte le unità guaste, incluse quelle predittive
- Aggiornare il firmware (controller, backplane (BP), unità) se necessario
- Creare l'array
- Eseguire un'inizializzazione completa (non un'inizializzazione rapida)
- In questa fase, l'array deve essere pronto per l'uso
Errori dei dati e doppi errori
Gli array RAID non sono immuni da errori dei dati. Il firmware del controller RAID e dei dischi rigidi contiene funzionalità volte a rilevare e correggere molti tipi di errori dei dati prima che vengano scritti su un array o su un'unità.
- Gli errori dei dati possono essere causati da blocchi fisici danneggiati, ad esempio un "head crash" o una riduzione della capacità del piatto di memorizzare magneticamente i bit in una posizione specifica.
- Un blocco danneggiato, detto anche indirizzo LBA (Logical Block Address) danneggiato, può essere causato anche da errori logici dei dati, come un "bit flip" o dati scritti in modo errato su un unità.
- Gli indirizzi LBA danneggiati vengono solitamente registrati come Sense Code 3/11/0.
- I controller RAID basati su hardware di Dell offrono funzioni come Patrol Read e Check Consistency che consentono di correggere molti scenari di errore dei dati.
L'esecuzione regolare di operazioni di Check Consistency consente di correggere i singoli errori, che si tratti di un blocco fisico danneggiato o di un errore logico dei dati.
Check Consistency ridurrà inoltre il rischio di una condizione di doppio errore in caso di ulteriori errori.

Figura 1 Errore singolo multiplo in un array RAID 5 - Array ottimale

Figura 2 Doppio errore con un unità guasta (i dati negli stripe 1 e 2 vengono persi) - Array danneggiato.

Figura 3 Stripe con lacune (i dati negli stripe 1 e 2 vengono persi a causa di una condizione di doppio errore): array ottimale.
Torna alla tabella al contenuto
Lacune: cosa sono e a cosa sono dovute?
Una lacuna è una funzione dei controller PERC di Dell progettata per consentire al controller di ripristinare la ridondanza dell'array nonostante la perdita di dati causata da una condizione di doppio errore.
- Una lacuna è nota anche come "ricostruzione con errori".
- Una lacuna può verificarsi in una delle due situazioni seguenti: un doppio errore esiste già o un doppio errore non esiste.
- Una lacuna può avvenire in tre posizioni: uno spazio vuoto, uno spazio dati non critico o uno spazio dati a cui si accede.
- Qualsiasi condizione che generi l'inaccessibilità dei dati nello stesso stripe su più di un'unità è un doppio errore.
- I doppi errori causano la perdita di tutti i dati all'interno dello stripe interessato.
- Tutte le lacune sono doppi errori, ma NON tutti i doppi errori sono lacune.
Torna alla tabella al contenuto
Prevenzione dei problemi prima della loro insorgenza e risoluzione delle lacune dopo il loro verificarsi
La manutenzione proattiva può correggere gli errori esistenti e prevenirne l'insorgenza.
- Aggiornare driver e firmware su controller, dischi rigidi, backplane e altri dispositivi.
- Eseguire le operazioni di Check Consistency di routine.
- Esaminare i registri per individuare eventuali indicazioni di problemi.
- Eseguire una verifica di coerenza di routine (l'array deve essere in stato ottimale)
- Determinare se esistono problemi di hardware
- Verificare il registro del controller
- Eseguire una diagnostica dell'hardware
- Contattare il supporto tecnico Dell se necessario
Torna alla tabella al contenuto
Video dimostrativi per creare/eliminare un array o importare/esportare una configurazione esterna
Come creare o eliminare un disco virtuale in iDRAC 9
Durata: 00:01:53
Se disponibili, è possibile scegliere le impostazioni della lingua dei sottotitoli (sottotitoli) utilizzando l'icona CC su questo lettore video.
Come importare la configurazione esterna per Dell PERC
Durata: 00:02:07
Se disponibili, è possibile scegliere le impostazioni della lingua dei sottotitoli (sottotitoli) utilizzando l'icona CC su questo lettore video.
Come cancellare la configurazione esterna per Dell PERC
Durata: 00:02:02
Se disponibili, è possibile scegliere le impostazioni della lingua dei sottotitoli (sottotitoli) utilizzando l'icona CC su questo lettore video.