Serie MD: Md3xxx Come sostituire un disco in caso di errore predittivo o imminente
Summary: Questo articolo illustra come sostituire in modo sicuro un'unità con guasto previsto in uno storage MD3xxx utilizzando Modular Disk Storage Management (MDSM).
Instructions
Introduzione
Nella presente esercitazione viene spiegato come sostituire un disco in caso di errore predittivo o imminente. Un errore predittivo è una funzione delle moderne unità disco rigido (disco rigido) progettate per migliorare l'affidabilità RAID. Un errore predittivo indica che è necessario sostituire un disco rigido prima che si verifichi un errore.
Causa
Durante le normali operazioni di lettura/scrittura, è possibile che si verifichi occasionalmente un errore su un disco rigido. Il controller identifica questo errore e lo ripara. Questi errori sono noti anche come "blocchi danneggiati". Questo è il motivo per cui lo spazio della memoria su un disco rigido è in genere leggermente maggiore di quanto specificato. Questo spazio viene utilizzato per spostare o ripristinare eventuali blocchi danneggiati che si verificano durante le normali operazioni. A un singolo disco rigido viene assegnata una soglia prestabilita per i blocchi danneggiati. Al raggiungimento di tale soglia, il controller modifica lo stato del disco rigido in "Predictive Fail". Il disco rigido rimane operativo, tuttavia, la probabilità che il disco rigido si guasti presto.
Si consiglia di sostituire immediatamente un disco rigido in stato "Predictive Fail" per mantenere l'integrità del volume RAID. Per sostituire il disco rigido, è possibile rimuoverlo in modo sicuro dal volume RAID prima della sostituzione fisica. Seguire il processo descritto di seguito per modificare lo stato del disco rigido su offline e rimuoverlo in modo sicuro dal volume RAID.
Soluzione
Nota: Prima di procedere, è necessario installare Modular Disc Storage Manager(MDSM). MDSM può essere scaricato dal sito del supporto. Il sistema deve avere accesso all'array di storage.
Seguire la procedura riportata di seguito per rimuovere in modo sicuro e offline il disco rigido dal volume RAID.
- Avviare MDSM e selezionare l'array PowerVault corrispondente.
- Verificare l'array corretto utilizzando lo stato dell'enclosure
- Se non ci sono problemi con un array, viene visualizzato come "Optimal", come mostrato nella Figura 1 riportata di seguito

- Figura 1. Vista dei dispositivi MDSM che mostra lo stato ottimale
- Se l'array ha un disco rigido in stato di errore previsto, lo stato cambia in "Need attention"
- Cliccare due volte sull'array per accedere all'array manager
- Verificare che non vi siano altre unità mancanti o guaste nello stesso set RAID
- Cliccare su Hardware, quindi selezionare il disco rigido in errore predittivo. Lo stato diventa "Need attention"

- Figura 2. Sezione hardware di MDSM
- Cliccare con il pulsante destro del mouse sul disco rigido e selezionare Avanzate, quindi Fallire

- Figura 3. Menu di scelta rapida che mostra l'opzione Fail
- Confermare l'operazione di guasto dell'unità digitando "Yes"
- Se nell'array è presente un disco di riserva, detto anche "hot-spare", lasciare selezionata la casella "Copia il contenuto del disco rigido prima di guastarsi"
- I dati del disco con guasto previsto vengono copiati nell'hot-spare, per evitare qualsiasi riduzione di un RAID
- Questo è illustrato di seguito nella Figura 4
- Se non è presente alcun hot-spare, deselezionare la casella "Copy contents of physical disk before failing"
- Non tentare di copiare i contenuti a meno che non sia disponibile un hot-spare nell'array
- Se si tenta di eseguire questa operazione, potrebbero verificarsi perdite o danneggiamenti dei dati

- Figura 4. Confermare la finestra di dialogo Disco fisico guasto
- Se si utilizza l'opzione per copiare il contenuto,
- Potrebbe essere necessario un po' di tempo prima che l'unità si guasti e lo stato cambi in "Failed"
- Lo stato del disco rigido cambia in "Failed" e presenta una "X" rossa accanto ad esso
- Ora è possibile sostituire fisicamente il disco rigido in modo sicuro