Serie MD: Md3xxx Cómo reemplazar un disco en caso de falla predictiva o inminente
Summary: En este artículo, se explica cómo reemplazar de manera segura una unidad de falla predictiva en un almacenamiento MD3xxx mediante la administración de almacenamiento en disco modular (MDSM). ...
Instructions
Introducción
En este tutorial se explica cómo reemplazar un disco en falla predictiva o inminente. Una falla predictiva es una función de las unidades de disco duro modernas (disco duro) diseñada para mejorar la confiabilidad de RAID. Una falla predictiva indica que se debe reemplazar un disco duro antes de que se produzca una falla.
Causa
Durante las operaciones normales de lectura/escritura, es posible que se produzca un error en un disco duro. La controladora identifica este error y lo repara. Estos errores también se conocen como “Bloques dañados”. Por lo tanto, el espacio de memoria en un disco duro suele ser ligeramente mayor que lo especificado. Este espacio se utiliza para reubicar o reparar los bloques dañados que ocurren durante las operaciones normales. Se asigna un umbral predeterminado de bloques dañados a un disco duro individual. Cuando se alcanza este umbral, la controladora cambia el estado del disco duro a “Predictive Fail”. El disco duro sigue funcionando; sin embargo, existe la probabilidad de que falle pronto.
Se recomienda reemplazar rápidamente un disco duro en estado de "Falla predictiva" para mantener la integridad del volumen RAID. Para reemplazar el disco duro, se puede quitar de forma segura del volumen RAID antes del reemplazo físico. Realice el proceso descrito a continuación para cambiar el estado del disco duro a Sin conexión y extraerlo de manera segura del volumen RAID.
Solución
Nota : Antes de continuar, Modular Disc Storage Manager(MDSM) debe estar instalado. MDSM se puede descargar desde el sitio de soporte. El sistema debe tener acceso al arreglo de almacenamiento.
Siga el proceso que se indica a continuación para quitar el disco duro del volumen RAID de manera segura y offline.
- Inicie MDSM y seleccione el arreglo PowerVault correspondiente.
- Verifique el arreglo correcto mediante el estado del gabinete
- Si no hay problemas con un arreglo, se muestra como "óptimo", como se muestra en la Figura 1 a continuación

- Figura 1: Vista de dispositivos de MDSM en la que se muestra el estado óptimo
- Si el arreglo tiene un disco duro en falla predictiva, el estado cambia a "Need attention"
- Haga doble clic en el arreglo para acceder al administrador de arreglos
- Verifique que no haya otras unidades faltantes o fallidas en el mismo conjunto RAID
- Haga clic en Hardware y, luego, seleccione la unidad de disco duro con falla predictiva. El estado se muestra como "Requiere atención"

- Figura 2: Sección de hardware de MDSM
- Haga clic con el botón secundario en el disco duro, seleccione Avanzado y, a continuación, Falla

- Figura 3: Menú tras hacer clic con el botón secundario en el que se muestra la opción Fail
- Escriba "Yes" para confirmar la operación de falla de la unidad
- Si hay un disco de repuesto en el arreglo, también conocido como "hot spare", deje marcada la casilla "Copiar el contenido del disco duro antes de que falle"
- Los datos del disco de falla predictiva se copian en el hot spare para evitar cualquier degradación de un RAID
- Esto se muestra a continuación en la Figura 4
- Si no hay un hot spare, desmarque la casilla "Copiar el contenido del disco físico antes de que falle"
- No intente copiar el contenido a menos que haya un hot spare disponible en el arreglo
- Intentar esto puede provocar la pérdida o corrupción de datos

- Figura 4: Cuadro de diálogo de Confirm Fail Physical Disk
- Si se utiliza la opción de copiar el contenido,
- Puede pasar algún tiempo antes de que la unidad falle y el estado cambie a "Fallido"
- El estado del disco duro cambia a "Fallido" y aparece una "X" roja junto a él
- Ahora es seguro reemplazar físicamente el disco duro