En este artículo, se proporcionan pasos de solución de problemas para (perforar) bloques defectuosos en HDD en servidores PowerEdge con controladoras PERC. En especial cuando no es posible realizar una copia de seguridad, la siguiente información puede ser útil para dejar una unidad virtual afectada nuevamente en un estado óptimo.
OpenManage Server Administrator (OMSA) muestra una cruz roja frente a un disco virtual (Figura 1).
Figura 1: Disco virtual con cruz roja en el estado (en el ejemplo, H800)
El registro del sistema de Windows muestra errores de bloques defectuosos (Figura 2).
Figura 2: Error de bloque defectuoso mostrado en el registro del sistema de Windows
El registro de la controladora RAID (TTYLOG) muestra errores como:
02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f
Para obtener más información acerca de la recepción de estos registros específicos, consulte nuestro artículo sobre recopilación de registros.
Los arreglos RAID no son inmunes a los errores de datos. La controladora RAID y el firmware del disco duro contienen funciones para detectar y corregir diversos tipos de errores de datos antes de que se escriban en un arreglo o una unidad. El uso de firmware desactualizado puede provocar que se escriban datos incorrectos en un arreglo o una unidad debido a que faltan las funciones de corrección de errores/manejo de errores disponibles en las versiones de firmware más recientes.
Los errores de datos también pueden deberse a bloques físicos defectuosos. Por ejemplo, esto puede ocurrir cuando el cabezal de lectura/escritura impacta al disco giratorio (conocido como "choque de cabezal"). Los bloques también se pueden dañar con el tiempo debido a la degradación de la capacidad del disco de almacenar bits de forma magnética en una ubicación específica. Generalmente, los bloques dañados debido a la degradación del disco pueden leerse correctamente. Solo se puede detectar un bloque dañado de este tipo de forma intermitente o mediante un diagnóstico extenso en las unidades.
Un bloque dañado o una dirección de bloque lógico (LBA) incorrecta, también puede deberse a errores de datos lógicos. Esto se produce cuando los datos se escriben incorrectamente en una unidad, a pesar de que se informa como una escritura correcta. Además, los datos correctos almacenados en una unidad podrían modificarse sin aviso. Un ejemplo es una "alteración de bits", lo cual puede ocurrir cuando el cabezal de lectura/escritura pasa por encima de una ubicación cercana o escribe en dicha ubicación y hace que los datos, en forma de unos y ceros, cambien a un valor diferente. Esta condición hace que se dañe la "consistencia" de los datos. El valor de los datos en un bloque específico es diferente de los datos originales y es posible que ya no coincida con la suma de comprobación de los datos. La LBA física está en buen estado y se puede escribir en ella correctamente, pero actualmente contiene datos incorrectos y puede interpretarse como un bloque defectuoso.
Para obtener más información, lea nuestro artículo sobre fallas dobles y perforaciones en arreglos RAID.
Cree una copia de seguridad de datos validada a nivel de archivo
Asegúrese de que se reemplacen todas las unidades con fallas que muestran fallas predictivas
Elimine y vuelva a crear el disco virtual
Realice una inicialización completa del VD
Realice una verificación de consistencia en el nuevo VD creado
Los datos ahora se pueden restaurar a los datos en el VD en buenas condiciones
Recomendación: Actualice todo el firmware de los discos duros a la versión más reciente
OMSA proporciona la capacidad de eliminar las advertencias de bloques defectuosos. Para borrar los bloques defectuosos, se recomienda el siguiente procedimiento:
Cuando realice una copia de seguridad del disco virtual con la opción Verify (Verificar), pueden presentarse dos situaciones:
Ejecute una lectura de inspección (en Virtual Disk Tasks [Tareas del disco virtual] en OMSA) y verifique el registro de eventos del sistema para asegurarse de que no se encuentren nuevos bloques defectuosos. Si aún existen bloques defectuosos, continúe con el siguiente paso. Si no es así, se borrará la condición.
Para eliminar estos bloques defectuosos, ejecute la tarea Clear Virtual Disk Bad Blocks (Borrar bloques defectuosos del disco virtual). Esto se puede realizar en la GUI de OMSA o utilice el comando de CLI:
omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id
omreport storage controller
para visualizar los ID de los controladores y, luego, escriba omreport storage vdisk controller=ID
para visualizar los ID de los discos virtuales