PowerEdge: ¿Por qué fallan los discos duros?

Resumen: En este artículo, se explican en detalle las diferentes razones por las que los discos duros pueden fallar.

Este artículo se aplica a Este artículo no se aplica a Este artículo no está vinculado a ningún producto específico. No se identifican todas las versiones del producto en este artículo.

Instrucciones

Figura del HDD que explica las diferentes piezas del disco duro 
 

Índice


Daños en el firmware y en la zona del firmware

Cuando el firmware de un disco duro se daña o no se puede leer, la computadora a menudo no puede interactuar correctamente con el disco duro.

Falla electrónica

Generalmente, las fallas electrónicas se relacionan con problemas en la placa controladora del disco duro. El servidor puede sufrir un pico de alimentación o una sobrecarga eléctrica que derribe la placa controladora del disco duro, lo que la hace indetectable para el BIOS.

Falla mecánica

Las fallas mecánicas, a menudo (especialmente si no se actúa a tiempo), pueden provocar una pérdida parcial y, a veces, total de los datos. Una falla mecánica se presenta de varias formas, como una falla del cabezal de lectura/escritura y problemas motores. Una de las fallas mecánicas más comunes es la falla del cabezal. Con una gravedad variable, se produce una falla del cabezal cuando los cabezales de lectura/escritura del disco duro entran en contacto, de forma momentánea o continua, con los platos del disco duro.
Una variedad de razones pueden causar un choque en la cabeza, incluido el choque físico (como la caída del disco al piso), el movimiento de la computadora, la electricidad estática, las sobrecargas de energía y la falla mecánica del cabezal de lectura/escritura.

Falla lógica

Los errores lógicos suelen ser los problemas más fáciles y difíciles de tratar. Los errores lógicos pueden variar desde cosas simples, como una entrada no válida en una tabla de asignación de archivos, hasta problemas realmente terribles, como la corrupción y la pérdida del sistema de archivos en una unidad muy fragmentada.
Los errores lógicos son diferentes a los problemas eléctricos y mecánicos anteriores, ya que generalmente no hay nada "físicamente" malo con el disco, excepto los bits de información en él.

Errores de medios

Los sectores defectuosos son áreas del disco duro que ya no se pueden leer. Con el tiempo, todas las unidades de disco duro desarrollan sectores defectuosos. El disco duro marca los sectores que se estropean y estos no se utilizan más. Pero si tiene datos que residen en sectores que se convierten en sectores defectuosos, no podrá acceder correctamente a los datos o archivos. Las condiciones de funcionamiento adversas (como altas temperaturas, vibración, etc.) pueden hacer que los discos duros desarrollen rápidamente muchos sectores defectuosos. Todos los tipos de discos duros son propensos a desarrollar sectores defectuosos “de forma natural”, pero no siempre sucede.

Entorno de la SCSI/SAS

Los discos duros de la SCSI, a menudo, se consideran unidades de alto rendimiento. Giran más rápido que las contrapartes de IDE/SATA, por lo que las velocidades de transferencia de datos suelen ser más rápidas. Por esto, las unidades de SCSI, por lo general, se encuentran en servidores que tienen que proporcionar gran cantidad de rendimiento de datos. Sin embargo, este rendimiento a menudo tiene un precio, ya que las fallas mecánicas son más probables en estas unidades.
La causa más común de fallas de varios discos en este entorno es la mala calidad de la señal en todo el bus SCSI. Una mala calidad de señal puede provocar sobrecarga del protocolo SCSI mientras intenta recuperarse de estos problemas (tiempos de espera agotados y restablecimientos del bus). A medida que el sistema está más ocupado y aumenta la demanda de datos, las acciones correctivas del protocolo de SCSI aumentan y el bus de SCSI se acerca más a la saturación. Con el tiempo, esta sobrecarga limita los anchos de banda normales de las comunicaciones de los dispositivos. Si no se borra, es posible que uno o más dispositivos SCSI no puedan responder a la controladora RAID de manera oportuna, lo que provoca que la controladora RAID marque la unidad de disco duro como offline. La instalación incorrecta de la controladora RAID en una ranura PCI, las conexiones de cables deficientes, la colocación deficiente de los discos contra el plano posterior SCSI, la instalación o el acoplamiento incorrectos de las tarjetas secundarias del plano posterior y la terminación incorrecta del bus SCSI pueden causar estos tipos de problemas de señal.

También es posible que se combinen estos tipos de fallas.

Todos los técnicos y clientes deben leer y comprender las prácticas recomendadas de mantenimiento para maximizar el tiempo de actividad y ayudar a prevenir la pérdida de datos como resultado de una falla del disco duro.

Precauciones para las fallas de disco de PowerEdge

Cuando se trata de fallas de disco en servidores PowerEdge, es esencial tomar las siguientes precauciones:

  1. Datos de respaldo: Siempre realice un respaldo de los datos cruciales antes de realizar acciones sobre los discos. Esto garantiza la seguridad de los datos en caso de que surjan más problemas.
  2. Monitorear alertas: Preste atención a las alertas predictivas de falla de la unidad (código de error PDR6) y otros códigos de error relacionados con el disco (como PDR1001 y PDR3). Estas alertas indican posibles problemas que requieren atención inmediata.
  3. Actualizaciones de firmware: Antes de reemplazar cualquier hardware, asegúrese de que el firmware de la controladora RAID y las unidades esté actualizado. Esto puede ayudar a evitar alertas falsas y mejorar la estabilidad general del sistema.
  4. Maneje las unidades con cuidado: Cuando extraiga, instale o vuelva a insertar las unidades de disco duro, evite el uso de fuerza excesiva. Esto puede flexionar el backplane y potencialmente hacer que las unidades vecinas fallen o pierdan conectividad.
  5. Compruebe las conexiones: Si una unidad se informa como fallida, vuelva a insertarla para descartar problemas de conexión. Verifique que todas las conexiones sean seguras.
  6. Revise los registros del sistema: Compruebe periódicamente los registros de iDRAC y del sistema en busca de alertas o eventos térmicos relacionados que puedan indicar problemas subyacentes.
  7. Comuníquese con el soporte: Si varias unidades informan errores o si los problemas persisten después de realizar las acciones anteriores, comuníquese con el soporte de Dell para obtener más ayuda.

Productos afectados

OEMR R240, OEMR R250, OEMR XE R250, OEMR R260, OEMR XE R260, OEMR R340, OEMR R350, OEMR XE R350, OEMR R360, OEMR XE R360, OEMR R440, PowerEdge XR2, OEMR R450, OEMR R540, OEMR R550, OEMR R5500, OEMR R640, OEMR XL R640, OEMR R6415, OEMR R650 , OEMR R650xs, OEMR R6515, OEMR R6525, OEMR R660, OEMR XL R660, OEMR R660xs, OEMR R6615, OEMR R6625, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R7415, OEMR R7425, OEMR R750, OEMR R750xa, OEMR R750xs, OEMR R7515, OEMR R7525, OEMR R760, OEMR R760xa, OEMR R760XD2, OEMR XL R760, OEMR R760xs, OEMR R7615, OEMR R7625, OEMR R840, OEMR R860, OEMR R940, OEMR R940xa, OEMR R960, OEMR T140, OEMR T150, OEMR T340, OEMR T350, OEMR T360, OEMR T440, OEMR T550, OEMR T560, OEMR T640, OEMR XL T640, OEMR XL R240, OEMR XL R340, OEMR XL R660xs, OEMR XL R6615, OEMR XL R6625, OEMR XL R760xs, OEMR XL R7615, OEMR XL R7625, OEMR XR11, OEMR XR12, OEMR XR5610, OEMR XR7620, Poweredge C4140, PowerEdge C6420, PowerEdge C6520, PowerEdge C6525, PowerEdge C6615, PowerEdge C6620, PowerEdge FC640, PowerEdge HS5610, PowerEdge HS5620, PowerEdge M640, PowerEdge M640 (for PE VRTX), PowerEdge MX740C, PowerEdge MX750c, PowerEdge MX760c, PowerEdge MX840C, PowerEdge R240, PowerEdge R250, PowerEdge R260, PowerEdge R340, PowerEdge R350, PowerEdge R360, PowerEdge R440, PowerEdge R450, PowerEdge R540, PowerEdge R550, PowerEdge R640, PowerEdge R6415, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R660, PowerEdge R660xs, PowerEdge R6615, PowerEdge R6625, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R7415, PowerEdge R7425, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R760, PowerEdge R760XA, PowerEdge R760xd2, PowerEdge R760xs, PowerEdge R7615, PowerEdge R7625, PowerEdge R840, PowerEdge R860, PowerEdge R940, PowerEdge R940xa, PowerEdge R960, PowerEdge T140, PowerEdge T150, PowerEdge T160, PowerEdge T340, PowerEdge T350, PowerEdge T360, PowerEdge T440, PowerEdge T550, PowerEdge T560, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7100, PowerEdge XE7420, PowerEdge XE7440, PowerEdge XE8545, PowerEdge XE8640, PowerEdge XE9640, PowerEdge XE9680, PowerEdge XR11, PowerEdge XR12, PowerEdge XR5610, PowerEdge XR7620, PowerFlex appliance R650, PowerFlex appliance R6525, PowerFlex appliance R660, PowerFlex appliance R6625, Powerflex appliance R750, PowerFlex appliance R760, PowerFlex appliance R7625, PowerFlex custom node, PowerFlex custom node R650, PowerFlex custom node R6525, PowerFlex custom node R660, PowerFlex custom node R6625, PowerFlex custom node R750, PowerFlex custom node R760, PowerFlex custom node R7625, PowerFlex custom node R860, PowerFlex appliance R640, PowerFlex appliance R740XD, PowerFlex appliance R7525, PowerFlex appliance R840 ...
Propiedades del artículo
Número del artículo: 000064317
Tipo de artículo: How To
Última modificación: 01 may. 2026
Versión:  7
Encuentre respuestas a sus preguntas de otros usuarios de Dell
Servicios de soporte
Compruebe si el dispositivo está cubierto por los servicios de soporte.