Sistemas Data Domain con las versiones 7.7.1.0, 7.7.2.0, 7.8.0.0 y 7.8.0.10. Posible problema de pérdida de datos cuando se escriben respaldos mientras se ejecuta el ciclo de limpieza
Summary: Los sistemas de Data Domain (DDR, DDVE y DDVE en la nube) que ejecutan las versiones de DDOS 7.7.1.0, 7.7.2.0, 7.8.0.0 y 7.8.0.10 pueden experimentar un posible problema de pérdida de datos cuando se escriben respaldos mientras se ejecuta la limpieza debido a una condición de carrera poco frecuente. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Los datos se pueden eliminar del sistema de forma incorrecta durante el ciclo de limpieza. El respaldo ya no se puede volver a leer por completo. Cuando se produce este problema, el restaurador de Data Domain (DDR) puede presentar uno o más de los siguientes síntomas:
- Alerta publicada que indica que se encontraron daños en el disco:
Id Post Time Severity Class Object Message
----- ------------------------ -------- ---------- ----------- ------------------------------------------------------------------
m0-32 Wed Jun 29 05:19:16 2022 CRITICAL Filesystem Tier=Active EVT-FILESYS-00020: Corruption has been detected in the filesystem.
- Reinicios no planificados del sistema de archivos de Data Domain (DDFS) si el archivo afectado es leído por la restauración, la replicación, la transferencia de datos a la nube o el ciclo de limpieza.
ALCANCE DEL IMPACTO
- Sistemas potencialmente afectados: DDR, DDVE, sistemas DDVE en la nube que ejecutan las versiones de DDOS 7.7.1.0, 7.7.2.0, 7.8.0.0, 7.8.0.10. Los sistemas que ejecutan cualquier otra versión de DDOS no se ven afectados.
- Los respaldos existentes que se escriben en cualquier versión anterior de DDOS no se ven afectados.
- Los respaldos organizados en niveles en la nube mediante transferencia de datos no se ven afectados.
- Si la verificación de archivos verificó los respaldos más allá del último tiempo de finalización de la limpieza y no se publica ninguna alerta de “Corruption Detected”, esto válida que no hay respaldos afectados.
- Si todos los respaldos se replican con éxito, esto implica que el Data Domain de origen de la replicación no se ve afectado.
Cause
El problema se produce debido a una condición de carrera poco frecuente.
Resolution
Este problema se corrige en DDOS 7.7.1.10, 7.7.2.10, 7.8.0.20 y versiones posteriores.
Elija entre las versiones actuales disponibles en el portal de descarga para incorporar correcciones adicionales y las vulnerabilidades de seguridad más recientes.
Siga ambas secciones a continuación:
(I) Cómo evitar la posibilidad de que nuevos respaldos se vean afectados
(II) Verificación y corrección de la integridad de los datos.
(I) Cómo evitar la posibilidad de que nuevos respaldos se vean afectados
La acción recomendada es instalar una versión de DDOS que contenga la corrección para este problema. Si se instala la versión de DDOS con la corrección, no es necesario realizar ninguna otra acción en esta sección (I).
O
Si la versión de DDOS con la corrección no se puede instalar de inmediato, continúe con (I):
Ejemplo:
(II)Verificación y corrección de la integridad de datos
La arquitectura de Data Domain garantiza que se verifique la integridad de todos los respaldos que se escriben. Si la verificación falla en algún respaldo, se publica una alerta. El registro de fecha y hora Last Verified del archivo indica la fecha y hora hasta la que se han verificado todos los archivos. Si el registro de “Last Verified Timestamp” es posterior al último ciclo de limpieza Y no hay una alerta de “Corruption Detected”, esto valida que ningún respaldo resultó afectado.
Elija entre las versiones actuales disponibles en el portal de descarga para incorporar correcciones adicionales y las vulnerabilidades de seguridad más recientes.
Siga ambas secciones a continuación:
(I) Cómo evitar la posibilidad de que nuevos respaldos se vean afectados
(II) Verificación y corrección de la integridad de los datos.
(I) Cómo evitar la posibilidad de que nuevos respaldos se vean afectados
La acción recomendada es instalar una versión de DDOS que contenga la corrección para este problema. Si se instala la versión de DDOS con la corrección, no es necesario realizar ninguna otra acción en esta sección (I).
O
Si la versión de DDOS con la corrección no se puede instalar de inmediato, continúe con (I):
1. Deshabilite el programa de limpieza.
2. Si se debe ejecutar la limpieza para aliviar el problema de capacidad, deshabilite toda ingesta antes de iniciar la limpieza.
# filesys clean set schedule never Filesystem cleaning is scheduled to run "never". Stop current Clean cycle if running # filesys clean status Cleaning started at 2022/06/27 12:32:03: phase 4 of 6 (pre-select) 8.7% complete, 438 GiB free; time: phase 0:00:01, total 0:10:35 # filesys clean stop The 'filesys clean stop' command stops the filesystem cleaning. Are you sure? (yes|no) [no]: yes ok, proceeding.
2. Si se debe ejecutar la limpieza para aliviar el problema de capacidad, deshabilite toda ingesta antes de iniciar la limpieza.
2a. Deshabilite los respaldos o la clonación desde la aplicación de respaldo.
2b. Deshabilite los protocolos en DataDomain.
2b. Deshabilite los protocolos en DataDomain.
# replication disable all # nfs disable # cifs disable # ddboost disable # vtl disable
2c. Ejecute la limpieza y el monitoreo de la siguiente manera:
2d. Una vez que se inicia la fase 2 de la limpieza (preanálisis), vuelva a activar la programación y los protocolos de respaldo.
# filesys clean start Active tier cleaning started. Use 'filesys clean watch' to monitor progress. # filesys clean watch Beginning 'filesys clean' monitoring. Use Control-C to stop monitoring. Cleaning: phase 1 of 6 (pre-merge) 100.0% complete, 438 GiB free; time: phase 0:00:42, total 0:00:42- Cleaning: phase 2 of 6 (pre-analysis) 3.3% complete, 438 GiB free; time: phase 0:00:16, total 0:00:59
2d. Una vez que se inicia la fase 2 de la limpieza (preanálisis), vuelva a activar la programación y los protocolos de respaldo.
# replication enable all # nfs enable # cifs enable # ddboost enable # vtl enable
NOTA: Una vez que la versión de DDOS con corrección esté instalada, asegúrese de restablecer el programa de limpieza.
Ejemplo:
# filesys clean set schedule Tue,0600
(II)Verificación y corrección de la integridad de datos
La arquitectura de Data Domain garantiza que se verifique la integridad de todos los respaldos que se escriben. Si la verificación falla en algún respaldo, se publica una alerta. El registro de fecha y hora Last Verified del archivo indica la fecha y hora hasta la que se han verificado todos los archivos. Si el registro de “Last Verified Timestamp” es posterior al último ciclo de limpieza Y no hay una alerta de “Corruption Detected”, esto valida que ningún respaldo resultó afectado.
1. Compruebe si hay una alerta de integridad de datos publicada:
La alerta se ve de la siguiente manera:
Si se observa una alerta de integridad de datos, comuníquese de inmediato con el servicio al cliente de Dell Technologies.
CRITICAL Filesystem Tier=Active EVT-FILESYS-00020: Corruption has been detected in the filesystem. Check for current alerts with the command below: # alerts show current
Si se observa una alerta de integridad de datos, comuníquese de inmediato con el servicio al cliente de Dell Technologies.
2. Si no se publica ninguna alerta de integridad de datos, compruebe la hora de finalización de la última limpieza y el registro de fecha y hora de verificación de archivos.
2a. Compruebe la hora de la última ejecución de limpieza:
# filesys clean status Cleaning finished at 2022/06/24 16:36:01.
2b. Compruebe el registro de fecha y hora de la verificación de archivos (FV):
Ingrese al Modo SE:
# priv set se Enter system password: <Enter Serial Num> # se grep "Last Verified file timestamp:" /ddr/var/support/autosupport Last Verified file timestamp: Sat Jun 25 23:00:22 2022 Verify threads running: 1
- Si el registro de fecha y hora de la verificación de archivos (FV) es posterior a la fecha y hora del último ciclo de limpieza, esto válida que ningún respaldo resultó afectado.
- Si el registro de fecha y hora de la FV está atrasado en la fecha y hora del último ciclo de limpieza por una semana o menos, espere a que se actualice y vuelva a verificarlo.
NOTA: El registro de fecha y hora de la FV que se encuentra atrasado no indica un problema de integridad de datos. Solo significa que los archivos escritos después de la fecha de registro de fecha y hora de la FV aún no se han verificado).
- Para cualquier sistema que ejecute una versión de DDOS afectada (también para cualquier sistema que se haya actualizado de forma reciente a la versión corregida), si el registro de fecha y hora de la FV se atrasa más de una semana (o no se puede determinar), comuníquese con el servicio al cliente de Dell Technologies a fin de obtener ayuda con la validación de los datos.
Article Properties
Article Number: 000200905
Article Type: Solution
Last Modified: 11 Dec 2023
Version: 10
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.