Data Domain: Cómo resolver problemas relacionados con la alta utilización de espacio o la falta de capacidad disponible en los restauradores de Data Domain (DDR)

Содержание

Подробная статья

Симптомы

Причина

Разрешение

Дополнительные сведения

Затронутые продукты

Оставить отзыв

Сводка: Este artículo contiene un procedimiento paso a paso para ayudar a resolver problemas relacionados con la gran utilización del espacio o la falta de capacidad disponible en los restauradores de Data Domain (DDR). ...

Данная статья применяется к Данная статья не применяется к Эта статья не привязана к какому-либо конкретному продукту. В этой статье указаны не все версии продуктов.

Ознакомьтесь с другими ресурсами

Симптомы

Todos los restauradores de Data Domain (DDR) contienen un grupo o área de almacenamiento que se conoce como el “nivel activo”:

Este es el área del disco en el que residen los datos o archivos recientemente recopilados y, en la mayoría de los archivos de DDR, permanecen aquí hasta que caduca o es eliminada por una aplicación de copia de seguridad del cliente.
En DDR configurados con retención extendida (ER) o retención a largo plazo (LTR), el proceso de transferencia de datos se puede ejecutar periódicamente para migrar archivos antiguos desde el nivel activo a los niveles de archivo o de nube.
La única forma de recuperar espacio en el nivel activo que utilizó los archivos eliminados o migrados es mediante la ejecución del proceso de limpieza o recolección de elementos no utilizados (GC).

La utilización actual del nivel activo se puede mostrar a través de los comandos “filesys show Space” o “DF”:

# df

Active Tier:
Resource Size GiB Used GiB Avail GiB Use% Cleanable GiB*
---------------- -------- -------- --------- ---- --------------
/data: pre-comp - 33098.9 - - -
/data: post-comp 65460.3 518.7 64941.6 1% 0.0
/ddvar 29.5 19.7 8.3 70% -
/ddvar/core 31.5 0.2 29.7 1% -
---------------- -------- -------- --------- ---- --------------

Tenga en cuenta que, si está configurado, los detalles de los niveles de archivo o nube se mostrarán debajo del nivel activo.

El uso del nivel activo se debe administrar con cuidado; de lo contrario, es posible que ocurra lo siguiente:

Es posible que el nivel activo comience a quedarse sin espacio disponible, lo que provoca que se muestren alertas o mensajes como los siguientes:

EVT-SPACE-00004: Space usage in Data Collection has exceeded 95% threshold.

Si el nivel activo llega a llenarse al 100 %, no se podrá escribir ningún dato nuevo en el DDR, lo cual puede causar que fallen las copias de seguridad y la replicación: en este escenario, se pueden mostrar alertas o mensajes como los siguientes:

CRITICAL: MSG-CM-00002: /../vpart:/vol1/col1/cp1/cset: Container set [container set ID] out of space

En algunas circunstancias, que el nivel activo se llene puede provocar que el sistema de archivos de Data Domain (DDFS) sea de solo lectura, estado en el cual no se pueden eliminar los archivos existentes.

En este artículo de la base de conocimientos se intenta:

explicar por qué el nivel activo puede llenarse;
describir un conjunto simple de comprobaciones que se pueden realizar para determinar la causa de la alta utilización del nivel activo y los pasos correctivos correspondientes.

Tenga en cuenta la siguiente información:

Este artículo no es exhaustivo (es decir, es posible que exista una pequeña cantidad de situaciones en las que el nivel activo de un DDR esté altamente utilizado o lleno por una razón que no se analice en este documento), sin embargo, su objetivo es abarcar las causas y los problemas más comunes.
En este artículo, no se abarca la alta utilización de los niveles de archivo o de nube.

Причина

El nivel activo de un DDR puede experimentar una utilización, mayor a la esperada por una serie de motivos:

Los savesets y archivos de copia de seguridad no han caducado ni han sido eliminados correctamente por las aplicaciones de copia de seguridad del cliente debido a una política de retención o a una configuración de aplicación de copia de seguridad incorrectas.
El retraso de la replicación que hace que una gran cantidad de datos antiguos se mantenga en el nivel activo pendiente de replicación a réplicas.
Los datos que se escriben en el nivel activo tienen una tasa de compresión general inferior a la esperada.
El tamaño del sistema no se ha ajustado correctamente; es decir, es muy pequeño para la cantidad de datos que se intenta almacenar en él.
Las copias de seguridad constan de una gran cantidad de archivos muy pequeños. Estos archivos consumen mucho más espacio del que se espera cuando se escribe inicialmente; sin embargo, este espacio debe recuperarse durante la recopilación de elementos no utilizados o la limpieza.
Transferencia de datos que no se ejecuta de forma periódica en sistemas configurados con ER/LTR que causan que los archivos antiguos que se deben migrar a los niveles de archivo y nube permanezcan en el nivel activo
La limpieza y la recopilación de elementos no utilizados no se ejecutan de forma periódica
Instantáneas de mtrees excesivas o antiguas existentes en el DDR que impidan la recuperación de espacio desde los archivos o datos eliminados

Разрешение

Paso 1: Determinar si se debe ejecutar la limpieza del nivel activo

El sistema operativo de Data Domain (DDOS) intenta mantener un contador denominado “Cleanable GiB” para el nivel activo. Esta es una estimación de la cantidad de espacio físico (post-comp) que potencialmente se podría recuperar en el nivel activo mediante la ejecución de limpieza o la recolección de elementos no utilizados. Este contador se muestra mediante los comandos "filesys show space" y "df":

Active Tier:
Resource Size GiB Used GiB Avail GiB Use% Cleanable GiB*
---------------- -------- --------- --------- ---- --------------
/data: pre-comp - 7259347.5 - - -
/data: post-comp 304690.8 251252.4 53438.5 82% 51616.1 <=== NOTE
/ddvar 29.5 12.5 15.6 44% -
---------------- -------- --------- --------- ---- --------------

Si:

El valor para "Cleanable GiB" es grande
DDFS pasó a estar en un 100 % lleno (y, por lo tanto, es de solo lectura)

Debe realizarse una limpieza y permitir que se ejecute hasta su finalización antes de continuar con los pasos que se indican en este documento. Para iniciar la limpieza, se debe utilizar el comando “filesys clean start”, es decir:

# filesys clean start
Cleaning started. Use 'filesys clean watch' to monitor progress.

Para confirmar que se inició el borrado de la manera esperada, se puede usar el comando “filesys status”, es decir:

# filesys status
The filesystem is enabled and running.
Cleaning started at 2017/05/19 18:05:58: phase 1 of 12 (pre-merge)
50.6% complete, 64942 GiB free; time: phase 0:01:05, total 0:01:05

Tenga en cuenta la siguiente información:

Si la limpieza no se puede iniciar, comuníquese con su proveedor de soporte contratado para obtener más ayuda. Esto puede indicar que el sistema detectó un "error de segmento perdido" que causa la desactivación de la limpieza.
Si la limpieza ya está en ejecución, se mostrará el siguiente mensaje cuando se intente iniciar:

**** Cleaning already in progress. Use 'filesys clean watch' to monitor progress.

Sin espacio en el nivel activo se liberará o se eliminará hasta que la limpieza alcance su fase de copia (de manera predeterminada, la fase 9 en DDOS 5.4.x y versiones anteriores, la fase 11 en DDOS 5.5.x y versiones posteriores). Para obtener más información sobre las fases utilizadas por la limpieza, consulte: https://support.emc.com/kb/446734
La limpieza no puede recuperar la cantidad de espacio indicada por "Cleanable GiB", ya que este valor es básicamente un cálculo. Para obtener más información sobre esto, consulte: https://support.emc.com/kb/485637
Es posible que la limpieza no recupere todo el espacio potencial en una sola ejecución. Esto se debe a que en los DDR que contienen conjuntos de datos muy grandes, la limpieza trabajará en la parte del sistema de archivos que contiene los datos más superfluos (es decir, a fin de ofrecer el mejor resultado de espacio libre en función del tiempo que la limpieza toma para ejecutarse). En algunos casos, es posible que sea necesario ejecutar la limpieza varias veces antes de que se recupere todo el espacio potencial.
Si el valor de "Cleanable GiB" era muy grande, esto puede indicar que la limpieza no se está ejecutando en intervalos regulares. Compruebe que se haya establecido un programa para limpieza:

# filesys clean show schedule

Si es necesario, establezca un programa de limpieza de nivel activo; por ejemplo, para ejecutarse todos los martes a las 6 a. m.:

# filesys clean set schedule Tue 0600
Filesystem cleaning is scheduled to run "Tue" at "0600".

Tenga en cuenta que, en los sistemas configurados con retención extendida (ER), la limpieza puede configurarse para ejecutarse después de que se complete la transferencia de datos y es posible que no tenga su propio programa independiente. Este escenario se describe más adelante en este documento.

Una vez que se complete la limpieza, utilice los comandos "filesys show space" y "df" para determinar si se resolvieron los problemas de utilización. Si la utilización aún es alta, proceda a realizar los pasos restantes que se indican en este artículo.

Paso 2: Comprobar si hay grandes cantidades de retraso de replicación en contraste con los contextos de replicación

La replicación nativa de Data Domain está diseñada según el concepto de "contextos de replicación". Por ejemplo, cuando se deben replicar los datos entre sistemas:

Los contextos de replicación se crean en DDR de origen y de destino.
Los contextos se inicializan.
Una vez finalizada la inicialización, la replicación enviará de forma periódica actualizaciones o deltas del origen al destino para mantener los datos de los sistemas sincronizados

Si un contexto de replicación de origen se retrasa, puede hacer que los datos antiguos se mantengan en el disco en el sistema de origen (tenga en cuenta que los contextos de replicación retrasada no pueden causar una utilización excesiva en el sistema de destino):

Contextos de replicación de directorios (se utiliza cuando se replica un solo árbol de directorio en /data/col1/backup entre sistemas):

La replicación de directorios utiliza un registro de replicación en el DDR de origen para rastrear los archivos pendientes que todavía no se han replicado en el destino.
Si un contexto de replicación de directorios está retrasado, el registro de replicación en el DDR de origen rastreará una gran cantidad de archivos que están pendientes de replicación
Incluso si se eliminan estos archivos, aunque el registro de replicación sigue haciendo referencia a ellos, la limpieza no podrá recuperar espacio en el disco utilizado por estos archivos.

Contextos de replicación de mtree (se utiliza cuando se replican mtree distintos de /data/col1/backup entre sistemas):

La replicación de mtree utiliza instantáneas creadas en los sistemas de origen y destino para determinar las diferencias entre los sistemas y, por lo tanto, qué archivos se deben enviar del origen al destino.
Si un contexto de replicación de mtree está retrasado, el mtree correspondiente puede tener instantáneas muy antiguas creadas en relación con él en los sistemas de origen y destino.
Incluso si los archivos provienen del mtree replicado en el sistema de origen, si esos archivos existían cuando se crearon instantáneas de replicación de mtree en el sistema, la limpieza no podrá recuperar espacio en el disco utilizado por estos archivos.

Contextos de replicación de recopilaciones (se utiliza cuando se replica todo el contenido de un DDR en otro sistema):

La replicación de recopilaciones lleva a cabo la replicación "basada en bloques" de todos los datos en un sistema de origen a un sistema de destino.
Si se retrasa la replicación de recopilaciones, entonces la limpieza en el sistema de origen no podrá funcionar de manera óptima; en este escenario se generará una alerta en el origen que indica que se está realizando un clean parcial para evitar el uso de la sincronización el sistema de destino
La limpieza, por lo tanto, no podrá recuperar el espacio que se espera en el DDR de origen.

Para determinar si los contextos de replicación están retrasados, se deben realizar los siguientes pasos:

Determine el nombre de host del sistema actual:

sysadmin@dd4200# hostname
The Hostname is: dd4200.ddsupport.emea

Determine la fecha y la hora en el sistema actual:

sysadmin@dd4200# date
Fri May 19 19:04:06 IST 2017

Enumere los contextos de replicación configurados en el sistema, junto con su "synced as of time". Tenga en cuenta que los contextos de interés son aquellos en los que el "destino" NO contiene el nombre de host del sistema actual (que indica que el sistema actual es el origen) y "synced as of time" es significativamente antiguo:

sysadmin@dd4200# replication status
CTX Destination Enabled Connection Sync'ed-as-of-time Tenant-Unit
--- ---------------------------------------------------------------------------------- ------- ------------ ------------------ -----------
3 mtree://dd4200.ddsupport.emea/data/col1/DFC no idle Thu Jan 8 08:58 - <=== NOT INTERESTING - CURRENT SYSTEM IS THE DESTINATION
9 mtree://BenDDVE.ddsupport.emea/data/col1/BenMtree no idle Mon Jan 25 14:48 - <=== INTERESTING - LAGGING AND CURRENT SYSTEM IS THE SOURCE
13 dir://DD2500-1.ddsupport.emea/backup/dstfolder no disconnected Thu Mar 30 17:55 - <=== INTERESTING - LAGGING AND CURRENT SYSTEM IS THE SOURCE
17 mtree://DD2500-1.ddsupport.emea/data/col1/oleary yes idle Fri May 19 18:57 - <=== NOT INTERESTING - CONTEXT IS UP TO DATE
18 mtree://dd4200.ddsupport.emea/data/col1/testfast yes idle Fri May 19 19:18 - <=== NOT INTERESTING - CONTEXT IS UP TO DATE
--- ---------------------------------------------------------------------------------- ------- ------------ ------------------ -----------

Los contextos para los cuales el sistema actual es el origen y que están mostrando un retraso o contextos significativos que ya no son necesarios se deben romper. Esto se puede realizar mediante la ejecución del siguiente comando en el sistema de origen y destino:

# replication break [destination]

Por ejemplo, para interrumpir los contextos “interesantes” que se muestran anteriormente, se ejecutarán los siguientes comandos en el origen y el destino:

(dd4200.ddsupport.emea): # replication break mtree://BenDDVE.ddsupport.emea/data/col1/BenMtree
(BenDDVE.ddsupport.emea): # replication break mtree://BenDDVE.ddsupport.emea/data/col1/BenMtree

(dd4200.ddsupport.emea): # replication break dir://DD2500-1.ddsupport.emea/backup/dstfolder
(DD2500-1.ddsupport.emea): # replication break dir://DD2500-1.ddsupport.emea/backup/dstfolder

Tenga en cuenta la siguiente información:

Una vez que se interrumpen los contextos, se debe realizar una limpieza de nivel activo para recuperar el espacio potencial en el nivel activo.
Si se utiliza replicación de mtree una vez que los contextos se interrumpan, las instantáneas de replicación de mtree pueden permanecer en disco. Asegúrese de que se siga el paso 5 luego del vencimiento de cualquier instantánea superflua antes de ejecutar la limpieza.
Si el mtree de origen/destino está configurado para migrar datos a los niveles de archivo o nube, se debe tener cuidado cuando se interrumpen los contextos de replicación de mtree correspondientes, ya que es posible que no se puedan volver a crear o inicializar nuevamente en el futuro. El motivo de esto es que, cuando un contexto de replicación de mtree se inicializa, se crea una instantánea de mtree en el sistema de origen y contiene los detalles de todos los archivos en el mtree (independientemente del nivel). Luego, esta instantánea se replica por completo en el nivel activo del destino. Como resultado, si el nivel activo del destino no tiene suficiente espacio libre para recopilar todos los datos de mtrees desde el origen, la inicialización no podrá realizarse. Para obtener más información sobre este problema, comuníquese con su proveedor de soporte contratado.
Si se interrumpe un contexto de replicación de recopilaciones, el contexto no se podrá volver a crear ni inicializar sin destruir primero la instancia de DDFS en el DDR de destino (y perder todos los datos en este sistema). Como resultado, una nueva inicialización puede ocupar un ancho de banda y un tiempo considerable, ya que todos los datos del origen se deben replicar físicamente en el destino.

Paso 3: Comprobar que ya no se requieren mtrees

El contenido de DDFS se divide lógicamente en mtrees. Es común que las aplicaciones y los clientes de copia de seguridad individuales escriban en un mtrees individual. Si se da de baja una aplicación de copia de seguridad, ya no podrá escribir datos en el DDR ni eliminarlos de él, lo cual puede dejar mtrees antiguos o superfluos en el sistema. Los datos de estos mtrees continuarán existiendo indefinidamente utilizando el espacio en disco en el DDR. Como resultado, se debe eliminar el mtrees superfluo. Por ejemplo:

Obtenga una lista de mtrees en el sistema:

# mtree list
Name Pre-Comp (GiB) Status
------------------------------------------------------------- -------------- -------
/data/col1/Budu_test 147.0 RW
/data/col1/Default 8649.8 RW
/data/col1/File_DayForward_Noida 42.0 RW/RLCE
/data/col1/labtest 1462.7 RW
/data/col1/oscar_data 0.2 RW
/data/col1/test_oscar_2 494.0 RO/RD
------------------------------------------------------------- -------------- -------

Los mtrees que ya no se requieran deben eliminarse con el comando “mtree delete”, es decir:

# mtree delete [mtree name]

Por ejemplo:

# mtree delete /data/col1/Budu_test

...
MTree "/data/col1/Budu_test" deleted successfully.

El espacio consumido en el disco por el mtree eliminado se recuperará la próxima vez que se ejecute la limpieza o la recolección de elementos no utilizados del nivel activo.

Tenga en cuenta la siguiente información:

En los mtrees que son destinos de replicación de mtree (es decir, tienen un estado de RO/RD en el resultado de la lista de mtree) se debe interrumpir el contexto de replicación correspondiente dañado antes de que se elimine el mtree.
Es posible que los mtrees que se utilizan como unidades de almacenamiento lógicas (LSU) de DDBoost o como grupos de bibliotecas de cintas virtuales (VTL) no se puedan eliminar mediante el comando “mtree delete”. Consulte la Guía de administración de Data Domain para obtener más información sobre la eliminación de dichos mtrees.
Los mtrees que están configurados para el bloqueo de retención (es decir, que tienen un estado de RLCE o RLGE) no se pueden eliminar: en lugar de archivos individuales dentro del mtree, deben revertir cualquier bloqueo de retención y eliminarse individualmente. Consulte la Guía de administración de Data Domain para obtener más información.

Paso 4: Comprobar las instantáneas de mtree antiguas o superfluas

Una instantánea de Data Domain representa una instantánea de un punto en el tiempo del mtree correspondiente. Como resultado:

La instantánea hará referencia a cualquier archivo que exista dentro del mtree cuando se cree la instantánea.
Aunque la instantánea sigue existiendo, incluso si estos archivos se retiran o eliminan, la limpieza no podrá recuperar ningún espacio físico que utilicen en el disco, ya que los datos deben permanecer en el sistema en caso de que posteriormente se acceda a la copia del archivo en la instantánea.

Para determinar si algún mtree tiene instantáneas antiguas o superfluas, se deben realizar los siguientes pasos:

Obtenga una lista de mtrees en el sistema mediante el comando “mtree list”, como se muestra en el paso 3.
Enumere las instantáneas que existen para cada mtree mediante el comando “snapshot list”:

# snapshot list mtree [nombre de mtree]

Cuando se ejecuta en un mtree sin instantáneas, se muestra lo siguiente:

# snapshot list mtree /data/col1/Default
Snapshot Information for MTree: /data/col1/Default
----------------------------------------------
No snapshots found.

Cuando se ejecuta en un mtree con instantáneas, se muestra lo siguiente:

# snapshot list mtree /data/col1/labtest
Snapshot Information for MTree: /data/col1/labtest
----------------------------------------------
Name Pre-Comp (GiB) Create Date Retain Until Status
------------------------------------ -------------- ----------------- ----------------- -------
testsnap-2016-03-31-12-00 1274.5 Mar 31 2016 12:00 Mar 26 2017 12:00 expired
testsnap-2016-05-31-12-00 1198.8 May 31 2016 12:00 May 26 2017 12:00
testsnap-2016-07-31-12-00 1301.3 Jul 31 2016 12:00 Jul 26 2017 12:00
testsnap-2016-08-31-12-00 1327.5 Aug 31 2016 12:00 Aug 26 2017 12:00
testsnap-2016-10-31-12-00 1424.9 Oct 31 2016 12:00 Oct 26 2017 13:00
testsnap-2016-12-31-12-00 1403.1 Dec 31 2016 12:00 Dec 26 2017 12:00
testsnap-2017-01-31-12-00 1421.0 Jan 31 2017 12:00 Jan 26 2018 12:00
testsnap-2017-03-31-12-00 1468.7 Mar 31 2017 12:00 Mar 26 2018 12:00
REPL-MTREE-AUTO-2017-05-11-15-18-32 1502.2 May 11 2017 15:18 May 11 2018 15:18
----------------------------------- -------------- ----------------- ----------------- -------

Donde haya instantáneas, utilice la salida de “snapshot list mtree [mtree name]” para determinar las instantáneas que:

No están “caducadas” (consulte la columna de estado)

Se crearon hace un tiempo significativo (por ejemplo, las instantáneas creadas en el 2016 de la lista anterior)

Estas instantáneas deben caducar de modo que se puedan eliminar cuando las ejecuciones de limpieza y el espacio que ocupan en el disco se hayan liberado:

# snapshot expire [snapshot name] mtree [mtree name]

Por ejemplo:

# snapshot expire testsnap-2016-05-31-12-00 mtree /data/col1/labtest
Snapshot "testsnap-2016-05-31-12-00" for mtree "/data/col1/labtest" will be retained until May 19 2017 19:31.

Si se vuelve a ejecutar el comando de lista de instantáneas, estas instantáneas ahora se mostrarán como caducadas:

# snapshot list mtree /data/col1/labtest
Snapshot Information for MTree: /data/col1/labtest
----------------------------------------------
Name Pre-Comp (GiB) Create Date Retain Until Status
------------------------------------ -------------- ----------------- ----------------- -------
testsnap-2016-03-31-12-00 1274.5 Mar 31 2016 12:00 Mar 26 2017 12:00 expired
testsnap-2016-05-31-12-00 1198.8 May 31 2016 12:00 May 26 2017 12:00 expired
testsnap-2016-07-31-12-00 1301.3 Jul 31 2016 12:00 Jul 26 2017 12:00
testsnap-2016-08-31-12-00 1327.5 Aug 31 2016 12:00 Aug 26 2017 12:00
testsnap-2016-10-31-12-00 1424.9 Oct 31 2016 12:00 Oct 26 2017 13:00
testsnap-2016-12-31-12-00 1403.1 Dec 31 2016 12:00 Dec 26 2017 12:00
testsnap-2017-01-31-12-00 1421.0 Jan 31 2017 12:00 Jan 26 2018 12:00
testsnap-2017-03-31-12-00 1468.7 Mar 31 2017 12:00 Mar 26 2018 12:00
REPL-MTREE-AUTO-2017-05-11-15-18-32 1502.2 May 11 2017 15:18 May 11 2018 15:18
----------------------------------- -------------- ----------------- ----------------- -------

Tenga en cuenta la siguiente información:

No es posible determinar cuántos datos físicos tiene una instantánea individual o un conjunto de instantáneas en el disco; el único valor para el “espacio” asociado con una instantánea es una indicación del tamaño (lógico) comprimido previamente del mtree cuando se creó la instantánea (como se muestra en el resultado anterior).
Las instantáneas que se denominan “REPL-MTREE-AUTO-YYYY-MM-DD-HH-MM-SS” se administran mediante la replicación de mtree y, en circunstancias normales, no deben caducar manualmente (la replicación caducará automáticamente estas instantáneas cuando ya no se requieran). Si esas instantáneas son extremadamente antiguas, esto indica que el contexto de replicación correspondiente probablemente muestre un retraso significativo (como se describe en el paso 2)
Las instantáneas que se denominan "REPL-MTREE-RESYNC-RESERVE-YYYY-MM-DD-HH-MM-SS" se crean mediante la replicación de mtree cuando se interrumpe un contexto de replicación de mtree. Su objetivo es que se puedan usar para evitar una resincronización completa de los datos de replicación si el contexto dañado se vuelve a crear posteriormente (por ejemplo, si el contexto se interrumpió por error). Si no se restablecerá la replicación, estos contextos pueden caducar manualmente, como se describe anteriormente
Las instantáneas vencidas continuarán existiendo en el sistema hasta que la próxima vez que se ejecute la limpieza o la recolección de elementos no utilizados, en este punto, se eliminarán físicamente y se eliminarán de los resultados de “snapshot list mtree [mtree name]”. A continuación, la limpieza puede recuperar cualquier espacio que las instantáneas estuvieran utilizando en el disco.

Paso 5: Comprobar si hay una cantidad inesperada de archivos antiguos en el sistema

Los autosoportes del DDR contienen histogramas que muestran un desglose de archivos en el DDR por antigüedad, por ejemplo:

File Distribution
-----------------
448,672 files in 5,276 directories

Count Space
----------------------------- --------------------------
Age Files % cumul% GiB % cumul%
--------- ----------- ----- ------- -------- ----- -------
1 day 7,244 1.6 1.6 4537.9 0.1 0.1
1 week 40,388 9.0 10.6 63538.2 0.8 0.8
2 weeks 47,850 10.7 21.3 84409.1 1.0 1.9
1 month 125,800 28.0 49.3 404807.0 5.0 6.9
2 months 132,802 29.6 78.9 437558.8 5.4 12.3
3 months 8,084 1.8 80.7 633906.4 7.8 20.1
6 months 5,441 1.2 81.9 1244863.9 15.3 35.4
1 year 21,439 4.8 86.7 3973612.3 49.0 84.4
> 1 year 59,624 13.3 100.0 1265083.9 15.6 100.0
--------- ----------- ----- ------- -------- ----- -------

Esto puede ser útil para determinar si hay archivos en el sistema que no hayan sido caducados o eliminados según lo previsto por la aplicación de copia de seguridad del cliente. Por ejemplo, si el sistema anterior fue escrito por una aplicación de copia de seguridad en la que el período de retención máximo para cualquier archivo era de 6 meses, es evidente inmediatamente que la aplicación de copia de seguridad no ha vencido ni elimina los archivos según lo esperado, ya que hay aproximadamente 80 000 archivos de más de 6 meses en el DDR.

Tenga en cuenta lo siguiente:

Es responsabilidad de la aplicación de copia de seguridad realizar todas las tareas de caducidad/eliminación de archivos
Un DDR nunca caducará/eliminará archivos automáticamente, a menos que la aplicación de copia de seguridad indique explícitamente que el archivo continuará existiendo en el DDR utilizando espacio indefinidamente.

Como resultado, los problemas de este tipo deben ser primero investigados por el equipo de soporte de los proveedores de la aplicación de copia de seguridad.

Si es necesario, el soporte de Data Domain puede proporcionar informes adicionales para:

Dar el nombre o la hora de modificación de todos los archivos en un DDR ordenados por antigüedad (de modo que se pueda determinar el nombre o la ubicación de los datos antiguos);
separar los histogramas de la antigüedad de los archivos en informes separados para los niveles activo, de archivo o nube (donde las funciones ER/LTR están activadas).

Para realizarlo debe hacer lo siguiente:

Recopile la evidencia como se describe en el párrafo "Recopilación de sfs_dump" de la sección de notas de este documento.
Abra una solicitud de servicio con su proveedor de soporte contratado.

Una vez que se eliminan los archivos antiguos o superfluos, se debe ejecutar la recolección de elementos no utilizados para recuperar espacio de manera física en el nivel activo

Paso 6: Comprobar si hay copias de seguridad que incluyan una gran cantidad de archivos pequeños

Debido al diseño de archivos pequeños de DDFS (básicamente, cualquier archivo que tenga un tamaño inferior a aproximadamente 10 Mb) puede consumir demasiado espacio cuando se escribe inicialmente en el DDR. Esto se debe a la arquitectura “SISL” (diseño de segmentos informados) que hace que los archivos pequeños consuman varios bloques individuales de 4,5 Mb de espacio en el disco. Por ejemplo, un archivo de 4 Kb puede consumir realmente hasta 9 Mb de espacio en el disco físico cuando se escribe inicialmente.

Posteriormente, este espacio excesivo se vuelve a producir cuando se ejecuta la limpieza o la recolección de elementos no utilizados (ya que los datos de archivos pequeños se agregan a una cantidad más pequeña de bloques de 4,5 Mb), pero pueden provocar que los modelos más pequeños de DDR muestren una utilización excesiva y que se llenen cuando se ejecutan dichas copias de seguridad.

Los autosoportes contienen histogramas de archivos desclasificados por tamaño, por ejemplo:

Count Space
----------------------------- --------------------------
Size Files % cumul% GiB % cumul%
--------- ----------- ----- ------- -------- ----- -------
1 KiB 2,957 35.8 35.8 0.0 0.0 0.0
10 KiB 1,114 13.5 49.3 0.0 0.0 0.0
100 KiB 249 3.0 52.4 0.1 0.0 0.0
500 KiB 1,069 13.0 65.3 0.3 0.0 0.0
1 MiB 113 1.4 66.7 0.1 0.0 0.0
5 MiB 446 5.4 72.1 1.3 0.0 0.0
10 MiB 220 2.7 74.8 1.9 0.0 0.0
50 MiB 1,326 16.1 90.8 33.6 0.2 0.2
100 MiB 12 0.1 91.0 0.9 0.0 0.2
500 MiB 490 5.9 96.9 162.9 0.8 1.0
1 GiB 58 0.7 97.6 15.6 0.1 1.1
5 GiB 29 0.4 98.0 87.0 0.5 1.6
10 GiB 17 0.2 98.2 322.9 1.7 3.3
50 GiB 21 0.3 98.4 1352.7 7.0 10.3
100 GiB 72 0.9 99.3 6743.0 35.1 45.5
500 GiB 58 0.7 100.0 10465.9 54.5 100.0
> 500 GiB 0 0.0 100.0 0.0 0.0 100.0
--------- ----------- ----- ------- -------- ----- -------

Si hay evidencias de copias de seguridad que escriben una gran cantidad de archivos pequeños, el sistema puede verse afectado por aumentos temporales significativos en la utilización entre cada invocación de limpieza y recolección de elementos no utilizados. En este escenario, se recomienda cambiar la metodología de copia de seguridad para incluir todos los archivos pequeños en un único archivo de mayor tamaño (por ejemplo, un archivo tar) antes de escribirlos en el DDR. Tenga en cuenta que el archivo no se debe comprimir ni cifrar (ya que esto dañará la tasa de compresión o la tasa de deduplicación de esos datos).

Paso 7: Comprobar si hay una tasa de deduplicación más baja que la prevista

El propósito principal de un DDR es la deduplicación y la compresión, además de los datos recopilados por parte del dispositivo. La relación de deduplicación/compresión depende en gran medida del caso de uso del sistema y el tipo de datos que contiene, sin embargo, en muchos casos, habrá una tasa de compresión general "esperada" en función de los resultados obtenidos a través de la realización de pruebas de concepto o u otro tipo de pruebas. Para determinar la tasa de compresión general actual del sistema (y, por lo tanto, si cumple con las expectativas), se puede usar el comando “filesys show compression”. Por ejemplo:

# filesys show compression

From: 2017-05-03 13:00 To: 2017-05-10 13:00

Active Tier:
Pre-Comp Post-Comp Global-Comp Local-Comp Total-Comp
(GiB) (GiB) Factor Factor Factor
(Reduction %)
---------------- -------- --------- ----------- ---------- -------------
Currently Used:* 20581.1 315.4 - - 65.3x (98.5)
Written:
Last 7 days 744.0 5.1 80.5x 1.8x 145.6x (99.3)
Last 24 hrs
---------------- -------- --------- ----------- ---------- -------------
* Does not include the effects of pre-comp file deletes/truncates

En el ejemplo anterior, el sistema está logrando una tasa de compresión general de 65,3x para el nivel activo (que es extremadamente buena). Sin embargo, si este valor muestra que la tasa de compresión general no cumple con las expectativas, es probable que sea necesario investigar más. Tenga en cuenta que investigar la tasa de compresión inferior a la esperada es un asunto complejo que puede tener muchas causas raíz. Para obtener más información sobre la investigación posterior, consulte el siguiente artículo: https://support.emc.com/kb/487055

Paso 8: Verificar si el sistema es un origen para la replicación de recopilaciones

Cuando se usa la replicación de recopilaciones, si el sistema de origen es físicamente más grande que el destino, el tamaño del sistema de origen se limita artificialmente a que coincida con el de destino (es decir, habrá un área del disco en el origen que se marcará como inutilizable). El motivo de esto es que, cuando se usa la replicación de recopilaciones, es necesario que el destino sea una copia de nivel de bloque del origen sin embargo, si el origen es físico más grande que el destino, existe la posibilidad de que se escriban demasiados datos en el origen, los cuales no se pueden replicar en el destino (ya que ya está lleno). Este escenario se evita al limitar el tamaño del origen para que coincida con el destino.

Mediante los comandos del paso 2, compruebe si el sistema es un origen para la replicación de recopilaciones. Para hacerlo, ejecute “estado de replicación” y determine si hay contextos de replicación que inicien “col://” (que indica la replicación de recopilaciones) que no contienen el nombre de host del sistema local en el destino (esto indica que este sistema debe ser un origen para el contexto de replicación)
Si el sistema es un origen para la replicación de colecciones, compruebe el tamaño de cada nivel activo de los sistemas mediante el inicio de sesión en ambos y la ejecución del comando “filesys show space”: compare el tamaño de “post-comp” de los niveles activos en cada uno.
Si el origen es significativamente mayor que el destino, su tamaño activo de nivel será artificialmente limitado
Para permitir que todo el espacio en el origen sea utilizable para los datos, se debe realizar lo siguiente:

Agregue almacenamiento adicional al nivel activo de destino, de modo que su tamaño sea >= al tamaño del nivel activo de origen

Divida el contexto de replicación de recopilaciones (mediante los comandos del paso 2). Tenga en cuenta que esto, obviamente, evitará que los datos se repliquen desde el DDR de origen -> destino.

Tan pronto como cualquiera de estos se haya realizado, habrá espacio adicional disponible inmediatamente en el nivel activo del sistema de origen (es decir, no hay necesidad de ejecutar la recolección de elementos no utilizados ni la limpieza del nivel activo antes de utilizar este espacio).

Paso 9: Verificar si la transferencia de datos se ejecuta periódicamente

Si el DDR está configurado con retención extendida (ER) o retención a largo plazo (LTR), tendrá un segundo nivel de almacenamiento conectado (nivel de archivo para ER o nivel de nube para LTR). En este escenario, es probable que las políticas de transferencia de datos se configuren en relación con mtrees para migrar los datos más antiguos o no modificados que requieren retención a largo plazo del nivel activo al nivel alternativo de almacenamiento, de modo que el espacio utilizado por estos archivos en el nivel activo se pueda recuperar de físicamente mediante recolección de elementos no utilizados o limpieza. Si las políticas de transferencia de datos se configuran incorrectamente o si no se ejecuta el proceso de transferencia de datos de forma periódica, los datos antiguos permanecerán en el nivel activo más de lo esperado y continuarán utilizando el espacio físico en el disco.

En primer lugar, confirme si el sistema está configurado para ER o LTR mediante la ejecución de “filesys show space” y la comprobación de la existencia de un nivel de archivo o de nube: Tenga en cuenta que, para poderse utilizar, estos niveles alternativos de almacenamiento deben tener un tamaño posterior a la compensación de >0 Gb:

# filesys show space
...
Archive Tier:
Resource Size GiB Used GiB Avail GiB Use% Cleanable GiB
---------------- -------- -------- --------- ---- -------------
/data: pre-comp - 4163.8 - - -
/data: post-comp 31938.2 1411.9 30526.3 4% -
---------------- -------- -------- --------- ---- -------------

# filesys show space
...
Cloud Tier
Resource Size GiB Used GiB Avail GiB Use% Cleanable GiB
---------------- -------- -------- --------- ---- -------------
/data: pre-comp - 0.0 - - -
/data: post-comp 338905.8 0.0 338905.8 0% 0.0
---------------- -------- -------- --------- ---- -------------

Tenga en cuenta que ER y LTR son mutuamente exclusivas, de modo que un sistema solo contendrá un nivel activo (sin ER/LTR configuradas) o un nivel activo y de archivo (ER configurada) o un nivel activo y de nube (LTR configurada)

Si el sistema está configurado con ER/LTR, compruebe las políticas de transferencia de datos en relación con mtrees para asegurarse de que estos sean según lo esperado y que estén establecidos de modo que los datos antiguos se extraigan al nivel alternativo de almacenamiento:

ER: # archive data-movement policy show
LTR: # data-movement policy show

Si no hay políticas de transferencia de datos o, de haberlas, son incorrectas, consulte la Guía del administrador de Data Domain para obtener ayuda para la realización de esto.

Si el sistema está configurado con ER/LTR, compruebe que la transferencia de datos esté programada para ejecutarse a intervalos regulares para migrar físicamente archivos y datos desde el nivel activo al almacenamiento alternativo:

ER: # archive data-movement schedule show
LTR: # data-movement schedule show

Tenga en cuenta que Data Domain generalmente recomienda ejecutar el movimiento de datos mediante un programa automatizado, sin embargo, algunos clientes optan por ejecutar este proceso de manera ad-hoc (es decir, cuando sea necesario). En este escenario, la transferencia de datos se debe iniciar periódicamente mediante la ejecución de:

ER: # archive data-movement start
LTR: # data-movement start

Para obtener más información sobre cómo modificar el programa de transferencia de datos, consulte la Guía del administrador de Data Domain.

Si el sistema está configurado para ER/LTR, compruebe la última vez que se ejecutó la transferencia de datos:

ER: # archive data-movement status
LTR: # data-movement status

Si la transferencia de datos no se ha ejecutado durante un tiempo, intente iniciar el proceso manualmente, luego, monitoree de la siguiente manera:

ER: # archive data-movement watch
LTR: # data-movement watch

Si no se puede iniciar la transferencia de datos por algún motivo, comuníquese con su proveedor de soporte contratado para obtener más ayuda.

Una vez que se completa la transferencia de datos, se debe ejecutar la limpieza del nivel activo (tenga en cuenta que puede configurarse para que se inicie automáticamente al finalizar la transferencia de datos) para asegurarse de que el espacio utilizado por los archivos migrados en el nivel activo se libere físicamente:

# filesys clean start

En sistemas de ER, es común programar el movimiento de datos para que se ejecute con regularidad (es decir, una vez por semana) y, a continuación, configure la limpieza del nivel activo para que se ejecute al finalizar la transferencia de datos. En este escenario, la limpieza del nivel activo no tiene su propio programa independiente. Para configurar este valor inicialmente, retire el programa de limpieza del nivel activo actual:

# filesys clean set schedule never

Configure la transferencia de datos para que se ejecute periódicamente, seguida de una limpieza automática del nivel activo, por ejemplo, para ejecutar la transferencia de datos todos los martes a las 6:00 a. m., seguida por una limpieza del nivel activo:

# archive data-movement schedule set days Tue time 0600
The Archive data movement schedule has been set.
Archive data movement is scheduled to run on day(s) "tue" at "06:00" hrs

Se puede confirmar que la limpieza de nivel activo está configurada para ejecutarse después de la finalización de la transferencia de datos de la siguiente manera:

# archive show config
Enabled Yes
Data movement Schedule Run on day(s) "tue" at "06:00" hrs <=== SCHEDULE
Data movement throttle 100 percent
Default age threshold data movement policy 14 days
Run filesys clean after archive data movement Yes <=== RUN CLEAN ON COMPLETION
Archive Tier local compression gz
Packing data during archive data movement enabled
Space Reclamation disabled
Space Reclamation Schedule No schedule

En sistemas de LTR, la limpieza del nivel activo aún debe configurarse con su propio programa.

Paso 10: Agregar almacenamiento adicional al nivel activo

Si se realizaron todos los pasos anteriores, la operación de limpieza de nivel activo se completó, pero aún no hay suficiente espacio disponible en el nivel activo, es probable que el sistema no tenga el tamaño correcto para la carga de trabajo que recibe. En este caso, se debe realizar una de las siguientes acciones:

Reduzca la carga de trabajo que llega al sistema; por ejemplo:

Redirija un subconjunto de copias de seguridad a un almacenamiento alternativo;
reduzca el período de retención de las copias de seguridad de modo que caduquen o sean eliminados de manera más rápida;
reduzca el número o el período de caducidad de las instantáneas programadas en relación con mtrees en el sistema;
descifre los contextos de replicación superfluos para los cuales el sistema local es un destino, luego, elimine los mtrees correspondientes.

Agregue almacenamiento adicional al nivel activo del sistema y amplíe su tamaño:

# storage add [tier active] enclosure [enclosure number] | disk [device number]
# filesys expand

Para analizar la adición de almacenamiento, comuníquese con su equipo de cuentas de ventas.

Дополнительная информация

El soporte de Data Domain puede generar una cantidad de informes que muestran información como la siguiente:

Una lista de todos los archivos en un nivel específico (es decir, activo/archivo/nube) ordenados por antigüedad
Tamaño estimado y tasa de compresión por mtree/major del directorio principal
Una lista de todos los archivos en un mtree específico ordenados por antigüedad
y otros criterios.

Para permitirlo, se debe recopilar la siguiente información:

Un paquete de soporte nuevo del DDR: consulte lo siguiente para obtener más información: https://support.emc.com/kb/323283
El resultado de “sfs_dump” o “sfs_dump-c”:

Inicie sesión en la CLI de DDR y suéltelo en el modo se (tenga en cuenta que los sistemas configurados con cifrado o el bloqueo de retención pueden solicitar las credenciales de un usuario con la función “seguridad” en este punto):

# system show serialno
[system serial number displayed]
# priv set se
[password prompt - enter system serial number from above]

Active el registro en la sesión de terminal. Por ejemplo, si se usa PuTTy, esto se puede hacer de la siguiente manera: Haga clic con el botón derecho en la barra de menú: -> Change settings… -> Session -> Logging -> Seleccione todos los resultados de sesión y seleccione un nombre de archivo -> Apply

Ejecute sfs_dump:

# se sfs_dump

Una vez que haya finalizado, obtenga una copia del registro de sesión para realizar un análisis más profundo.

Un informe de ubicación de archivos (obligatorio si el sistema está configurado para ER o LTR):

Inicie sesión en la CLI de DDR
Active el registro en la sesión del terminal. Por ejemplo, si se usa PuTTy, esto se puede hacer de la siguiente manera: Haga clic con el botón derecho en la barra de menú: -> Change settings… -> Session -> Logging -> Seleccione todos los resultados de sesión y seleccione un nombre de archivo -> Apply
Recopile un informe de ubicación de archivo:

ER: # archive report generate file-location
LTR: # filesys report generate file-location

Una vez que haya finalizado, obtenga una copia del registro de sesión para realizar un análisis más profundo.

Con el fin de obtener ayuda para recopilar lo anterior o con cualquiera de los pasos de esta limpieza de archivo, comuníquese con su proveedor de soporte contratado.

Затронутые продукты

Data Domain

Продукты

Data Domain

Номер статьи: 000054303

Тип статьи: Solution

Последнее изменение: 21 Jul 2025

Версия: 6

Проверьте, распространяются ли на ваше устройство услуги технической поддержки.

Data Domain: Cómo resolver problemas relacionados con la alta utilización de espacio o la falta de capacidad disponible en los restauradores de Data Domain (DDR)

Сводка: Este artículo contiene un procedimiento paso a paso para ayudar a resolver problemas relacionados con la gran utilización del espacio o la falta de capacidad disponible en los restauradores de Data Domain (DDR). ...

Симптомы

Причина

Разрешение

Дополнительная информация

Затронутые продукты

Продукты

Свойства статьи

Получите ответы на свои вопросы от других пользователей Dell

Услуги технической поддержки

Свойства статьи

Получите ответы на свои вопросы от других пользователей Dell

Услуги технической поддержки

Data Domain: Cómo resolver problemas relacionados con la alta utilización de espacio o la falta de capacidad disponible en los restauradores de Data Domain (DDR)

Сводка: Este artículo contiene un procedimiento paso a paso para ayudar a resolver problemas relacionados con la gran utilización del espacio o la falta de capacidad disponible en los restauradores de Data Domain (DDR). ... Показать больше Показать меньше

Подробная статья

Симптомы

Причина

Разрешение

Дополнительные сведения

Затронутые продукты

Симптомы

Причина

Разрешение

Дополнительная информация

Затронутые продукты

Продукты

Свойства статьи

Получите ответы на свои вопросы от других пользователей Dell

Услуги технической поддержки

Свойства статьи

Получите ответы на свои вопросы от других пользователей Dell

Услуги технической поддержки

Сводка: Este artículo contiene un procedimiento paso a paso para ayudar a resolver problemas relacionados con la gran utilización del espacio o la falta de capacidad disponible en los restauradores de Data Domain (DDR). ...