Avamar-Data Domain: Alta utilización de DD en el destino: Análisis y prácticas recomendadas
Summary: No se espera que los Data Domain de origen y de destino sean exactamente iguales en la utilización del disco. En este documento, se describen las posibles razones por las que el Data Domain de destino podría mostrar una mayor utilización que el Data Domain fuente. Es importante tener en cuenta que la discrepancia en la utilización puede ser el resultado de una combinación de las siguientes razones. ...
Symptoms
El Data Domain de destino muestra una mayor utilización que el Data Domain de origen.
Cause
Desde la perspectiva de Avamar:
Reversión
En el caso de una reversión en el Data Domain de origen, el Data Domain de destino puede contener días adicionales de datos según la hora de reversión. Esta discrepancia existirá hasta que venzan los respaldos adicionales en el destino.
Ejemplo: DD1 se replica en DD2. Dado que la reversión es de dos días atrás, vemos que hay 3 respaldos en la fuente, pero cinco respaldos replicados en el destino.
Partial Replications
En el caso de que una replicación no se complete correctamente, los datos que ya se replicaron se almacenarán durante un mínimo de siete días y se eliminarán mediante la limpieza de Data Domain. Las replicaciones parciales contienen datos y huellas digitales que permiten volver a intentar posteriormente la replicación de datos a fin de contar con una ejecución más rápida.
La sobrecarga de replicación parcial podría ser tan alta como la cantidad de datos replicados si las replicaciones fallan justo antes de que se completen.
Difference in retention
En la configuración del servidor de Avamar, es posible configurar para mantener las réplicas en el servidor de destino durante más tiempo que una fuente. Esto provocará diferencias en la utilización de la capacidad.
Avamar configuration differences
Un respaldo de un punto de control en el servidor de Avamar podría ser considerablemente grande. Si solo está configurado en el Avamar de destino, aumentará la utilización de Data Domain en el destino.
Desde la perspectiva de Data Domain:
Huellas.
Cuando se envían datos a Data Domain durante la replicación, se están desduplicando. Se envía una huella digital de los datos al Data Domain de destino primero para comprobar si el destino tiene los datos.
-
Si Data Domain indica que cuenta con la huella digital, no es necesario volver a enviar los datos
-
Si Data Domain no indica que no se encontró la huella digital, significa que:
-
no cuenta con la huella digital
-
El Data Domain de destino cuenta con la huella digital, pero desea que los datos se envíen de todos modos para mejorar la localidad especial en Data Domain.
-
Data Domain está ocupado y no desea completar toda la búsqueda.
-
Si se envían datos duplicados a Data Domain, los datos se desduplicarán durante la limpieza mediante la eliminación de copias adicionales de los datos.
El Data Domain de destino tendrá una mayor utilización, pero la variación no debería ser grande.
Metadata overhead.
Cada archivo respaldado incluye sus metadatos de información del archivo y también contiene huellas digitales de cada uno.
Ejemplo: En el caso de un archivo de 1 TB, el costo de utilización es del 0,3 % del tamaño del archivo.
En el caso de un fragmento de datos promedio de 8 kB, hay 82 B de metadatos. Esto equivale a aproximadamente un 0,01 % de sobrecarga para la capacidad posterior a la compleción.
Esta sobrecarga aumenta adicionalmente con la integración de Avamar, ya que Avamar combina los respaldos para obtener un respaldo completo sintético desde el incremental cada vez que se completa el respaldo.
También observamos que la sobrecarga de metadatos aumenta cuando se omiten respaldos o los datos se replican de manera desordenada.
Los únicos respaldos que no crean esta sobrecarga son los de VM. Se minimiza el costo de los metadatos.
Ejemplo: Cuando el respaldo se replica de manera desordenada, está creando un respaldo de L0 en el destino que tiene una sobrecarga de metadatos mucho mayor que Inc. Supongamos que tenemos 5 días de respaldos.
De la replicación más antigua a la más reciente:
La primera replicación será L0, luego todas las subsiguientes serán Inc.
1xL0 + 4xInc
De la replicación más reciente a la más antigua:
La replicación omite un respaldo:
File Tracking
Data Domain debe saber cómo compilar cada archivo a partir de los fragmentos desduplicados. En caso de que Data Domain no tenga esta información, debe recompilarla y volver a crear la cadena de huellas digitales. Esto podría causar un aumento significativo en la capacidad.
Existen dos situaciones que pueden causar un aumento significativo en la capacidad en el Data Domain de destino:
1. Se perdió el rastreo de archivos:
Ejemplo: Si el Data Domain de destino se configura en DNS con varias direcciones IP y estas se distribuyen en round robin, el Data Domain de origen se conectará a diferentes IP cada vez. La copia de los datos enviados ayer no se reconocería y se enviarán más datos, lo que también aumenta el costo de los metadatos.
Este problema puede ocurrir cuando el SFS_BFT_ENABLED se deja como falso después de que se completa la reversión del servidor Avamar.
Esto puede dar lugar a una discrepancia muy grande. El espacio se recupera una vez que vencen los respaldos.
In-line dedupe
Data Domain solicitará datos duplicados de hasta el 6 % de un tamaño lógico de los datos a fin de optimizar su desduplicación en línea.
Difference in the deduplication and compression.
Los Data Domain realizan su propia desduplicación y compresión de datos en su almacenamiento local de manera independiente y, según la forma en que se almacenen los datos de destino, esto no será igual, lo que causará una diferencia de utilización.
Data Domain cleaning
Si los Data Domain de origen y destino ejecutan la limpieza en días diferentes, o si uno de los Data Domain lo ejecuta con mayor frecuencia o durante más tiempo, habrá discrepancias en la capacidad utilizada.
Resolution
Prácticas recomendadas:
Dado que habrá discrepancias en la utilización entre los dos sistemas Data Domain, de origen y de destino, existen algunas prácticas recomendadas que pueden ayudar a minimizar la diferencia:
-
Minimice la posibilidad de reversión asistiendo a fallas de hfscheck y de hardware tan pronto como ocurran.
-
Asegúrese de que las replicaciones se completen correctamente. Si hay un problema continuo con la finalización de las replicaciones, comuníquese con el soporte de Dell Technologies para revisar la configuración.
-
Si necesita mantener los dos Data Domain con una utilización similar, mantenga la misma retención en las copias de origen y de destino de los respaldos y asegúrese de que el respaldo de punto de control esté configurado de la misma manera en ambos servidores de Avamar.
-
Asegúrese de que las replicaciones siempre sean de las más antiguas a las más recientes y que no se omitan los respaldos.
-
Si Data Domain está configurado con varias IP, asegúrese de que estas no se distribuyan de manera round robin.
-
Haga que los sistemas Data Domain, de origen y de destino, ejecuten la limpieza el mismo día y a la misma hora.
-
Haga que SFS_BFT_ENABLED se establezca en verdadero. Esto debe ser habilitado por el soporte técnico (genere una SR y haga referencia a este KB# - 182755)