Data Domain: Descripción de la compresión de Data Domain
Résumé: Las terminologías, las compensaciones y las medidas se explican aquí para describir los tipos de compresión utilizados, la terminología y otros aspectos de la compresión en Data Domain. ...
Instructions
Las técnicas de compresión involucradas en un Data Domain utilizan técnicas de vanguardia para reducir el espacio físico que requieren los datos de respaldo. Por lo tanto, las tecnologías y las mediciones de los niveles de compresión son temas complejos.
En este artículo, se analizan algunas terminologías, compensaciones y medidas para explicar mejor el tipo de compresión utilizado y otros aspectos de la compresión en un entorno de Data Domain.
SE APLICA A: Todos los modelos de Data Domain
Introducción:
Última actualización: Enero de 2024
- La compresión es una tecnología de reducción de datos cuyo objetivo es almacenar un conjunto de datos utilizando menos espacio físico.
- En los sistemas Data Domain (DDOS), la desduplicación y la compresión local se realizan para comprimir los datos de usuario. La desduplicación, o "desduplicación", se utiliza para identificar segmentos de datos redundantes y almacenar solo segmentos de datos únicos.
- La compresión local comprime aún más los segmentos de datos únicos con ciertos algoritmos de compresión, como los siguientes
lz, gzfast, gz, etcétera. - La compresión general de datos de usuario en DDOS es el esfuerzo conjunto de la desduplicación y la compresión local. DDOS utiliza la “tasa de compresión” para medir la eficacia de su compresión de datos.
- Por lo general, es la relación entre el tamaño total de los datos de usuario y el tamaño total de los datos comprimidos o el tamaño del espacio físico utilizado.
- El sistema de archivos Data Domain es un sistema de archivos con desduplicación "estructurado en registros".
- Un sistema de archivos estructurados en registros solo agrega datos al sistema y la eliminación por sí sola no puede liberar espacio físico.
- Estos sistemas de archivos dependen de la recolección de elementos no utilizados para recuperar espacio que ya no es necesario.
- Las características del sistema de archivos con estructura de registros y la tecnología de desduplicación combinadas hacen que sea difícil comprender claramente todos los aspectos de la compresión en DDOS.
En el caso de la compresión, hay muchos aspectos que se pueden medir.
En este artículo, se analizan los detalles paso a paso para ayudar a comprender la compresión de DDOS.
- En primer lugar, se explica el efecto de compresión general del sistema, el cual nos indica la compresión realista lograda en un sistema Data Domain, la cantidad de datos de usuario, la cantidad de espacio físico consumido y la proporción de ellos.
- Esta tasa se denomina "tasa de compresión efectiva del sistema" en este artículo.
- DDOS realiza la desduplicación en línea y rastrea las estadísticas de los segmentos de datos de usuario originales, los segmentos de datos únicos posteriores a la desduplicación y el efecto de compresión local en los segmentos de datos únicos.
- Estas estadísticas de compresión en línea se utilizan para medir el efecto de la compresión en línea. Las estadísticas de compresión en línea se pueden medir para cada escritura. Además, DDOS realiza un seguimiento de las estadísticas en diferentes niveles: Archivos,
MTreesy todo el sistema.
No hay ninguna garantía de que todo el contenido sea preciso para versiones futuras.
En versiones anteriores a 5.0, todo el sistema tiene una sola mtree y el término mtree no se menciona explícitamente.
Compresión: Efecto general del sistema:
El efecto de compresión general en todo el sistema se mide por la tasa de compresión efectiva, que es la relación entre el tamaño de los datos de usuario y el tamaño del espacio físico utilizado. Es reportado por el "filesys show compression" (FSC) (la información correspondiente también está disponible en la interfaz del usuario). Un ejemplo de salida de FSC se muestra a continuación:
# filesys show compression
From: 2023-12-31 03:00 To: 2024-01-07 03:00
Active Tier:
Pre-Comp Post-Comp Global-Comp Local-Comp Total-Comp
(GiB) (GiB) Factor Factor Factor
(Reduction %)
---------------- -------- --------- ----------- ---------- -------------
Currently Used:* 6439.6 113.4 - - 56.8x (98.2)
Written:
Last 7 days 135421.3 1782.0 35.1x 2.2x 76.0x (98.7)
Last 24 hrs 532.5 1.5 334.3x 1.1x 356.5x (99.7)
---------------- -------- --------- ----------- ---------- -------------
* Does not include the effects of pre-comp file deletes/truncates
since the last cleaning on 2024/01/05 11:34:13.
-
- La tasa de compresión efectiva del sistema se informa en la fila 1 de la sección de resultados en la salida de la CLI. La fila está resaltada arriba.
- El tamaño total de los datos del usuario está etiquetado como "Pre-Comp".
- El espacio físico total consumido (tanto por datos como por metadatos) se etiqueta como "Post-Comp".
- Los números "Pre-Comp" y "Post-Comp" se leen en el tiempo de ejecución.
FSCsincroniza implícitamente todo el sistema y, a continuación, consulta los dos números.- Estos dos números se miden de la misma manera que el "
filesys show space" comando. - Tasa de compresión efectiva del sistema = Antes o después de la compresión.
- Estos dos números se miden de la misma manera que el "
Hay algunas operaciones que pueden afectar la tasa de compresión efectiva del sistema:
-
Copia rápida
-
Cuando un
fastcopyse realiza a partir de un archivo en el espacio de nombres activo (no una instantánea), es una deduplicación perfecta, ya que no se necesita espacio físico adicional para el archivo de destino. El efecto de unfastcopyes que el tamaño de los datos de usuario aumenta sin consumir espacio físico adicional. Esto aumenta la tasa de compresión efectiva del sistema. Cuando muchosfastcopiesla tasa de compresión efectiva del sistema puede llegar a ser artificialmente alta.
-
-
Sintéticos virtuales
-
Los respaldos sintéticos virtuales tienden a mostrar una alta tasa de compresión efectiva del sistema. Esto se debe a que los sintéticos virtuales realizan respaldos lógicos completos, pero solo transfieren datos nuevos o modificados a sistemas Data Domain. El impacto en la tasa de compresión efectiva del sistema de los sintéticos virtuales es algo similar al efecto de
fastcopy.
-
-
Sobrescribe
-
Las sobrescrituras consumen más espacio físico, pero no aumentan el tamaño lógico del conjunto de datos, por lo que las sobrescrituras reducen la tasa de compresión efectiva del sistema
-
-
Almacenamiento de archivos dispersos
-
Los archivos dispersos contienen “orificios” grandes que se cuentan en el tamaño lógico, pero que no consumen espacio físico debido a la compresión. Como resultado, pueden hacer que la tasa de compresión real del sistema parezca alta.
-
-
Almacenamiento de archivos pequeños
-
DDOS agrega casi 1 KB de sobrecarga a cada archivo para ciertos metadatos internos. Cuando un sistema almacena una cantidad significativa de archivos pequeños (con tamaños inferiores a 1 KB o en kilobytes de un solo dígito), la sobrecarga de metadatos reduce la tasa de compresión efectiva.
-
-
Almacenamiento de archivos precomprimidos o precifrados
-
La compresión y el cifrado pueden amplificar el nivel de cambio de datos y reducir la posibilidad de desduplicación. Por lo general, estos archivos no se pueden desduplicar correctamente y reducen la tasa de compresión efectiva del sistema.
-
-
Elimina
-
Las eliminaciones reducen el tamaño lógico del sistema, pero el sistema no recupera el espacio no utilizado correspondiente hasta que se ejecuta una recolección de elementos no utilizados. Muchos archivos eliminados hacen que la tasa de compresión sea baja hasta que se ejecuta la recolección de elementos no utilizados (GC).
-
-
Recolección de elementos no utilizados (GC) o limpieza
-
La GC recupera el espacio consumido por los segmentos de datos que ya no son vistos por ningún archivo. Si se eliminaron muchos archivos recientemente, una GC puede aumentar la tasa de compresión del sistema mediante la reducción del consumo de espacio físico.
-
-
Toma dinámica de instantáneas
-
Cuando se muestra una instantánea de un archivo
Mtreeel tamaño lógico del conjunto de datos no cambia. Sin embargo, se deben bloquear todos los segmentos de datos a los que hace referencia la instantánea, incluso si todos los archivos capturados por la instantánea se eliminan después de que se tomó la instantánea. GC no puede recuperar el espacio que aún necesitan las instantáneas, ya que tener muchas instantáneas puede hacer que la tasa de compresión efectiva del sistema parezca baja. Sin embargo, las instantáneas son funcionalidades útiles de recuperación ante fallas. Nunca dude en tomar instantáneas o configurar programas de instantáneas adecuados cuando sea necesario.
-
Compresión: Estadísticas en línea:
DDOS lleva a cabo la desduplicación en línea, a medida que los datos se escriben en el sistema. Realiza un seguimiento de los efectos de la compresión local y la desduplicación en línea para cada escritura, y acumula las estadísticas en el nivel de archivo. Las estadísticas de compresión en línea por archivo se agregan aún más en el mtree nivel y a nivel del sistema. La compresión se mide en función de tres números en las estadísticas en línea:
- La longitud de cada escritura:
raw_bytes The length of all unique segments:pre_lc_size- La longitud de segmentos únicos comprimidos localmente:
post_lc_size
-
-
Compresión global (
g_comp).- Es igual a (
raw_bytes/pre_lc_size), y refleja la tasa de deduplicación
- Es igual a (
-
Compresión local (
l_comp).-
Es igual a (
pre_lc_size/post_lc_size) y refleja el efecto del algoritmo de compresión local
-
-
Las estadísticas de compresión en línea acumuladas son parte de los metadatos del archivo en DDOS y se almacenan en el archivo inode. DDOS proporciona herramientas para comprobar las compresiones en línea en los tres niveles; Archivo, MTreey en todo el sistema. Estos se detallan en las siguientes secciones.
Compresión de archivos:
-
- La compresión de archivos se puede comprobar con el comando "
filesys show compression <path>" comando de la CLI, que informa las estadísticas de compresión acumuladas almacenadas en el archivoinode. - Cuando se especifica un directorio, las estadísticas de compresión en línea de todos los archivos en ese directorio se resumen e informan.
- En la salida de la CLI,
raw_bytesestá etiquetado como "Bytes originales",pre_lc_sizeestá etiquetado como "Globally Compressed",post_lc_bytesestá marcado como "Locally Compressed". Las otras sobrecargas se informan como "metadatos". Los dos ejemplos se capturan de un DD de producción:
- La compresión de archivos se puede comprobar con el comando "
Ejemplo 1: Estadísticas de compresión en línea de un archivo
filesys show compression /data/col1/main/dir1/file_1
Total files: 1; bytes/storage_used: 7.1
Logical Bytes: 53,687,091,200
Original Bytes: 11,463,643,380
Globally Compressed: 4,373,117,751
Locally Compressed: 1,604,726,416
Meta-data: 18,118,232
Ejemplo 2: Estadísticas de compresión en línea de todos los archivos de un directorio, incluidos todos los subdirectorios
filesys show compression /data/col1/main/dir1
Total files: 13; bytes/storage_used: 7.1
Logical Bytes: 53,693,219,809
Original Bytes: 11,501,978,884
Globally Compressed: 4,387,212,404
Locally Compressed: 1,608,444,046
Meta-data: 18,241,880
-
-
- El sistema informa la tasa de compresión en línea general en la salida anterior de la CLI como "bytes/
storage_used”. - Sin embargo, se debe tener cuidado al interpretar la información anterior, ya que puede ser engañosa por diversas razones.
- Una de las razones es que el
pre_lc_sizeypost_lc_sizese registran en el momento en que se procesan las operaciones de datos. - Cuando se elimina el archivo que originalmente agregó esos segmentos, se debe aumentar la cantidad de segmentos de datos únicos en el archivo restante.
- El sistema informa la tasa de compresión en línea general en la salida anterior de la CLI como "bytes/
-
Por ejemplo, suponga que se respalda un archivo de muestra de archivo en un Data Domain y, en el primer respaldo, la información de compresión del archivo es pre_lc_size= 10 GiB, post_lc_size= 5 Gib.
-
-
- A continuación, suponga que los datos de este archivo son únicos y que no se pueden compartir con ningún otro archivo.
- En el segundo respaldo del archivo, suponga además que el archivo obtiene una desduplicación ideal, de modo que ambos
pre_lc_sizeypost_lc_sizedebe ser cero porque todos los segmentos del archivo ya existían en el sistema. - Cuando se elimina el primer respaldo, el segundo respaldo del archivo se convierte en el único archivo que hace referencia a los 5 GiB de segmentos de datos.
- En este caso, idealmente, el
pre_lc_sizeypost_lc_sizedel archivo en el segundo respaldo se debe actualizar de cero a 10 GiB y 5 GiB, respectivamente. - Sin embargo, no hay manera de detectar para qué archivos se debe realizar, por lo que las estadísticas de compresión en línea de los archivos existentes no se modifican.
-
-
- Otro factor que afecta a los números anteriores son las estadísticas acumuladas.
- Cuando un archivo recibe una gran cantidad de sobrescrituras, es imposible rastrear hasta qué punto las estadísticas acumulativas reflejan las escrituras que introdujeron los datos activos.
- Por lo tanto, durante mucho tiempo, las estadísticas de compresión en línea solo se pueden tratar como una heurística para estimar aproximadamente la compresión de un archivo en particular.
- Otro hecho que vale la pena destacar es que la compresión en línea de un archivo no se puede medir durante un intervalo de tiempo arbitrario.
- Las estadísticas de compresión en línea de los archivos son un resultado acumulativo y cubren todas las escrituras que ha recibido el archivo.
- Cuando un archivo recibe muchas sobrescrituras, el
raw_bytespuede ser mucho mayor que el tamaño lógico del archivo. En el caso de los archivos dispersos, los tamaños de archivo pueden ser mayores que los "bytes originales".
Compresión de MTree:
-
- La compresión de un determinado
mtreese puede comprobar con el botón"mtree show compression"(MSC) comando de la CLI. - Los valores absolutos de las estadísticas de compresión en línea son acumulativos durante toda la vida útil de
MTree. - Dado que la vida útil de un
MTreepueden durar muchos años, estos valores se vuelven cada vez menos informativos con el tiempo. - Para abordar este problema, se utiliza la cantidad de cambios (deltas) de las estadísticas de compresión en línea y se informa la compresión solo durante ciertos intervalos de tiempo.
- El enfoque subyacente es que el
MTreeLas estadísticas de compresión en línea se vuelcan periódicamente a un registro. - Cuando un cliente consulta la compresión de MTree con el comando
MSC, el registro se utiliza para calcular los deltas de los números para la generación de informes de compresión. - De forma predeterminada,
MSCInforma la compresión de los últimos 7 días y las últimas 24 horas, aunque se puede especificar cualquier período de interés.
- La compresión de un determinado
Para demostrarlo, suponga el siguiente registro para MTree R:
3:00AM, raw_bytes=11000GB, pre_lc_size=100GB, post_lc_size=50GB 4:00AM, raw_bytes=12000GB, pre_lc_size=200GB, post_lc_size=100GB
Luego, la compresión de MTree A para esta hora es:
g_comp = (12000-11000)/(200-100) = 10x l_comp = (200-100)/(100-50) = 2x overall compression ratio = (12000-11000)/(100-50) = 20x
El cálculo de la tasa de compresión anterior no hace nada con el tamaño del conjunto de datos. Por ejemplo, es posible que el mtree anterior solo tenga 500 GB de datos lógicos.
-
MSCEs compatible con las opciones "Daily" y "Daily-Detailed", al igual que "filesys show compression" comando.- Cuando se especifica "daily", el comando informa la compresión diaria en forma de calendario.
- Utiliza los deltas diarios del
raw_bytesypost_lc_sizepara calcular la tasa de compresión diaria. - Cuando se especifica "daily-detailed", el comando muestra los tres deltas (de la
raw_bytes,pre_lc_sizeypost_lc_size, respectivamente) para cada día. También computa elg_compyl_compjunto con el factor de compresión total.
En el apéndice que aparece a continuación, se muestra un ejemplo de resultado de estos sistemas.
Compresión del sistema:
-
- Una vez que se informa la compresión
MTreesse entiende, es sencillo extender el concepto a todo el sistema. - La recopilación de estadísticas en línea de compresión en todo el sistema y la generación de informes son exactamente las mismas que con
MTrees. - La única diferencia es el alcance, ya que uno está en un
MTree, mientras que uno está sobre todo el sistema. - Los resultados se pueden comprobar mediante el uso del comando "
filesys show compression" comando. - Un ejemplo de esto se puede encontrar en la Sección 2.
- La compresión del sistema "last 7 days" y "last 24 hours" se informa en las últimas dos líneas de la sección de resultados en el
FSC.
- Una vez que se informa la compresión
Nivel de nube:
- En los DD con el nivel de nube implementado, el almacenamiento se separa en el nivel activo y el nivel de nube, que son dos dominios de desduplicación independientes.
- Los usuarios pueden insertar datos solo en el nivel activo.
- Más adelante, las funciones de transferencia de datos de DDOS se pueden usar para migrar datos del nivel activo al nivel de nube.
- Por lo tanto, la medición y la generación de informes de espacio y compresión se manejan de manera independiente en cada nivel.
- Sin embargo, en el nivel de archivo, no se realiza ninguna diferenciación por nivel e informe de las estadísticas de compresión en línea; son exactamente las mismas que las descritas en la sección 3.1.
Deduplicación:
El último tema que se debe destacar son algunas de las características de la desduplicación, que se denomina "compresión global" en muchos artículos de Data Domain.
Aunque contiene la palabra "compresión", es completamente diferente del concepto tradicional de compresión, que también proporciona DDOS bajo el nombre de "compresión local".
- La compresión local reduce el tamaño de un fragmento de datos mediante un algoritmo determinado (algunos tipos de datos no son comprimibles y la aplicación de algoritmos de compresión en ellos puede aumentar ligeramente el tamaño de los datos).
- Por lo general, una vez que se decide un algoritmo, los datos son el único factor de la tasa de compresión.
- Sin embargo, la desduplicación es diferente: no es un concepto local, es "global".
- Un segmento de datos entrante se desduplica con todos los segmentos de datos existentes en un dominio desduplicado, que incluye todos los datos en sistemas Data Domain que no son de nube.
- El segmento de datos en sí no es importante en el procedimiento de desduplicación.
- En la práctica, rara vez se observa una alta tasa de desduplicación en el respaldo inicial de un conjunto de datos. En los respaldos iniciales, a menudo, la reducción de datos principal proviene de la compresión local.
- Cuando los respaldos posteriores llegan a Data Domain, la desduplicación muestra su fuerza y se convierte en el factor dominante para la compresión.
- La eficacia de la desduplicación depende del hecho de que la tasa de cambio de un conjunto de datos es baja de un respaldo a otro. Por este motivo, los conjuntos de datos con altas tasas de cambio no se pueden desduplicar correctamente.
- Cuando la aplicación de respaldo inserta sus propios fragmentos de metadatos (denominados marcadores por Data Domain) en las imágenes de respaldo a alta frecuencia, es posible que tampoco obtenga una buena tasa de desduplicación. Nuestras técnicas de manejo de marcadores pueden ayudar a veces, pero no siempre.
Teniendo en cuenta estas observaciones, qué esperar:
- Es posible que los respaldos iniciales solo logren una tasa de compresión efectiva para el sistema pequeño, a menudo 2x o 3x. Por lo general, la deduplicación tiene pocas oportunidades de demostrar su fuerza en los respaldos iniciales.
- La tasa de compresión global de un respaldo incremental es menor que la tasa de compresión del respaldo completo correspondiente. Esto se debe a que un respaldo incremental contiene solo archivos modificados o nuevos en comparación con el respaldo anterior inmediato. La tasa de compresión global depende del porcentaje de datos nuevos dentro del respaldo incremental.
- La tasa de desduplicación de un respaldo completo (los que no son iniciales) también puede ser baja en algunos escenarios. Algunas situaciones observadas con frecuencia incluyen las siguientes:
-
Una alta tasa de cambio en los datos que se respaldan
-
El conjunto de datos está dominado por archivos pequeños (menos de 5 MiB)
-
Aplicaciones de respaldo que agregan una gran cantidad de marcadores poco espaciados
-
Respaldos de bases de datos incrementales o que utilizan un tamaño de bloque pequeño
-
Cuando se observa una tasa de compresión baja en un respaldo completo con una tasa de cambio de datos baja, compruebe si se aplica uno de los casos anteriores o si se necesita un análisis más profundo.
-
- La compresión de una imagen de respaldo posterior no siempre es mejor que la inicial. Las imágenes de respaldo consecutivas pueden mostrar una tasa de desduplicación alta debido a que las imágenes de respaldo iniciales y anteriores ya agregaron la mayoría de los datos al sistema. Cuando se eliminan todas las imágenes de respaldo anteriores, es posible que la tasa de compresión global y local de la imagen de respaldo existente más antigua siga siendo alta, pero esto solo significa que obtuvo una buena desduplicación cuando se agregó al sistema, nada más. Cuando se elimina un archivo que tiene una tasa de compresión global y local alta y que es la última imagen de respaldo de un conjunto de datos específico, puede liberar más espacio que el tamaño derivado de la tasa de compresión.
- No se pueden comparar las tasas de compresión del mismo conjunto de datos en diferentes sistemas, independientemente de la forma en que se agregue el conjunto de datos a esos sistemas. Esto se debe a que cada sistema es un dominio de desduplicación independiente. No hay ninguna expectativa de que dos DD diferentes obtengan las mismas tasas de compresión o, incluso, necesariamente similares, incluso si sus conjuntos de datos son los mismos.
Resumen:
- Medir la compresión es difícil en los sistemas de archivos desduplicados, pero es aún más difícil en los sistemas de archivos desduplicados con estructura de registro.
- Se debe comprender cómo funciona la desduplicación y cómo se rastrean las estadísticas de compresión.
- Las tasas de compresión son información útil para comprender el comportamiento de un sistema en particular.
- La tasa de compresión efectiva del sistema es la medida más importante, confiable e informativa.
- Las estadísticas de compresión en línea también pueden ser útiles, pero es posible que no sean más que heurísticas en algunas circunstancias.
Appendix:
Ejemplo de salida de "mtree show compression" command
- Supongamos que hay un
MTreecon 254792,4 GiB de datos. Ha recibido 4379,3 GiB de datos nuevos en los últimos 7 días y 78,4 GiB en las últimas 24 horas (se pueden especificar otros intervalos de tiempo). - La opción “daily” informa las estadísticas de compresión en línea de los últimos 33 días.
- Cuando se proporciona la opción "daily-detailed", las tasas de compresión totales se detallan aún más separándolas en tasas de compresión globales y locales.
La variable mtree Salida de lista:
mtree list /data/col1/main
Name Pre-Comp (GiB) Status --------------- -------------- ------ /data/col1/main 254792.4 RW --------------- -------------- ------ D : Deleted Q : Quota Defined RO : Read Only RW : Read Write RD : Replication Destination IRH : Retention-Lock Indefinite Retention Hold Enabled ARL : Automatic-Retention-Lock Enabled RLGE : Retention-Lock Governance Enabled RLGD : Retention-Lock Governance Disabled RLCE : Retention-Lock Compliance Enabled M : Mobile m : Migratable
MSC (sin opciones):
mtree show compression /data/col1/main
From: 2023-09-07 12:00 To: 2023-09-14 12:00
Pre-Comp Post-Comp Global-Comp Local-Comp Total-Comp
(GiB) (GiB) Factor Factor Factor
(Reduction %)
------------- -------- --------- ----------- ---------- -------------
Written:
Last 7 days 4379.3 883.2 3.4x 1.5x 5.0x (79.8)
Last 24 hrs 784.6 162.1 3.3x 1.4x 4.8x (79.3)
------------- -------- --------- ----------- ---------- -------------
Con la opción "diaria":
mtree show compression /data/col1/main daily
From: 2023-08-12 12:00 To: 2023-09-14 12:00
Sun Mon Tue Wed Thu Fri Sat Weekly
----- ----- ----- ----- ----- ----- ----- ------ -----------------
-13- -14- -15- -16- -17- -18- -19- Date
432.0 405.9 284.1 438.8 347.0 272.7 331.4 2511.8 Pre-Comp
85.5 66.2 45.3 81.9 61.4 57.4 66.3 464.1 Post-Comp
5.0x 6.1x 6.3x 5.4x 5.7x 4.7x 5.0x 5.4x Total-Comp Factor
-20- -21- -22- -23- -24- -25- -26-
478.0 387.8 450.2 533.1 386.0 258.4 393.6 2887.1
100.6 81.5 100.8 119.0 84.0 40.6 75.3 601.8
4.8x 4.8x 4.5x 4.5x 4.6x 6.4x 5.2x 4.8x
-27- -28- -29- -30- -31- -1- -2-
27.6 1.0 0.4 470.7 467.3 517.7 641.9 2126.7
4.9 0.2 0.1 83.9 92.3 89.8 140.1 411.2
5.6x 5.6x 4.3x 5.6x 5.1x 5.8x 4.6x 5.2x
-3- -4- -5- -6- -7- -8- -9-
539.6 495.0 652.8 658.7 537.1 398.7 305.5 3587.3
110.8 108.0 139.4 137.0 111.5 78.3 48.3 733.3
4.9x 4.6x 4.7x 4.8x 4.8x 5.1x 6.3x 4.9x
-10- -11- -12- -13- -14-
660.2 738.3 787.2 672.9 796.9 3655.5
143.9 152.5 167.6 126.9 163.3 754.2
4.6x 4.8x 4.7x 5.3x 4.9x 4.8x
----- ----- ----- ----- ----- ----- ----- ------ -----------------
Pre-Comp Post-Comp Global-Comp Local-Comp Total-Comp
(GiB) (GiB) Factor Factor Factor
(Reduction %)
-------------- -------- --------- ----------- ---------- -------------
Written:
Last 33 days 14768.3 2964.5 3.4x 1.5x 5.0x (79.9)
Last 24 hrs 784.6 162.1 3.3x 1.4x 4.8x (79.3)
-------------- -------- --------- ----------- ---------- -------------
Key:
Pre-Comp = Data written before compression
Post-Comp = Storage used after compression
Global-Comp Factor = Pre-Comp / (Size after de-dupe)
Local-Comp Factor = (Size after de-dupe) / Post-Comp
Total-Comp Factor = Pre-Comp / Post-Comp
Reduction % = ((Pre-Comp - Post-Comp) / Pre-Comp) * 100
Con la opción "diario detallado":
mtree show compression /data/col1/main daily-detailed
From: 2023-08-12 12:00 To: 2023-09-14 12:00
Sun Mon Tue Wed Thu Fri Sat Weekly
----- ----- ----- ----- ----- ----- ----- ------ -----------------
-13- -14- -15- -16- -17- -18- -19- Date
432.0 405.9 284.1 438.8 347.0 272.7 331.4 2511.8 Pre-Comp
85.5 66.2 45.3 81.9 61.4 57.4 66.3 464.1 Post-Comp
3.5x 4.1x 4.3x 3.6x 3.8x 3.3x 3.4x 3.7x Global-Comp Factor
1.4x 1.5x 1.5x 1.5x 1.5x 1.4x 1.5x 1.5x Local-Comp Factor
5.0x 6.1x 6.3x 5.4x 5.7x 4.7x 5.0x 5.4x Total-Comp Factor
80.2 83.7 84.1 81.3 82.3 78.9 80.0 81.5 Reduction %
-20- -21- -22- -23- -24- -25- -26-
478.0 387.8 450.2 533.1 386.0 258.4 393.6 2887.1
100.6 81.5 100.8 119.0 84.0 40.6 75.3 601.8
3.3x 3.3x 3.0x 3.0x 3.3x 4.1x 3.6x 3.3x
1.4x 1.5x 1.5x 1.5x 1.4x 1.5x 1.4x 1.5x
4.8x 4.8x 4.5x 4.5x 4.6x 6.4x 5.2x 4.8x
79.0 79.0 77.6 77.7 78.2 84.3 80.9 79.2
-27- -28- -29- -30- -31- -1- -2-
27.6 1.0 0.4 470.7 467.3 517.7 641.9 2126.7
4.9 0.2 0.1 83.9 92.3 89.8 140.1 411.2
4.4x 3.7x 2.6x 3.8x 3.5x 3.9x 3.2x 3.5x
1.3x 1.5x 1.6x 1.5x 1.4x 1.5x 1.5x 1.5x
5.6x 5.6x 4.3x 5.6x 5.1x 5.8x 4.6x 5.2x
82.1 82.2 76.8 82.2 80.3 82.7 78.2 80.7
-3- -4- -5- -6- -7- -8- -9-
539.6 495.0 652.8 658.7 537.1 398.7 305.5 3587.3
110.8 108.0 139.4 137.0 111.5 78.3 48.3 733.3
3.4x 3.1x 3.2x 3.4x 3.3x 3.4x 4.1x 3.3x
1.4x 1.5x 1.5x 1.4x 1.4x 1.5x 1.6x 1.5x
4.9x 4.6x 4.7x 4.8x 4.8x 5.1x 6.3x 4.9x
79.5 78.2 78.6 79.2 79.2 80.4 84.2 79.6
-10- -11- -12- -13- -14-
660.2 738.3 787.2 672.9 796.9 3655.5
143.9 152.5 167.6 126.9 163.3 754.2
3.1x 3.4x 3.2x 3.7x 3.4x .3x
1.5x 1.4x 1.5x 1.4x 1.5x 1.5x
4.6x 4.8x 4.7x 5.3x 4.9x 4.8x
78.2 79.3 78.7 81.1 79.5 79.4
----- ----- ----- ----- ----- ----- ----- ------ -----------------
Pre-Comp Post-Comp Global-Comp Local-Comp Total-Comp
(GiB) (GiB) Factor Factor Factor
(Reduction %)
-------------- -------- --------- ----------- ---------- -------------
Written:
Last 33 days 14768.3 2964.5 3.4x 1.5x 5.0x (79.9)
Last 24 hrs 784.6 162.1 3.3x 1.4x 4.8x (79.3)
-------------- -------- --------- ----------- ---------- -------------
Key:
Pre-Comp = Data written before compression
Post-Comp = Storage used after compression
Global-Comp Factor = Pre-Comp / (Size after de-dupe)
Local-Comp Factor = (Size after de-dupe) / Post-Comp
Total-Comp Factor = Pre-Comp / Post-Comp
Reduction % = ((Pre-Comp - Post-Comp) / Pre-Comp) * 100