Preguntas frecuentes sobre la medición de la capacidad física o la generación de informes de capacidad física de DDOS
Summary: Preguntas frecuentes sobre la medición de la capacidad física (PCM) o los informes de capacidad física (PCR) de Data Domain Operating System (DD OS).
Instructions
La versión 5.7 de Data Domain Operating System (DD OS) presenta una nueva funcionalidad conocida como medición de capacidad física (PCM) o informes de capacidad física (PCR).
En este artículo, se describen casos de uso comunes y preguntas en torno a esta función. PCM y PCR se utilizan indistintamente en este documento.
¿Qué es la medición de la capacidad física (PCM)?
PCM es una nueva función soportada en DD OS 5.7 y versiones posteriores que permite el cálculo de la utilización precisa de discos duros mediante un árbol de directorios, una colección de árboles de directorios, MTree o una colección de MTrees.
¿En qué se diferencia esto de las funciones de versiones anteriores de DDOS?
Cuando se ingiere un archivo en un DDR, registramos varias estadísticas sobre el archivo. Una de estas estadísticas son los "bytes post-lc", o la cantidad física de espacio que ocupa un archivo cuando se escribe en el sistema. Podemos ver bytes post-lc para un archivo o árbol de directorios mediante el comando filesys show compression comando, por ejemplo:
sysadmin@dd9500# filesys show compression /data/col1/jf1 Total files: 4; bytes/storage_used: 1.3 Original Bytes: 4,309,378,324 Globally Compressed: 3,242,487,836 Locally Compressed: 3,293,594,658 Meta-data: 13,897,112
Esto indica que el árbol de directorios anterior contiene cuatro archivos que, en total, usaron 3 293 594 658 bytes (3,07 GB) de espacio físico cuando se ingieren.
PCM es un esfuerzo para evitar que los resultados incoherentes causados por las estadísticas anteriores se vuelvan obsoletos. Dado que PCM puede generar informes de la utilización del disco duro en un punto específico en el tiempo, las limitaciones anteriores ya no se aplican y se garantiza que los resultados serán más precisos.
¿Hay algún hecho o configuración conocida en los que se sepa que los resultados calculados por PCM no son óptimos para ser precisos?
PCM realiza un muestreo para calcular el espacio de disco utilizado por los archivos en el conjunto de rutas. Esto significa que algunos archivos pueden quedar fuera de la enumeración de segmentos únicos porque, por motivos de rendimiento, no se tienen en cuenta archivos más pequeños que un tamaño determinado. El tamaño mínimo de los archivos individuales en los conjuntos de rutas que los trabajos de PCM consideran para la enumeración (y, por lo tanto, aquellos para los que representa el espacio en disco utilizado) depende del tamaño promedio del segmento del sistema de archivos:
- Si el tamaño promedio del segmento es de 4 K, PCM ignora los archivos de 4 MB o menores
- Si el tamaño promedio de segmento es de 8 K, PCM ignora los archivos de 8 MB o menos
- Si el tamaño promedio de segmento es de 12 000, PCM ignora los archivos de 12 MB o menos
Los datos reales de los clientes muestran que el tamaño promedio de los segmentos ronda los 9 KB para los casos de uso más comunes, por lo que una cifra aproximada de los archivos que no se consideran cuando un PCM calcula el espacio de disco utilizado sería la de menos de 9 MB.
¿Se requieren licencias adicionales para PCM?
No. PCM no es una función con licencia y, por lo tanto, no se requieren licencias adicionales para usar PCM.
¿Se admite PCM en todas las plataformas?
No. PCM es compatible con todos los dispositivos de hardware y Virtual Data Domain (DDVE), excepto en el nivel activo de DDVE de almacenamiento de objetos (ATOS).
PCM solo mide y enumera los archivos en el nivel activo: Los archivos que se encuentran en unidades de nube (o para Extended Retention heredada, aquellos en unidades de archivador) no se incluyen en el cálculo de tamaño de los trabajos de PCM.
¿Se requiere algún otro requisito previo antes de poder utilizar PCM?
De manera predeterminada, PCM está deshabilitado en DDOS 5.7. Antes de que se pueda usar, debe estar habilitado y su caché inicializada, como se muestra a continuación:
sysadmin@dd9500# compression physical-capacity-measurement enable and-initialize physical-capacity-measurement enabled. Initialization started.
Nota: La caché de PCM se utiliza para acelerar futuros trabajos de PCM, y la inicialización de la caché puede tardar un tiempo considerable. A pesar de esto, los trabajos de PCM pueden comenzar a ponerse en cola mientras se inicializa la caché de PCM.
¿Cómo calcula PCM los totales de uso?
PCM utiliza instantáneas de MTree para determinar la utilización física de un grupo de archivos. Como resultado, cuando se inicia un trabajo de PCM, sucede lo siguiente:
- Se crea una instantánea de MTree en los MTrees subyacentes.
sysadmin@dd9500# snapshot list mtree /data/col1/jf2 Snapshot Information for MTree: /data/col1/jf2 ---------------------------------------------- Name Pre-Comp (GiB) Create Date Retain Until Status --------------------------------- -------------- ----------------- ----------------- ------- pcr_snap_1440284055_1440360259_19 6.0 Aug 23 2015 13:04 Dec 31 1969 16:00 expired --------------------------------- -------------- ----------------- ----------------- -------
- PCM busca archivos de la instantánea que se incluirán en el trabajo de PCM (es decir, en los conjuntos de rutas o MTrees especificados).
- PCM recorre el árbol de segmentos de estos archivos para crear esencialmente una lista de huellas digitales de segmentos únicas a las que hacen referencia todos los archivos.
- A continuación, PCM encuentra los segmentos correspondientes en el disco (dentro del conjunto de contenedores) y calcula la suma del tamaño de esos segmentos.
-
La suma del tamaño de estos segmentos representa el uso actual del disco duro por parte de los archivos correspondientes.
- Además de lo anterior, el tamaño precomprimido del conjunto de archivos se puede encontrar en los metadatos del archivo correspondiente.
- Una vez que se completan los trabajos de PCM, las instantáneas de PCM subyacentes vencen para su posterior eliminación.
¿Cómo funcionan los trabajos de PCM?
Un usuario (o una programación) envía los trabajos de PCM y se agregan a una cola de trabajo de PCM. Según la carga de trabajo del sistema, los trabajos de PCM se pueden seleccionar de la cola e iniciar de inmediato o se pueden aplazar por un tiempo.
Algunos ejemplos de por qué se pueden aplazar los trabajos de PCM son los siguientes:
- La limpieza del nivel activo está en ejecución en el sistema: los trabajos de PCM y la limpieza del nivel activo no se pueden ejecutar en paralelo. Como resultado, los trabajos de PCM en línea de espera mientras se ejecuta la limpieza del nivel activo se aplazan hasta que se completa la limpieza del nivel activo.
- Ya hay algunos trabajos de PCM que se ejecutan en MTrees subyacentes: PCM utiliza instantáneas de MTree y hay límites estrictos en la cantidad de instantáneas de PCM que un usuario determinado puede crear en un momento determinado con un solo MTree. Si un nuevo trabajo de PCM supera estos límites, el trabajo se aplaza hasta que se complete el trabajo existente.
¿Es posible controlar los recursos que utiliza PCM en un sistema?
PCM utiliza un mecanismo de regulación similar al que utiliza la limpieza de nivel activo, es decir, la regulación de PCM se puede configurar de 0 (no agresivo) a 100 (agresivo). Evidentemente, cuanto mayor sea la regulación, más recursos utilizará PCM y mayor será el impacto que los trabajos de PCM puedan tener en otras cargas de trabajo del sistema.
De manera predeterminada, la regulación del PCM está establecida en 20, es decir:
sysadmin@dd9500# compression physical-capacity-measurement throttle show Throttle is set to 20 percent (default).
La regulación de PCM se puede modificar de la siguiente manera y el cambio a la regulación se realiza de inmediato (es decir, no se requiere un reinicio de DDFS para que PCM recoja la nueva configuración de regulación):
sysadmin@dd9500# compression physical-capacity-measurement throttle set 50 Throttle set to 50 percent.
¿Qué son los pathsets?
Los trabajos de PCM se pueden ejecutar de dos maneras, a saber:
- Contra un "conjunto de rutas" predefinido (es decir, una recopilación de directorios especificada por el usuario)
- Contra un solo mtree
Antes de que se puedan ejecutar trabajos en un conjunto de rutas determinado, se debe crear o definir el conjunto de rutas de la siguiente manera:
sysadmin@dd9500# compression physical-capacity-measurement pathset create jfall paths /data/col1/jf1,/data/col1/jf2 Pathset "jfall" created.Los directorios específicos se pueden agregar o eliminar de un conjunto de rutas existente de la siguiente manera:
sysadmin@dd9500# compression physical-capacity-measurement pathset del jfall paths /data/col1/jf2 Path(s) deleted from pathset "jfall". sysadmin@dd9500# compression physical-capacity-measurement pathset add jfall paths /data/col1/jf2 Path(s) added to pathset "jfall".
Todos los conjuntos de rutas que se crearon se muestran de la siguiente manera:
sysadmin@dd9500# compression physical-capacity-measurement pathset show list Pathset Number of paths Measurement-retention (days) --------------- --------------- ---------------------------- jf1 1 180 jf2 1 180 jfall 2 180 phys-gandhi3 1 180 phys-gandhi5-fc 1 180 phys-gandhi5 1 180 phys2-gandhi3 2 180 --------------- --------------- ---------------------------- 7 pathset(s) found.
Para ver rutas específicas definidas dentro de un conjunto de rutas, el pathset show detailed se utiliza el comando:
sysadmin@dd9500# compression physical-capacity-measurement pathset show detailed jfall Pathset: jfall Number of paths: 2 Measurement-retention: 180 day(s) Paths: /data/col1/jf1 /data/col1/jf2 sysadmin@dd9500#
Para eliminar una ruta, establezca el parámetro pathset destroy se puede utilizar el comando:
sysadmin@dd9500# compression physical-capacity-measurement pathset destroy jfall
Nota: Esto elimina todo el historial del conjunto de rutas determinado.
¿Cómo se inicia un trabajo de PCM?
Se envía un nuevo trabajo de PCM a la cola de trabajo de PCM mediante el comando sample start comando, es decir:
sysadmin@dd9500# compression physical-capacity-measurement sample start pathsets jfall Measurement task(s) submitted and will begin as soon as resources are available.
En el ejemplo anterior, se utilizó un conjunto de rutas predefinido. Para enviar un trabajo de PCM contra un único mtree, se especifica el mtree, es decir:
sysadmin@dd9500# compression physical-capacity-measurement sample start mtrees /data/col1/backup Measurement task(s) submitted and will begin as soon as resources are available.
De manera predeterminada, los trabajos de PCM se envían con una prioridad "normal". También es posible especificar una prioridad de urgente:
sysadmin@dd9500# compression physical-capacity-measurement sample start pathsets jf1 priority urgent Measurement task(s) submitted and will begin as soon as resources are available.
Los trabajos con prioridad "urgente" se ponen en cola por delante de los que tienen prioridad "normal" (lo que significa que se seleccionan y trabajan con preferencia a cualquier trabajo enviado con prioridad "normal").
Se muestra una lista de trabajos enviados o en ejecución mediante el sample show current comando, por ejemplo:
sysadmin@dd9500# compression physical-capacity-measurement sample show current Task ID Type Name User State Creation Time Measurement Time Start Time Priority Percent (Submitted Time) Done ----------- ---- ----- -------- --------- ------------------- ------------------- ---------- -------- -------- 47244640259 PS jf2 sysadmin Scheduled 2015/08/23 12:24:12 2015/08/23 12:24:12 -- Urgent 0 47244640258 PS jf1 sysadmin Scheduled 2015/08/23 12:24:09 2015/08/23 12:24:09 -- Urgent 0 47244640257 PS jfall sysadmin Scheduled 2015/08/23 12:23:06 2015/08/23 12:23:06 -- Normal 0 ----------- ---- ----- -------- --------- ------------------- ------------------- ---------- -------- -------- sysadmin@dd9500#
¿Se pueden programar trabajos de PCM?
Sí: si se debe ejecutar un trabajo de PCM específico con regularidad, se programa para que se ejecute automáticamente según sea necesario. Por ejemplo:
sysadmin@dd9500# compression physical-capacity-measurement schedule create jf_sched pathsets jfall,jf1,jf2 time 1400 Schedule "jf_sched" created.
Nota: Los programas se crean para que se ejecuten diariamente, en días específicos de la semana o ciertos días de cada mes.
Un programa existente se modifica mediante el comando schedule modify comando:
sysadmin@dd9500# compression physical-capacity-measurement schedule modify jf_sched priority urgent time 1700 day Wed,Fri Schedule "jf_sched" modified.
Además, un programa existente puede tener conjuntos de rutas agregados o eliminados de la siguiente manera:
sysadmin@dd9500# compression physical-capacity-measurement schedule del jf_sched pathsets jf2 Schedule "jf_sched" modified. sysadmin@dd9500# compression physical-capacity-measurement schedule add jf_sched pathsets jf2 Schedule "jf_sched" modified.
Nota: Una programación no puede contener solo conjuntos de rutas O MTrees (es decir, los dos no se pueden combinar):
sysadmin@dd9500# compression physical-capacity-measurement schedule create jf_sched2 mtrees /data/col1/backup time 1400 Schedule "jf_sched2" created. sysadmin@dd9500# compression physical-capacity-measurement schedule add jf_sched2 pathsets jfall **** Failed to add: this schedule is only for mtrees.
Para ver los detalles de los programas existentes, consulte schedule show all comando, por ejemplo:
sysadmin@dd9500# compression physical-capacity-measurement schedule show all Name: jf_sched Status: enabled Priority: urgent Frequency: weekly on Wed, Fri Time: 17:00 Pathset(s): jfall jf1 jf2 Name: jf_sched2 Status: enabled Priority: normal Frequency: daily Time: 14:00 MTree(s): /data/col1/backup
Las programaciones existentes se pueden deshabilitar o habilitar de inmediato, es decir:
sysadmin@dd9500# compression physical-capacity-measurement schedule disable jf_sched2 Schedule "jf_sched2" disabled. sysadmin@dd9500# compression physical-capacity-measurement schedule enable jf_sched2 Schedule "jf_sched2" enabled.
Un programa también puede ser destruido:
sysadmin@dd9500# compression physical-capacity-measurement schedule destroy jf_sched2 Schedule "jf_sched2" destroyed.
Nota: Esto NO elimina el historial de los MTrees/conjuntos de rutas correspondientes (significa que los nuevos trabajos de PCM no se programan automáticamente).
¿Cómo se inician los trabajos programados?
Cuando se agrega y habilita un programa de PCM, esto hace que se agregue una entrada correspondiente a /etc/crontabEs decir:
# # collection.1.crontab.pcr.jf_sched.0 # 00 17 * * Wed,Fri root /ddr/bin/ddsh -a compression physical-capacity-measurement sample start force priority urgent objects-from-schedule jf_sched
Nota: El trabajo cron se elimina de
/etc/crontab Si el programa está deshabilitado o destruido.
¿Puedo dejar de ejecutar un trabajo de PCM?
Sí: los trabajos de PCM en ejecución se pueden anular mediante el ID de tarea o los nombres de conjunto de rutas/mtree. Por ejemplo, vemos que tenemos dos trabajos de PCM en cola:
SE@dd9500## compression physical-capacity-measurement sample show current Task ID Type Name User State Creation Time Measurement Time Start Time Priority Percent (Submitted Time) Done ------------ ---- ----- -------- --------- ------------------- ------------------- ---------- -------- -------- 124554051585 PS jfall sysadmin Scheduled 2015/08/30 16:00:48 2015/08/30 16:00:48 -- Normal 0 124554051586 PS jfall sysadmin Scheduled 2015/08/30 16:01:55 2015/08/30 16:01:55 -- Normal 0 ------------ ---- ----- -------- --------- ------------------- ------------------- ---------- -------- --------
Estos trabajos se pueden anular mediante el identificador de tarea (para detener un solo trabajo):
SE@dd9500## compression physical-capacity-measurement sample stop task-id 124554051585 ** This will abort any submitted or running compression physical-capacity-measurement sampling tasks. Do you want to proceed? (yes|no) [no]: yes 1 task(s) aborted.
Dejándonos con un solo trabajo en ejecución:
SE@dd9500## compression physical-capacity-measurement sample show current Task ID Type Name User State Creation Time Measurement Time Start Time Priority Percent (Submitted Time) Done ------------ ---- ----- -------- --------- ------------------- ------------------- ---------- -------- -------- 124554051586 PS jfall sysadmin Scheduled 2015/08/30 16:01:55 2015/08/30 16:01:55 -- Normal 0 ------------ ---- ----- -------- --------- ------------------- ------------------- ---------- -------- --------
O bien el nombre del conjunto de rutas:
SE@dd9500## compression physical-capacity-measurement sample stop pathsets jfall ** This will abort any submitted or running compression physical-capacity-measurement sampling tasks. Do you want to proceed? (yes|no) [no]: yes 1 task(s) aborted.
Dejándonos sin trabajo:
SE@dd9500## compression physical-capacity-measurement sample show current No measurement tasks found.
¿Cómo se pueden mostrar los detalles de los trabajos completados?
Los detalles de los trabajos completados se ven con la sample show history comando. Por ejemplo, para mostrar los detalles de un único conjunto de rutas:
SE@dd9500## compression physical-capacity-measurement sample show history pathset jfall Pathset: jfall Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- 2015/08/23 12:23:06 7.0 4.2 1.70x 0.98x 1.67x (40.24%) 2015/08/23 13:04:20 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 2015/08/26 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 2015/08/27 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 2015/08/28 14:00:02 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 2015/08/29 14:00:02 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 2015/08/30 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) ------------------- ------------ ------------- ----------- ---------- -------------- Total number of measurements retrieved = 7.
El parámetro detailed-history también muestra las horas de inicio y finalización de cada trabajo:
SE@dd9500## compression physical-capacity-measurement sample show detailed-history pathset jfall Pathset: jfall Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp Task ID Task Start Time Task End Time (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- ------------ ------------------- ------------------- 2015/08/23 12:23:06 7.0 4.2 1.70x 0.98x 1.67x (40.24%) 47244640257 2015/08/23 12:25:19 2015/08/23 12:25:23 2015/08/23 13:04:20 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 51539607553 2015/08/23 13:05:45 2015/08/23 13:05:48 2015/08/26 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 77309411329 2015/08/26 14:02:50 2015/08/26 14:02:50 2015/08/27 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 85899345921 2015/08/27 14:03:06 2015/08/27 14:03:06 2015/08/28 14:00:02 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 94489280513 2015/08/28 14:02:50 2015/08/28 14:02:51 2015/08/29 14:00:02 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 103079215105 2015/08/29 14:01:40 2015/08/29 14:01:41 2015/08/30 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 115964116993 2015/08/30 14:04:12 2015/08/30 14:04:12 ------------------- ------------ ------------- ----------- ---------- -------------- ------------ ------------------- ------------------- Total number of measurements retrieved = 7.
Nota: Cualquiera de los comandos se puede modificar para recuperar solo los resultados durante un período específico:
SE@dd9500## compression physical-capacity-measurement sample show history pathset jfall last 2days Pathset: jfall Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- 2015/08/29 14:00:02 10.0 6.2 1.63x 0.98x 1.61x (37.84%) 2015/08/30 14:00:01 10.0 6.2 1.63x 0.98x 1.61x (37.84%) ------------------- ------------ ------------- ----------- ---------- -------------- Total number of measurements retrieved = 2.
O entre fechas u horas específicas:
SE@dd9500## compression physical-capacity-measurement sample show history pathset jfall start 08231010 end 08231400 Pathset: jfall Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- 2015/08/23 12:23:06 7.0 4.2 1.70x 0.98x 1.67x (40.24%) 2015/08/23 13:04:20 10.0 6.2 1.63x 0.98x 1.61x (37.84%) ------------------- ------------ ------------- ----------- ---------- -------------- Total number of measurements retrieved = 2.
¿Cuánto tiempo se conserva un historial específico para un conjunto de rutas/mtree específico?
De manera predeterminada, los resultados de cada conjunto de rutas de PCM se conservan durante 180 días. Esto se puede cambiar mediante la modificación del conjunto de rutas correspondiente:
SE@dd9500## compression physical-capacity-measurement pathset modify jfall measurement-retention 14 Measurement-retention changed to 14 day(s).
El historial de PCM se guarda en la base de datos histórica de los sistemas. Como resultado, si la base de datos histórica se pierde o se daña, también se perderán los detalles de todo el historial de PCM.
¿Hay alguna advertencia que se deba tener en cuenta cuando se utiliza PCM?
Los trabajos de PCM se suspenden si el sistema tiene menos del 10 % de espacio disponible.
Los trabajos de PCM se suspenden mientras se ejecuta el ciclo de limpieza.
Como se indicó anteriormente, PCM es una herramienta que se utiliza para calcular la utilización física por parte de un conjunto específico de directorios/mtrees. Al calcular los resultados de un conjunto de rutas específico o un conjunto de MTrees, PCM solo cuenta el tamaño de cada segmento único de datos utilizado por el conjunto de rutas o el conjunto de MTrees una vez.
Como resultado de esto, si la deduplicación de archivos con los mismos datos se encuentran en varios trabajos de PCM diferentes, cada uno de los segmentos que componen los archivos se puede contar varias veces (una vez por cada trabajo de PCM). Esto significa que, si bien los resultados de cada trabajo de PCM individual son precisos, los resultados de varios trabajos de PCM no se pueden sumar para proporcionar una utilización física precisa de la suma de conjuntos de rutas/mtrees en los trabajos.
Debido a la manera en que se organizan los trabajos de PCM, el conjunto de rutas o el espacio posterior a la compresión de MTree que se usan en el disco:
- Los trabajos de PCM no toman en cuenta los datos inactivos (espacio de disco utilizado por los archivos eliminados, espacio en el disco que es posible que aún no se haya recuperado mediante la ejecución de GC).
- PCM no tiene en cuenta los datos bloqueados en las instantáneas creadas para el MTree o los conjuntos de rutas que se miden.
Por ejemplo, tengo un mtree llamado /data/col1/jf1 en el que creo tres archivos de 1Gb, es decir:
!!!! dd9500 YOUR DATA IS IN DANGER !!!! # for i in 1 2 3 ; do
> dd if=/dev/urandom of=/data/col1/jf1/${i} bs=1024k count=1024
> done
A continuación, copio esos archivos en un segundo mtree (/data/col1/jf2):
!!!! dd9500 YOUR DATA IS IN DANGER !!!! # cp /data/col1/jf1/1 /data/col1/jf2/4 !!!! dd9500 YOUR DATA IS IN DANGER !!!! # cp /data/col1/jf1/2 /data/col1/jf2/5 !!!! dd9500 YOUR DATA IS IN DANGER !!!! # cp /data/col1/jf1/3 /data/col1/jf2/6
Por último, creo un nuevo archivo de 1 Gb en /data/col1/jf2:
!!!! dd9500 YOUR DATA IS IN DANGER !!!! # dd if=/dev/urandom of=/data/col1/jf2/7 bs=1024k count=1024 1024+0 records in 1024+0 records out
Si se ignora la compresión local de datos y solo se considera la deduplicación, queda claro que cada mtree utilizó la siguiente cantidad de espacio físico cuando se escribieron los archivos:
/data/col1/jf1: 3 Gb
/datos/col1/jf2: 1 Gb (para el nuevo archivo: los archivos copiados se habrían desduplicado con respecto a los datos existentes, por lo que habrían consumido un espacio físico mínimo).
Como resultado, la suma de la utilización del espacio físico por /data/col1/jf1 y /data/col1/jf2 debe ser de alrededor de 4 Gb.
Se crean tres conjuntos de rutas de PCM:
jf1 que contiene /data/col1/jf1
jf2 que contiene /data/col1/jf2
jfall que contiene data/col1/jf1 y /data/col1/jf2
Los trabajos de PCM se ejecutan y proporcionan resultados de la siguiente manera:
Pathset: jf1 Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- 2015/08/23 12:24:09 3.0 3.2 0.96x 0.98x 0.94x (-6.21%) ------------------- ------------ ------------- ----------- ---------- -------------- Pathset: jf2 Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- 2015/08/23 12:24:12 4.0 4.2 0.98x 0.98x 0.96x (-4.14%) ------------------- ------------ ------------- ----------- ---------- --------------
Estos valores son correctos, ya que cada trabajo de PCM solo analiza los datos físicos a los que hacen referencia los archivos en su conjunto de rutas correspondiente. Esto significa que los datos de los archivos que se copiaron se cuentan dos veces (una vez por cada trabajo de PCM).
Puede parecer razonable que para obtener la utilización física total por parte del /data/col1/jf1 y /data/col1/jf2 MTrees, podemos sumar los valores de "físico utilizado" de las salidas anteriores.
Para obtener un valor preciso de la utilización física total de /data/col1/jf1 y /data/col1/jf2, es necesario ejecutar un solo trabajo de PCM que cubra ambos MTrees (es decir, use jfall). Esto garantiza que los segmentos duplicados solo se cuenten una vez y no dos veces como en el ejemplo anterior, es decir:
Pathset: jfall Measurement Time Logical Used Physical Used Global-Comp Local-Comp Total-Comp (Pre-Comp) (Post-Comp) Factor Factor Factor (GiB) (GiB) (Reduction %) ------------------- ------------ ------------- ----------- ---------- -------------- 2015/08/23 12:23:06 7.0 4.2 1.70x 0.98x 1.67x (40.24%) ------------------- ------------ ------------- ----------- ---------- --------------
En resumen, la salida de varios trabajos de PCM no se puede sumar para proporcionar una utilización física precisa para un conjunto de conjuntos de rutas/mtrees. En su lugar, se debe definir un único conjunto de rutas de PCM que cubra todos los MTrees/directorios necesarios, ya que esto garantiza que los datos duplicados solo se cuenten una vez. Si esto no se realiza y se debe ejecutar un trabajo de PCM independiente para cada mtree en un sistema, por ejemplo, los resultados sumados indican que es muy posible que la capacidad física total utilizada supere la capacidad cruda del sistema.
¿Los trabajos de PCM solo pueden ser enviados por el DDSH línea de comandos o también se puede utilizar una interfaz de usuario?
En este documento, se utiliza la interfaz de línea de comandos (DDSH) de Data Domain para configurar, enviar y revisar trabajos de PCM.