Data Domain Operating System no soporta el reequilibrado proactivo de datos en todo el almacenamiento después de expandir la capacidad del sistema de archivos Data Domain.
Summary: En este artículo se explica que no hay soporte incorporado dentro de Data Domain Operating System (DDOS) para el reequilibrado de datos en todo el almacenamiento después de expandir el sistema de archivos Data Domain (DDFS) en un restaurador de Data Domain (DDR). ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Instructions
Al igual que con muchos arreglos de almacenamiento, la capacidad de la mayoría de los modelos de restaurador de Data Domain (DDR) se puede aumentar agregando bandejas de gabinete de almacenamiento externo (ES30, DS60) al sistema y, a continuación, expandiendo el sistema de archivos Data Domain (DDFS) en estas bandejas de gabinete. Cuando esto se lleva a cabo:
El reequilibrado de datos se realiza mediante dos operaciones:
Limpieza de recolección de elementos no utilizados
La limpieza de recolección de elementos no utilizados (GC) es una actividad programada que se ejecuta regularmente en un DDR (de manera predeterminada, una vez a la semana en el nivel activo y, suponiendo que la recuperación de espacio esté habilitada, cuando sea necesario en las unidades de archivo). Cuando se ejecuta:
A modo de ejemplo:
Cuando se escribe un archivo en un DDR, se llevan a cabo las siguientes operaciones de alto nivel:
Lograr un buen rendimiento de lectura de datos en un DDR requiere que el archivo tenga una buena “localidad” (sus datos son relativamente secuenciales en el disco), de modo que los algoritmos de lectura anticipada de DDFS puedan funcionar de manera óptima. Tenga en cuenta también que DDFS supone que el archivo desde el que es más probable que se lea (para restauración o replicación) es la copia más reciente de un respaldo determinado. Como resultado, para ciertos tipos de datos (como los sintéticos virtuales), se realiza un proceso llamado “reparación de localidad” para “optimizar” la localidad de los datos de archivos recién escritos. Cuando se ejecuta, la reparación de localidad realiza lo siguiente:
Como resultado, a través del uso normal de la funcionalidad de reparación y limpieza de localidad (GC), un DDR puede reequilibrar los datos de manera transparente en todas las bandejas a lo largo del tiempo. Esto sucede sin ninguna acción adicional de los administradores y significa que no hay necesidad de una funcionalidad dedicada de operaciones de reequilibrado de datos, como a veces se ve en otros arreglos de almacenamiento. Por lo tanto, para aumentar la velocidad a la que se produce el reequilibrado, se necesita lo siguiente:
- Las nuevas bandejas de gabinete están conectadas físicamente (encendidas con cable).
- Data Domain Operating System (DDOS) reexamina el almacenamiento para identificar la existencia de nuevas bandejas de gabinete.
- Estas nuevas bandejas de gabinete se agregan a un nivel de almacenamiento dentro del DDR (el nivel activo o una unidad de archivo específica).
- Luego, este nivel se puede expandir en línea sin necesidad de una interrupción en DDFS.
- Todos los datos nuevos escritos en ese nivel de almacenamiento se escriben en las bandejas existentes y nuevas.
- Sin embargo, los datos de las bandejas existentes no se reequilibran entre las bandejas de gabinetes nuevas.
- Dentro de DDOS, la unidad de almacenamiento de datos es un “contenedor” de 4,5 Mb.
- A medida que se crean, los contenedores de 4,5 Mb se escriben en todas las bandejas de gabinetes de la unidad de archivo de nivel correspondiente de manera round robin.
- Cuando se agregan bandejas de gabinetes adicionales a una unidad de archivo de nivel, DDFS comienza a escribir nuevos contenedores de 4,5 Mb en estos gabinetes, además de los gabinetes existentes (los nuevos gabinetes se incluyen cuando se escribe el contenedor round robin).
- Sin embargo, DDOS no realiza ningún intento específico (ni ofrece ninguna funcionalidad específica) para migrar los contenedores existentes en el nivel de los gabinetes de bandejas existentes a los nuevos.
- Inicialmente, un DDR tiene un solo gabinete en su nivel activo que está lleno en un 90 %.
- Se agrega un gabinete adicional al nivel activo y DDFS se expande a este gabinete.
- Las escrituras de contenedores de 4,5 Mb recién creados ahora se asignan de manera round robin en los gabinetes existentes y nuevos.
- Esto deja al gabinete existente con poco espacio libre, mientras que el gabinete recién agregado está casi vacío.
El reequilibrado de datos se realiza mediante dos operaciones:
- Limpieza de recolección de elementos no utilizados
- Reparación de localidad
Limpieza de recolección de elementos no utilizados
La limpieza de recolección de elementos no utilizados (GC) es una actividad programada que se ejecuta regularmente en un DDR (de manera predeterminada, una vez a la semana en el nivel activo y, suponiendo que la recuperación de espacio esté habilitada, cuando sea necesario en las unidades de archivo). Cuando se ejecuta:
- Identifica qué datos físicos dentro de la unidad de archivo de nivel están “activos” (utilizados por uno o más archivos en el sistema de archivos u objetos, como instantáneas) o “inactivos” (no están referenciados por ningún objeto; por lo tanto, son superfluos para el sistema).
- Determina los contenedores de 4,5 Mb que contienen la mayoría de los datos “inactivos” dentro de la unidad de archivo de nivel.
- Lee estos contenedores de 4,5 Mb y extrae los datos “activos” que contienen, y luego se “reenvía la copia” en contenedores de 4,5 Mb recién creados que se escriben en todas las bandejas de la unidad de archivo de nivel.
- Elimina los antiguos contenedores de 4,5 Mb; por lo tanto, elimina los datos inactivos que contienen y libera espacio subyacente en el disco para su reutilización.
A modo de ejemplo:
- El nivel activo de un DDR contiene dos bandejas: la primera bandeja contiene 10 000 contenedores de 4,5 Mb, mientras que la segunda bandeja contiene 100 contenedores de 4,5 Mb (por cada contenedor en la segunda bandeja, hay 100 contenedores en la primera bandeja).
- La GC ejecuta y reenvía la copia de datos de 5000 contenedores en la primera bandeja.
- Los datos activos dentro de estos 5000 contenedores hacen que se creen 1000 nuevos contenedores de 4,5 Mb.
- Estos 1000 nuevos contenedores de 4,5 Mb se escriben en ambas bandejas.
- Una vez que la GC se completa, la primera bandeja contiene 5500 contenedores de 4,5 Mb, mientras que la segunda bandeja contiene 600 contenedores (por cada contenedor en la segunda bandeja, hay aproximadamente nueve contenedores en la primera bandeja).
- En una sola ejecución de GC, el desequilibrio de contenedores entre la primera y la segunda bandeja se redujo en un factor de 10; se espera que se reduzca aún más durante las ejecuciones posteriores de GC, lo que significa que los datos se reequilibran en todas las bandejas de forma natural con el tiempo.
Cuando se escribe un archivo en un DDR, se llevan a cabo las siguientes operaciones de alto nivel:
- El archivo se divide en fragmentos lógicos (llamados segmentos) de 4 a 12 Kb de tamaño.
- Cada segmento se comprueba para ver si ya existe en el disco dentro del nivel en el que se escribe el archivo.
- Si el segmento ya existe, se trata de datos duplicados y el segmento dentro del archivo recién escrito se reemplaza por un puntero en los datos existentes en el disco.
- Si el segmento no existe, son datos únicos y, por lo tanto, se empaquetan en un nuevo contenedor de 4,5 Mb y se escriben en el disco.
Lograr un buen rendimiento de lectura de datos en un DDR requiere que el archivo tenga una buena “localidad” (sus datos son relativamente secuenciales en el disco), de modo que los algoritmos de lectura anticipada de DDFS puedan funcionar de manera óptima. Tenga en cuenta también que DDFS supone que el archivo desde el que es más probable que se lea (para restauración o replicación) es la copia más reciente de un respaldo determinado. Como resultado, para ciertos tipos de datos (como los sintéticos virtuales), se realiza un proceso llamado “reparación de localidad” para “optimizar” la localidad de los datos de archivos recién escritos. Cuando se ejecuta, la reparación de localidad realiza lo siguiente:
- Examina los datos a los que hace referencia el archivo en busca de secciones en las que los datos no son secuenciales en el disco (se muestra una localidad deficiente).
- Lee estos datos no secuenciales del disco y vuelve a escribirlos secuencialmente (como datos duplicados) en contenedores de 4,5 Mb recién creados.
- En los sistemas en los que hay un desequilibrio de datos, se espera que la mayoría de los datos no secuenciales antiguos existan en bandejas de gabinetes antiguos más llenos.
- Cuando estos datos se reescriben secuencialmente como datos duplicados, se colocan en nuevos contenedores de 4,5 Mb que se asignan de manera round robin en todos los gabinetes del nivel correspondiente.
- Como resultado, la mayoría de los datos “inactivos” (datos duplicados antiguos) creados por la reparación de localidad existen en bandejas antiguas más llenas.
- Cuando se ejecuta la GC, la mayoría de los datos “inactivos” se encuentran en bandejas antiguas más llenas y se eliminan (lo que libera espacio en estas bandejas), como se describió anteriormente.
Como resultado, a través del uso normal de la funcionalidad de reparación y limpieza de localidad (GC), un DDR puede reequilibrar los datos de manera transparente en todas las bandejas a lo largo del tiempo. Esto sucede sin ninguna acción adicional de los administradores y significa que no hay necesidad de una funcionalidad dedicada de operaciones de reequilibrado de datos, como a veces se ve en otros arreglos de almacenamiento. Por lo tanto, para aumentar la velocidad a la que se produce el reequilibrado, se necesita lo siguiente:
- Aumentar la velocidad a la que se renuevan los datos en el DDR.
- Aumentar la cantidad de datos que se reparan localmente en el DDR.
Affected Products
Data DomainArticle Properties
Article Number: 000019150
Article Type: How To
Last Modified: 29 Jul 2025
Version: 4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.