Questions fréquentes sur la mesure de la capacité physique ou la création de rapports sur la capacité physique DDOS

Summary: Questions fréquentes sur la mesure de la capacité physique (PCM) ou la création de rapports sur la capacité physique (PCR) du système d’exploitation Data Domain (DD OS).

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

La version 5.7 du système d’exploitation Data Domain (DD OS) introduit une nouvelle fonctionnalité appelée Physical Capacity Measurement (PCM) ou Physical Capacity Reporting (PCR).

Cet article décrit les cas d’utilisation courants et les questions relatives à cette fonctionnalité. Les termes PCM et PCR sont interchangeables dans le présent document.

Qu’est-ce que la mesure de la capacité physique (PCM) ?
PCM est une nouvelle fonctionnalité prise en charge dans DD OS 5.7 et versions ultérieures qui permet de calculer l’utilisation précise du disque dur par une arborescence de répertoires, une collection d’arborescences de répertoires, une structure mtree ou une collection de structures MTree.

En quoi diffère-t-elle des fonctionnalités des versions précédentes de DDOS ?
Lorsqu’un fichier est ingéré sur une DDR, nous enregistrons diverses statistiques sur ce fichier. L’une de ces statistiques est les « octets post-lc », c’est-à-dire la quantité d’espace physique occupée par un fichier lorsqu’il est écrit sur le système. Nous pouvons afficher les octets post-lc d’un fichier ou d’une arborescence de répertoires à l’aide de la commande filesys show compression commande - par exemple :

sysadmin@dd9500# filesys show compression /data/col1/jf1
Total files: 4;  bytes/storage_used: 1.3
       Original Bytes:        4,309,378,324
  Globally Compressed:        3,242,487,836
   Locally Compressed:        3,293,594,658
            Meta-data:           13,897,112

Cela indique que l’arborescence de répertoires ci-dessus contient quatre fichiers qui, au total, ont utilisé 3 293 594 658 octets (3,07 Go) d’espace physique lors de l’acquisition.
 

Remarque : Ces statistiques sont générées au moment de l’ingestion et ne sont pas mises à jour après cette période. Toutefois, en raison de la nature de la déduplication, lorsque des fichiers supplémentaires sont ingérés ou supprimés et que le nettoyage s’exécute, la façon dont les données sur le disque sont dédupliquées et, par conséquent, la façon dont chaque fichier est dédupliqué (et la quantité de données « possède ») changent. Pour cette raison, les statistiques ci-dessus deviennent obsolètes au fil du temps et, parfois, les charges applicatives peuvent devenir inexactes.

La PCM est un effort pour éviter les résultats incohérents causés par les statistiques ci-dessus qui deviennent obsolètes. Étant donné que le PCM peut générer des rapports sur l’utilisation du disque dur à un point spécifique dans le temps, les limitations ci-dessus ne s’appliquent plus et les résultats sont garantis plus précis.

Existe-t-il des faits ou des configurations connus dans lesquels les résultats calculés par PCM sont connus pour ne pas être optimaux ?
PCM effectue un échantillonnage pour le calcul de l’espace disque utilisé par les fichiers dans le jeu de chemins. Cela signifie que certains fichiers peuvent être omis de l’énumération pour les segments uniques, car, pour des raisons de performances, les fichiers inférieurs à une taille donnée ne sont pas pris en compte. La taille minimale des fichiers individuels dans les jeux de chemins que les tâches PCM prennent en compte pour l’énumération (et donc ceux pour lesquels elle prend en compte l’espace disque utilisé) dépend de la taille moyenne des segments du système de fichiers :
  • Si la taille moyenne du segment est de 4 Ko, les fichiers de 4 Mo et moins sont ignorés par le PCM
  • Si la taille moyenne des segments est de 8 Ko, les fichiers de 8 Mo et moins sont ignorés par le PCM
  • Si la taille moyenne des segments est de 12 Ko, les fichiers de 12 Mo et moins sont ignorés par le PCM

Les données clients réelles montrent que la taille moyenne des segments oscille autour de 9 Ko pour les cas d’utilisation les plus courants. Par conséquent, un chiffre approximatif pour les fichiers non pris en compte lors du calcul de l’espace disque utilisé par le PCM serait ceux dont la taille est inférieure à 9 Mo.

Des licences supplémentaires sont-elles requises pour PCM ?
Non - PCM n’est pas une fonctionnalité sous licence et, par conséquent, aucune licence supplémentaire n’est requise pour utiliser PCM.

Le PCM est-il pris en charge sur toutes les plates-formes ?
Non - PCM est pris en charge sur toutes les appliances DDVE (Hardware et Virtual Data Domain Appliance), à l’exception des DDVE ATOS (Active Tier on Object Storage).

PCM mesure et énumère uniquement les fichiers du niveau actif : Les fichiers se trouvant dans des unités de Cloud (ou, dans le cas d’une rétention prolongée héritée, ceux dans des unités d’archiver) ne sont pas pris en compte dans le calcul de la taille pour les tâches PCM.

D’autres conditions préalables sont-elles requises avant d’utiliser la fonction PCM ?
Par défaut, PCM est désactivé dans DDOS 5.7. Pour pouvoir être utilisé, il doit être activé et son cache initialisé, comme indiqué ci-dessous :

sysadmin@dd9500# compression physical-capacity-measurement enable and-initialize
physical-capacity-measurement enabled. Initialization started.

Remarque : Le cache PCM est utilisé pour accélérer les tâches PCM futures, et l’initialisation du cache peut prendre beaucoup de temps. Malgré cela, les tâches PCM peuvent commencer à être mises en file d’attente pendant l’initialisation du cache PCM.

Comment PCM calcule-t-il les totaux d’utilisation ?
PCM utilise des snapshots de structure mtree pour déterminer l’utilisation physique d’un groupe de fichiers. Par conséquent, lorsqu’une tâche PCM démarre, les événements suivants se produisent :
  • Un snapshot de MTree est créé par rapport aux structures MTree sous-jacentes.
Remarque : Ce snapshot est nommé pcr_snap_*, à savoir :
sysadmin@dd9500# snapshot list mtree /data/col1/jf2
Snapshot Information for MTree: /data/col1/jf2
----------------------------------------------
Name                                Pre-Comp (GiB)   Create Date         Retain Until        Status
---------------------------------   --------------   -----------------   -----------------   -------
pcr_snap_1440284055_1440360259_19              6.0   Aug 23 2015 13:04   Dec 31 1969 16:00   expired
---------------------------------   --------------   -----------------   -----------------   -------
  • PCM recherche les fichiers du snapshot qui doivent se trouver dans la tâche PCM (c’est-à-dire dans les jeux de chemins ou les structures MTree spécifiés).
  • PCM parcourt l’arborescence des segments de ces fichiers pour créer une liste d’empreintes digitales de segments uniques référencées par tous les fichiers.
  • PCM recherche ensuite les segments correspondants sur le disque (dans l’ensemble de conteneurs) et calcule la somme de la taille de ces segments.
  • La somme de la taille de ces segments représente l’utilisation actuelle du disque dur par les fichiers correspondants.
  • En plus de ce qui précède, la taille précompressée de l’ensemble de fichiers peut être trouvée à partir des métadonnées de fichier correspondantes.
  • Une fois les tâches PCM terminées, les snapshots PCM sous-jacents expirent pour pouvoir être supprimés ultérieurement.


Comment fonctionnent les tâches PCM ?
Les tâches PCM sont soumises par un utilisateur (ou par une planification) et sont ajoutées à une file d’attente de travail PCM. En fonction de la charge applicative du système, les tâches PCM peuvent alors être sélectionnées dans la file d’attente et démarrées immédiatement, ou peuvent être différées pendant un certain temps.

Voici quelques exemples de raisons pour lesquelles les tâches PCM peuvent être différées :

  • Le nettoyage du niveau actif est en cours d’exécution sur le système : les tâches PCM et le nettoyage du niveau actif ne peuvent pas s’exécuter en parallèle. Par conséquent, les tâches PCM mises en file d’attente alors que le nettoyage du niveau actif est en cours d’exécution sont différées jusqu’à ce que le nettoyage du niveau actif soit terminé.
  • Il existe déjà des tâches PCM en cours d’exécution sur des structures MTree sous-jacentes : la PCM utilise des snapshots de mtree et il existe des limites strictes sur le nombre de snapshots de PCM qu’un utilisateur donné peut créer à un moment donné sur une seule structure mtree. Si ces limites sont dépassées par une nouvelle tâche PCM, la tâche est différée jusqu’à la fin de la tâche existante.


Est-il possible de contrôler les ressources utilisées par PCM sur un système ?
Le PCM utilise un mécanisme de régulation similaire à celui utilisé par le nettoyage du niveau actif, c’est-à-dire que la régulation du PCM peut être définie de 0 (non agressif) à 100 (agressif). Évidemment, plus la régulation est élevée, plus le nombre de ressources utilisées par le PCM est élevé, et plus les tâches PCM peuvent avoir un impact important sur les autres charges applicatives du système.

Par défaut, la régulation du PCM est réglée sur 20, c’est-à-dire :

sysadmin@dd9500# compression physical-capacity-measurement throttle show
Throttle is set to 20 percent (default).

La régulation du PCM peut être modifiée comme suit, le passage en régulation ayant lieu immédiatement (c’est-à-dire qu’aucun redémarrage de DDFS n’est nécessaire pour que le PCM récupère le nouveau paramètre de régulation) :

sysadmin@dd9500# compression physical-capacity-measurement throttle set 50
Throttle set to 50 percent.


Qu’est-ce qu’un ensemble de chemins ?
Les tâches PCM peuvent être exécutées de deux manières :

  • Sur un « ensemble de chemins » prédéfini (c’est-à-dire un ensemble de répertoires spécifié par l’utilisateur)
  • Sur une seule structure mtree

Pour que les tâches puissent être exécutées sur un jeu de chemins donné, celui-ci doit être créé ou défini comme suit :

sysadmin@dd9500# compression physical-capacity-measurement pathset create jfall paths /data/col1/jf1,/data/col1/jf2
Pathset "jfall" created.
Des répertoires spécifiques peuvent être ajoutés ou supprimés d’un chemin d’accès existant comme suit :
sysadmin@dd9500# compression physical-capacity-measurement pathset del jfall paths /data/col1/jf2
Path(s) deleted from pathset "jfall".
sysadmin@dd9500# compression physical-capacity-measurement pathset add jfall paths /data/col1/jf2
Path(s) added to pathset "jfall".

Tous les jeux de chemins qui ont été créés s’affichent comme suit :

sysadmin@dd9500# compression physical-capacity-measurement pathset show list
Pathset           Number of paths   Measurement-retention (days)
---------------   ---------------   ----------------------------
jf1                             1                            180
jf2                             1                            180
jfall                           2                            180
phys-gandhi3                    1                            180
phys-gandhi5-fc                 1                            180
phys-gandhi5                    1                            180
phys2-gandhi3                   2                            180
---------------   ---------------   ----------------------------
7 pathset(s) found.

Pour afficher des chemins spécifiques définis dans un jeu de chemins, le bouton pathset show detailed commande utilisée :

sysadmin@dd9500# compression physical-capacity-measurement pathset show detailed jfall
Pathset: jfall
    Number of paths: 2
    Measurement-retention: 180 day(s)
    Paths:
        /data/col1/jf1
        /data/col1/jf2
sysadmin@dd9500#

Pour supprimer un chemin, définissez l’option pathset destroy commande peut être utilisée :

sysadmin@dd9500# compression physical-capacity-measurement pathset destroy jfall

Remarque : Cela supprime tout l’historique pour le jeu de chemins donné.
 
Remarque : Les tâches ad hoc sur une seule structure MTree ne nécessitent pas qu’un chemin d’accès soit défini avant d’être exécutées.


Comment démarrer une tâche PCM ?
Une nouvelle tâche PCM est soumise à la file d’attente de travail PCM à l’aide de sample start commande, c’est-à-dire :

sysadmin@dd9500# compression physical-capacity-measurement sample start pathsets jfall
Measurement task(s) submitted and will begin as soon as resources are available.

Dans l’exemple ci-dessus, un jeu de chemins prédéfini a été utilisé. Pour soumettre une tâche PCM sur une seule structure mtree, celle-ci est spécifiée, c’est-à-dire :

sysadmin@dd9500# compression physical-capacity-measurement sample start mtrees /data/col1/backup
Measurement task(s) submitted and will begin as soon as resources are available.

Par défaut, les tâches PCM sont soumises avec la priorité « normal ». Il est également possible de spécifier une priorité d’urgent :

sysadmin@dd9500# compression physical-capacity-measurement sample start pathsets jf1 priority urgent
Measurement task(s) submitted and will begin as soon as resources are available.

Les tâches dont la priorité est « urgente » sont mises en file d’attente avant celles dont la priorité est « normale » (ce qui signifie qu’elles sont sélectionnées et traitées de préférence à toutes les tâches soumises dont la priorité est « normale »).

Une liste des tâches soumises ou en cours s’affiche à l’aide de l’icône sample show current , par exemple :

sysadmin@dd9500# compression physical-capacity-measurement sample show current
Task ID       Type   Name    User       State       Creation Time         Measurement Time      Start Time   Priority   Percent
                                                                          (Submitted Time)                              Done
-----------   ----   -----   --------   ---------   -------------------   -------------------   ----------   --------   --------
47244640259   PS     jf2     sysadmin   Scheduled   2015/08/23 12:24:12   2015/08/23 12:24:12   --           Urgent     0
47244640258   PS     jf1     sysadmin   Scheduled   2015/08/23 12:24:09   2015/08/23 12:24:09   --           Urgent     0
47244640257   PS     jfall   sysadmin   Scheduled   2015/08/23 12:23:06   2015/08/23 12:23:06   --           Normal     0
-----------   ----   -----   --------   ---------   -------------------   -------------------   ----------   --------   --------
sysadmin@dd9500#


Les tâches PCM peuvent-elles être planifiées ?
Oui - Si une tâche PCM spécifique doit être exécutée régulièrement, elle est planifiée pour s’exécuter automatiquement selon les besoins. Par exemple :

sysadmin@dd9500# compression physical-capacity-measurement schedule create jf_sched pathsets jfall,jf1,jf2 time 1400
Schedule "jf_sched" created.

Remarque : Les ordonnanceurs sont créés pour s’exécuter quotidiennement, certains jours de la semaine ou certains jours de chaque mois.

Un ordonnanceur existant est modifié à l’aide de la commande schedule modify WMIC suivante :

sysadmin@dd9500# compression physical-capacity-measurement schedule modify jf_sched priority urgent time 1700 day Wed,Fri
Schedule "jf_sched" modified.

En outre, des jeux de chemins peuvent être ajoutés ou supprimés dans un planning existant, comme suit :

sysadmin@dd9500# compression physical-capacity-measurement schedule del jf_sched pathsets jf2
Schedule "jf_sched" modified.
sysadmin@dd9500# compression physical-capacity-measurement schedule add jf_sched pathsets jf2
Schedule "jf_sched" modified.

Remarque : Une planification ne peut pas uniquement contenir des jeux de chemins OU des structures MTree (c’est-à-dire que les deux ne peuvent pas être combinés) :
sysadmin@dd9500# compression physical-capacity-measurement schedule create jf_sched2 mtrees /data/col1/backup time 1400
Schedule "jf_sched2" created.
sysadmin@dd9500# compression physical-capacity-measurement schedule add jf_sched2 pathsets jfall
**** Failed to add: this schedule is only for mtrees.

Pour afficher les détails des planifications existantes, le schedule show all commande est utilisée, par exemple :

sysadmin@dd9500# compression physical-capacity-measurement schedule show all
Name:      jf_sched
Status:    enabled
Priority:  urgent
Frequency: weekly on Wed, Fri
Time:      17:00
Pathset(s):
    jfall
    jf1
    jf2


Name:      jf_sched2
Status:    enabled
Priority:  normal
Frequency: daily
Time:      14:00
MTree(s):
    /data/col1/backup

Les planifications existantes peuvent être désactivées ou activées immédiatement, autrement dit :

sysadmin@dd9500# compression physical-capacity-measurement schedule disable jf_sched2
Schedule "jf_sched2" disabled.
sysadmin@dd9500# compression physical-capacity-measurement schedule enable jf_sched2
Schedule "jf_sched2" enabled.

Un ordonnanceur peut également être détruit :

sysadmin@dd9500# compression physical-capacity-measurement schedule destroy jf_sched2
Schedule "jf_sched2" destroyed.

Remarque : Cela ne supprime PAS l’historique des mtrees/chemins correspondants (cela signifie que les nouvelles tâches PCM ne sont pas automatiquement planifiées).


Comment les tâches planifiées démarrent-elles ?
Lorsqu’un planning PCM est ajouté et activé, une entrée correspondante est ajoutée à /etc/crontabC'est:

#
# collection.1.crontab.pcr.jf_sched.0
#
00 17 * * Wed,Fri  root /ddr/bin/ddsh -a compression physical-capacity-measurement sample start force priority urgent objects-from-schedule jf_sched

Remarque : La tâche cron est supprimée de /etc/crontab Si la planification est désactivée ou détruite.


Puis-je arrêter d’exécuter une tâche PCM ?
Oui : les tâches PCM en cours d’exécution peuvent être abandonnées à l’aide de l’ID de tâche ou des noms pathset/mtree. Par exemple, nous voyons que nous avons deux tâches PCM en file d’attente :

SE@dd9500## compression physical-capacity-measurement sample show current
Task ID        Type   Name    User       State       Creation Time         Measurement Time      Start Time   Priority   Percent
                                                                           (Submitted Time)                              Done
------------   ----   -----   --------   ---------   -------------------   -------------------   ----------   --------   --------
124554051585   PS     jfall   sysadmin   Scheduled   2015/08/30 16:00:48   2015/08/30 16:00:48   --           Normal     0
124554051586   PS     jfall   sysadmin   Scheduled   2015/08/30 16:01:55   2015/08/30 16:01:55   --           Normal     0
------------   ----   -----   --------   ---------   -------------------   -------------------   ----------   --------   --------

Ces tâches peuvent être abandonnées à l’aide de l’ID de tâche (pour arrêter une seule tâche) :

SE@dd9500## compression physical-capacity-measurement sample stop task-id 124554051585
**   This will abort any submitted or running compression physical-capacity-measurement sampling tasks.
        Do you want to proceed? (yes|no) [no]: yes
1 task(s) aborted.

Il ne nous reste plus qu’une seule tâche en cours d’exécution :

SE@dd9500## compression physical-capacity-measurement sample show current
Task ID        Type   Name    User       State       Creation Time         Measurement Time      Start Time   Priority   Percent
                                                                           (Submitted Time)                              Done
------------   ----   -----   --------   ---------   -------------------   -------------------   ----------   --------   --------
124554051586   PS     jfall   sysadmin   Scheduled   2015/08/30 16:01:55   2015/08/30 16:01:55   --           Normal     0
------------   ----   -----   --------   ---------   -------------------   -------------------   ----------   --------   --------

Ou le nom du jeu de chemins :

SE@dd9500## compression physical-capacity-measurement sample stop pathsets jfall
**   This will abort any submitted or running compression physical-capacity-measurement sampling tasks.
        Do you want to proceed? (yes|no) [no]: yes
1 task(s) aborted.

Nous laissant sans emploi :

SE@dd9500## compression physical-capacity-measurement sample show current
No measurement tasks found.


Comment afficher les détails des tâches terminées ?
Les détails des tâches terminées sont affichés à l’aide de sample show history . Par exemple, pour afficher les détails d’un seul jeu de chemins :

SE@dd9500## compression physical-capacity-measurement sample show history pathset jfall
Pathset: jfall
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------
2015/08/23 12:23:06            7.0             4.2         1.70x        0.98x   1.67x (40.24%)
2015/08/23 13:04:20           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
2015/08/26 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
2015/08/27 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
2015/08/28 14:00:02           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
2015/08/29 14:00:02           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
2015/08/30 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
-------------------   ------------   -------------   -----------   ----------   --------------
Total number of measurements retrieved = 7.

Le paramètre detailed-history affiche également les heures de début et de fin de chaque tâche :

SE@dd9500## compression physical-capacity-measurement sample show detailed-history pathset jfall
Pathset: jfall
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp   Task ID        Task Start Time       Task End Time
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------   ------------   -------------------   -------------------
2015/08/23 12:23:06            7.0             4.2         1.70x        0.98x   1.67x (40.24%)   47244640257    2015/08/23 12:25:19   2015/08/23 12:25:23
2015/08/23 13:04:20           10.0             6.2         1.63x        0.98x   1.61x (37.84%)   51539607553    2015/08/23 13:05:45   2015/08/23 13:05:48
2015/08/26 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)   77309411329    2015/08/26 14:02:50   2015/08/26 14:02:50
2015/08/27 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)   85899345921    2015/08/27 14:03:06   2015/08/27 14:03:06
2015/08/28 14:00:02           10.0             6.2         1.63x        0.98x   1.61x (37.84%)   94489280513    2015/08/28 14:02:50   2015/08/28 14:02:51
2015/08/29 14:00:02           10.0             6.2         1.63x        0.98x   1.61x (37.84%)   103079215105   2015/08/29 14:01:40   2015/08/29 14:01:41
2015/08/30 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)   115964116993   2015/08/30 14:04:12   2015/08/30 14:04:12
-------------------   ------------   -------------   -----------   ----------   --------------   ------------   -------------------   -------------------
Total number of measurements retrieved = 7.

Remarque : L’une ou l’autre des commandes peut être modifiée pour récupérer uniquement les résultats sur une période spécifique :
SE@dd9500## compression physical-capacity-measurement sample show history pathset jfall last 2days
Pathset: jfall
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------
2015/08/29 14:00:02           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
2015/08/30 14:00:01           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
-------------------   ------------   -------------   -----------   ----------   --------------
Total number of measurements retrieved = 2.

Ou entre des dates ou des heures spécifiques :

SE@dd9500## compression physical-capacity-measurement sample show history pathset jfall start 08231010 end 08231400
Pathset: jfall
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------
2015/08/23 12:23:06            7.0             4.2         1.70x        0.98x   1.67x (40.24%)
2015/08/23 13:04:20           10.0             6.2         1.63x        0.98x   1.61x (37.84%)
-------------------   ------------   -------------   -----------   ----------   --------------
Total number of measurements retrieved = 2.


Combien de temps un historique spécifique est-il conservé pour un ensemble de chemins/mtree spécifique ?
Par défaut, les résultats de chaque ensemble de chemins PCM sont conservés pendant 180 jours. Cela peut être modifié en modifiant le jeu de chemins correspondant :

SE@dd9500## compression physical-capacity-measurement pathset modify jfall measurement-retention 14
Measurement-retention changed to 14 day(s).

L’historique PCM est conservé dans la base de données d’historique des systèmes. Par conséquent, si la base de données historique est perdue ou endommagée, les détails de tout l’historique PCM sont également perdus.

Y a-t-il des mises en garde à prendre en compte lors de l’utilisation du PCM ?
Les tâches PCM sont suspendues si l’espace
disponible sur le système est inférieur à 10 %.Les tâches PCM sont suspendues pendant l’exécution du cycle de nettoyage.

Comme indiqué précédemment, PCM est un outil utilisé pour calculer l’utilisation physique par un ensemble spécifique de répertoires/structures mtree. Lors du calcul des résultats pour un ensemble de chemins ou un ensemble de structures MTree spécifique, PCM ne comptabilise qu’une seule fois la taille de chaque segment de données unique utilisé par le jeu de chemins ou l’ensemble de structures MTree.
 

Remarque : En raison de la nature de la déduplication, il peut y avoir d’autres fichiers en dehors des jeux de chemins/mtrees sur lesquels la tâche est exécutée qui peuvent également être dédupliqués sur les mêmes données.

Par conséquent, si les fichiers qui sont dédupliqués sur les mêmes données se trouvent dans plusieurs tâches PCM différentes, chacun des segments constituant les fichiers peut être compté plusieurs fois (une fois par tâche PCM). Cela signifie que, bien que les résultats de chaque tâche PCM individuelle soient exacts, les résultats de plusieurs tâches PCM ne peuvent pas être additionnés pour donner une utilisation physique précise pour la somme des jeux de chemins/structures MTree dans les tâches.

En raison de la façon dont les tâches PCM sont assemblées, du jeu de chemins ou de l’espace de post-compression MTree utilisé sur le disque :

  • Les tâches PCM ne prennent pas en compte les données mortes (espace disque utilisé par les fichiers supprimés, dont l’espace sur le disque n’a peut-être pas encore été récupéré par l’exécution de GC).
  • La PCM ne prend pas en compte les données verrouillées dans les snapshots créés pour la structure MTree ou les chemins mesurés.

Par exemple, j’ai une structure mtree appelée /data/col1/jf1 dans lequel je crée trois fichiers de 1 Go, c’est-à-dire :

!!!! dd9500 YOUR DATA IS IN DANGER !!!! # for i in 1 2 3 ; do
> dd if=/dev/urandom of=/data/col1/jf1/${i} bs=1024k count=1024
> done

Je copie ensuite ces fichiers dans une deuxième MTree (/data/col1/jf2):

!!!! dd9500 YOUR DATA IS IN DANGER !!!! # cp /data/col1/jf1/1 /data/col1/jf2/4
!!!! dd9500 YOUR DATA IS IN DANGER !!!! # cp /data/col1/jf1/2 /data/col1/jf2/5
!!!! dd9500 YOUR DATA IS IN DANGER !!!! # cp /data/col1/jf1/3 /data/col1/jf2/6

Enfin, je crée un nouveau fichier de 1 Go dans /data/col1/jf2:

!!!! dd9500 YOUR DATA IS IN DANGER !!!! # dd if=/dev/urandom of=/data/col1/jf2/7 bs=1024k count=1024
1024+0 records in
1024+0 records out

Si la compression locale des données n’est pas prise en compte et que seule la déduplication est prise en compte, il est clair que chaque structure mtree utilisait la quantité d’espace physique suivante lors de l’écriture des fichiers :

/data/col1/jf1 : 3 Gbit
/données/col1/jf2 : 1 Go (pour le nouveau fichier : les fichiers copiés auraient été dédupliqués par rapport aux données existantes et auraient donc consommé un espace physique minimal).

Par conséquent, la somme de l’utilisation de l’espace physique par /data/col1/jf1 et /data/col1/jf2 devrait être d’environ 4 Go.

Trois ensembles de chemins PCM sont créés :

jf1 contenant /data/col1/jf1
jf2 contenant /data/col1/jf2
jfall contenant data/col1/jf1 et /data/col1/jf2

Les tâches PCM sont exécutées et fournissent le résultat suivant :

Pathset: jf1
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------
2015/08/23 12:24:09            3.0             3.2         0.96x        0.98x   0.94x (-6.21%)
-------------------   ------------   -------------   -----------   ----------   --------------


Pathset: jf2
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------
2015/08/23 12:24:12            4.0             4.2         0.98x        0.98x   0.96x (-4.14%)
-------------------   ------------   -------------   -----------   ----------   --------------

Ces valeurs sont correctes, car chaque tâche PCM n’examine que les données physiques référencées par les fichiers dans son jeu de chemins correspondant. Cela signifie que les données des fichiers qui ont été copiés sont comptées deux fois (une fois par tâche PCM).

Il peut sembler raisonnable que pour obtenir une utilisation physique totale par le /data/col1/jf1 et /data/col1/jf2 MTrees, nous pouvons additionner les valeurs de 'physical used' à partir des sorties ci-dessus.
 

Remarque : Cela donne 7,4 Go, ce qui n’est clairement pas correct (au-dessus, il a été estimé qu’en raison de la déduplication, l’utilisation totale serait d’environ 4 Go).
 

Pour obtenir une valeur précise pour l’utilisation physique totale de /data/col1/jf1 et /data/col1/jf2, il est nécessaire d’exécuter une seule tâche PCM couvrant ces deux structures MTree (c’est-à-dire d’utiliser jfall). Cela garantit que les segments dupliqués ne sont comptés qu’une seule fois et non deux fois comme dans l’exemple ci-dessus, c’est-à-dire :

Pathset: jfall
Measurement Time      Logical Used   Physical Used   Global-Comp   Local-Comp       Total-Comp
                        (Pre-Comp)     (Post-Comp)        Factor       Factor           Factor
                             (GiB)           (GiB)                               (Reduction %)
-------------------   ------------   -------------   -----------   ----------   --------------
2015/08/23 12:23:06            7.0             4.2         1.70x        0.98x   1.67x (40.24%)
-------------------   ------------   -------------   -----------   ----------   --------------

En résumé, le résultat de plusieurs tâches PCM ne peut pas être additionné pour donner une utilisation physique précise pour un ensemble de jeux de chemins/structures mtrees. Au lieu de cela, un seul ensemble de chemins PCM doit être défini couvrant tous les mtrees/répertoires requis, car cela garantit que les données en double ne sont comptées qu’une seule fois. Si ce n’est pas le cas et qu’une tâche PCM distincte doit être exécutée pour chaque structure MTree d’un système, par exemple, si les résultats sont additionnés, il est tout à fait possible que la capacité physique totale utilisée dépasse la capacité brute du système.

Les tâches PCM ne peuvent-elles être soumises que par le DDSH ligne de commande ou peut-on également utiliser une interface utilisateur ?
Dans ce document, l’interface de ligne de commande Data Domain (DDSH) est utilisée pour configurer, soumettre et vérifier les tâches PCM.
 

Remarque : PCM peut également être utilisé par l’interface utilisateur de Data Domain Enterprise Manager ou System Manager.
 
Remarque : L’interface DDSH a une limite d’un maximum de 256 caractères dans une commande donnée. Par conséquent, si les tâches PCM doivent être configurées par rapport à un chemin avec un nom de répertoire long, il peut être avantageux (voire nécessaire) d’utiliser l’une des interfaces utilisateur disponibles.

Affected Products

Data Domain, DD OS

Products

Data Domain
Article Properties
Article Number: 000058798
Article Type: How To
Last Modified: 05 Dec 2024
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.