Dell Unity : File d’attente de snapshots volumineuse ou incrémentielle entraînant des problèmes de performances
Summary: Dell Unity : File d’attente de snapshots volumineuse ou incrémentée causant des problèmes de performances et un processeur de stockage (SP) élevé
Symptoms
- La valeur de la perte de données maximale admissible (RPO) a été réduite à une valeur considérée comme plus agressive (c’est-à-dire 10 minutes). »
- « La perte de données maximale admissible (RPO) est un terme reconnu dans l’industrie qui indique la quantité acceptable de données, mesurée en unités de temps, qui peut être perdue lors d’une défaillance. Lorsque vous configurez une session de réplication asynchrone, vous pouvez configurer la synchronisation automatique en fonction du RPO. Vous pouvez spécifier un RPO allant de 5 minutes à 1 440 minutes (24 heures). Le RPO par défaut est défini sur un intervalle de 60 minutes (1 heure). Pour la réplication synchrone, le RPO est fixé à 0. »
- Il existe de nombreux snapshots à l’état « destroying » pour une LUN.
- Le nombre de snapshots à l’état « destroying » augmente au fil du temps.
- Processeur à SP élevé sans charge applicative d’E/S par seconde/bande passante corrélée.
- Les LUN et les disques back-end ont des temps de réponse en file d’attente et élevés.
Vous pouvez regarder dans Unisphere dans la section « Block ». Assurez-vous d’ajouter la colonne « Snapshots » pour obtenir une lecture par LUN. Si vous voyez de nombreux snapshots répertoriés pour une LUN ou plusieurs LUN, cela indique plusieurs éléments
Accédez à chaque LUN et sélectionnez l’onglet « Snapshots » pour vérifier l’état (sera « destroying ») et « Taken by » (sera « Replication ») pour confirmation :
Cause
Il peut y avoir de nombreuses raisons pour lesquelles les files d’attente se développent. L’une des principales causes est attribuée à un RPO considéré comme « trop agressif ».
Réplication asynchrone native en mode bloc :
La réplication asynchrone native en mode bloc utilise un delta entre deux snapshots afin de transférer des données. Au cours de la durée de vie des sessions de réplication, plusieurs « actualisations » de snapshots ont lieu lors du transfert des modifications.
Lorsqu’un snapshot est actualisé, il est en réalité supprimé puis recréé en arrière-plan.
Les préoccupations les plus notables concernent la consommation du processeur de stockage et les E/S back-end supplémentaires associées à la fonctionnalité de snapshot.
La baie Unity ne peut pas supprimer entièrement les snapshots dans un laps de temps relativement raisonnable, ce qui fait que le taux de snapshots passant à l’état « à supprimer » dépasse de loin le taux de snapshots complètement supprimés dans un laps de temps donné. Lorsque vous diminuez la valeur du RPO, le nombre de créations ou de suppressions de snapshots augmente dans un laps de temps donné.
Resolution
Pour les LUN ayant le plus grand nombre de snapshots à l’état de destruction, définissez le RPO au moins sur la valeur par défaut (60 minutes) jusqu’à ce que la suppression des snapshots puisse rattraper son retard. Vous pouvez laisser la valeur sur ce nouveau RPO en fonction du nombre de snapshots mis en file d’attente et juger en conséquence.
« Dell Technologies recommande d’inclure un niveau Flash dans un pool hybride où des snapshots sont actifs.
Les snapshots augmentent la charge globale du processeur sur le système et augmentent les IOPS globales des disques dans le pool de stockage. Les snapshots utilisent également la capacité du pool pour stocker les anciennes données suivies par le snapshot, ce qui augmente la capacité utilisée dans le pool, jusqu’à ce que le snapshot soit supprimé. Tenez compte de la surcharge des snapshots lors de la planification des exigences en matière de performances et de capacité pour le pool de stockage.
Avant d’activer les snapshots sur un objet de stockage, il est recommandé de surveiller le système et de s’assurer que les ressources existantes peuvent répondre aux exigences de charge applicative supplémentaires (voir la section Instructions relatives aux capacités matérielles, Tableau 2). Activez les snapshots sur quelques objets de stockage à la fois, puis surveillez le système pour vous assurer qu’il se trouve toujours dans les plages de fonctionnement recommandées, avant d’activer plus de snapshots.
Il est recommandé d’échelonner les opérations de snapshot (création, suppression, etc.). Cela peut être réalisé à l’aide de différentes planifications de snapshots pour différents ensembles d’objets de stockage. Il est également recommandé de planifier les opérations de snapshot une fois les migrations FAST VP terminées.
Les snapshots sont supprimés par le système de manière asynchrone ; Lorsqu’un snapshot est en cours de suppression, il est marqué comme « Destroying ». Si le système accumule des snapshots « Destroying » au fil du temps, cela peut indiquer que les plannings de snapshots existants sont trop agressifs ; La réduction de la fréquence des snapshots peut offrir des niveaux de performances plus prévisibles.
Dell Unity régule les opérations de suppression de snapshots afin de réduire l’impact sur les E/S de l’hôte. Les suppressions de snapshots se produisent plus rapidement pendant les périodes de faible utilisation du système. » Dell Unity : Guide des pratiques d’excellence
Additional Information