Dell Unity: Coda di istantanee di grandi dimensioni o in aumento che causa problemi di prestazioni

Summary: Dell Unity: Coda di snapshot di grandi dimensioni o in aumento che causa problemi di prestazioni e CPU dello storage processor (SP) elevata

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • Il valore dell RPO (Recover Point Objective) è stato ridotto a un valore considerato più aggressivo (ovvero, 10 minuti). ".
    • "Recovery Point Objective (RPO) è un termine accettato nel settore che indica la quantità accettabile di dati, misurata in unità di tempo, che può andare persa in caso di guasto. Quando si configura una sessione di replica asincrona, è possibile configurare la sincronizzazione automatica in base all'RPO. È possibile specificare un RPO da un minimo di 5 minuti fino a un massimo di 1.440 minuti (24 ore). L'RPO predefinito è impostato su un intervallo di 60 minuti (1 ora). Per la replica sincrona, l'RPO è fisso a 0."
  • Sono presenti molte istantanee in uno stato "destroying" per una LUN.
  • Il numero di istantanee in stato "destroying" aumenta nel tempo.
  • CPU con SP elevato senza una correlazione tra IOPS e larghezza di lavoro.
  • Le LUN e le unità back-end presentano accodamento e tempi di risposta elevati.


    In Unisphere è possibile cercare nella sezione "Block". Assicurarsi di aggiungere la colonna "Snapshots" per ottenere una lettura per LUN. Se vengono visualizzate molte istantanee elencate per una LUN o più LUN, ciò indica alcuni elementi



    Interfaccia utente Unisphere per l'analisi delle LUNPassare alla singola LUN e selezionare la scheda "Snapshots" per controllare lo "State" (sarà "destroying") e "Taken by" (sarà "Replication") per confermare:  

    Interfaccia utente Unisphere guardare gli snanpshots 

     

Cause

Ci possono essere molte cause per la creazione di accodamento. Una delle cause principali è attribuita a un RPO considerato "troppo aggressivo".

Replica asincrona nativa dei blocchi:
La replica asincrona nativa dei blocchi utilizza un delta tra due snapshot per il trasferimento dei dati. Durante la durata delle sessioni di replica, si verificheranno più "aggiornamenti" delle snapshot durante il trasferimento delle modifiche.

Quando un'istantanea viene aggiornata, viene effettivamente eliminata e ricreata in background.

I problemi più rilevanti riguardano il consumo della CPU degli SP e l'I/O back-end aggiuntivo associato alla funzionalità delle istantanee.


L'array Unity non è in grado di eliminare completamente le istantanee in un periodo di tempo relativamente ragionevole, facendo sì che la frequenza delle istantanee che entrano in uno stato "da eliminare" superi di gran lunga la velocità delle istantanee completamente eliminate entro un determinato periodo di tempo. Riducendo il valore RPO, aumenta la quantità di snapshot create o eliminate entro un determinato periodo di tempo.

Resolution

Per le LUN con il maggior numero di istantanee in uno stato di eliminazione, impostare l RPO almeno sul valore predefinito (60 minuti) fino a quando l'eliminazione delle istantanee non riuscirà a recuperare il ritardo. È possibile lasciare il valore a questo nuovo RPO a seconda del numero di snapshot in coda e giudicare di conseguenza.

 

"Dell Technologies consiglia di includere un tier Flash in un pool ibrido in cui le istantanee sono attive.

 

Le snapshot aumentano il carico complessivo della CPU sul sistema e aumentano gli IOPS complessivi delle unità nel pool di storage.  Le snapshot utilizzano inoltre la capacità del pool per archiviare i dati meno recenti monitorati dalla snapshot, il che aumenta la quantità di capacità utilizzata nel pool, fino a quando la snapshot non viene eliminata.  Considerare l'overhead delle snapshot quando si pianificano i requisiti di prestazioni e capacità per il pool di storage.

 

Prima di abilitare le snapshot su un oggetto di storage, si consiglia di monitorare il sistema e verificare che le risorse esistenti siano in grado di soddisfare i requisiti aggiuntivi del carico di lavoro (vedere la sezione Linee guida sulla funzionalità hardware, Tabella 2).  Abilitare le istantanee su pochi oggetti di storage alla volta, quindi monitorare il sistema per assicurarsi che rientri ancora negli intervalli operativi consigliati, prima di abilitare altre istantanee.

 

Si consiglia di scaglionare le operazioni di snapshot (creazione, eliminazione e così via).  Questa operazione può essere eseguita utilizzando pianificazioni di snapshot diverse per set diversi di oggetti di storage.  Si consiglia inoltre di pianificare le operazioni di istantanee dopo il completamento di eventuali riposizionamenti FAST VP.

 

Le snapshot vengono eliminate dal sistema in modo asincrono; quando un'istantanea è in fase di eliminazione, viene contrassegnata come "Destroying".  Se il sistema accumula snapshot "Destroying" nel tempo, potrebbe essere un'indicazione che le pianificazioni di snapshot esistenti sono troppo aggressive; La minore frequenza di snapshot può fornire livelli di prestazioni più prevedibili. 

 

Dell Unity limiterà le operazioni di eliminazione delle snapshot per ridurre l'impatto sull'I/O dell'host.  Le eliminazioni delle snapshot si verificheranno più rapidamente durante i periodi di basso utilizzo del sistema." Dell Unity: Best Practices Guide

Additional Information


 

Affected Products

Dell EMC Unity Family

Products

Dell EMC Unity Family
Article Properties
Article Number: 000055095
Article Type: Solution
Last Modified: 20 Oct 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.