Data Domain: Best practice per la migrazione dei dati sui sistemi PowerProtect Data Domain utilizzando la replica MTree

Summary: Questo articolo illustra la preparazione alla migrazione dei dati utilizzando la replica MTree (MRepl) dai sistemi PowerProtect Data Domain (PPDD) legacy senza supporto per schede QAT interne. Ad esempio, DD9500 e DD9800. È fondamentale considerare l'attuale carico di lavoro operativo del sistema per evitare effetti collaterali imprevisti che potrebbero influire negativamente sui risultati della migrazione dei dati. Questo articolo aiuta a pianificare le operazioni di migrazione che richiedono una nuova configurazione del contesto MReml (Mtree Replication) utilizzando i sistemi PPDD legacy come origine. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Con l'introduzione delle piattaforme 16G, la migrazione di specifici MTrees da PPDD legacy a un sistema più recente è un requisito comune.
Il processo di migrazione crea nuovi contesti di replica MTree. Considerare quanto segue per garantire un'interruzione minima.

  • Carico di lavoro del sistema corrente dalle operazioni di backup 
  • Differenze delle capacità di compressione (ad esempio, supporto per schede QAT)
  • Incorporazione improvvisa di nuove configurazioni di contesto Mrepl
  • Errori hardware che influiscono sul processo di Garbage Collection (GC) 

Per mantenere l'integrità dei dati e rispettare gli accordi sui livelli di servizio, il sistema potrebbe presentare un errore irreversibile in corrispondenza di determinate soglie operative.
Il meccanismo antipanico attiva azioni autocorrettive per garantire che il sistema funzioni sempre in modo affidabile.

 

In questo documento vengono illustrate queste considerazioni e vengono fornite indicazioni su come evitare downtime imprevisti che potrebbero interferire con i piani di migrazione. 

 

Carico di lavoro del sistema corrente dalle operazioni di backup:
 

Concentrarsi inizialmente sulle operazioni correnti del sistema. Prima della migrazione, monitorare le metriche chiave. Questi includono i carichi di lavoro in corso, l'utilizzo della CPU, l'utilizzo della memoria, lo stato della rete e gli avvisi hardware.
L'obiettivo è quello di preservare il funzionamento del sistema entro i normali parametri. 
 

Differenze delle funzionalità di compressione:
Durante la preparazione per la migrazione utilizzando la replica Mtree (Mrepl), considerare la disparità nelle funzionalità di compressione tra i sistemi.
Alcuni sistemi legacy non dispongono di una scheda di compressione integrata per facilitare le operazioni correlate alla compressione.
I sistemi DD9900, DD9400 o DD6900 consentono il collegamento di una scheda QAT esterna per accelerare le operazioni di compressione.
Quando non è presente una scheda QAT (ad esempio, DD9800, DD9500), si basa sulle risorse di CPU e memoria per le attività di compressione e decompressione.
 

Quando si configurano nuovi contesti di replica senza supporto QAT, è necessario prima decomprimere i dati.
Ciò potrebbe causare un picco di utilizzo della CPU durante la fase di inizializzazione della replica.
L'origine controlla la destinazione per identificare il tipo di scheda di compressione disponibile.
Quando un sistema 16G (DD9910, DD9410 o DD6410) è la destinazione, l'origine deve decomprimere i dati dal formato "gzfast" legacy. Deve quindi comprimerlo nel formato LZ.

 

Incorporare gradualmente la nuova configurazione del contesto mrepl:
 

Durante il ripristino di emergenza (DR), durante la replica dei dati da un Data Domain a un altro, i processi di replica iniziano in genere dopo il completamento dell'acquisizione dei dati.
Ciò garantisce che il sito di destinazione riceva tutti i dati replicati.
 

Quando vengono definiti nuovi contesti di replica per la migrazione, l'origine deve gestire una quantità significativa di dati durante l'inizializzazione della replica.
Ciò è dovuto al fatto che la destinazione non dispone di dati deduplicati e l'ottimizzazione non è ancora possibile. Ciò comporta un aumento del carico sul sistema di origine.
 


Per mitigare questo problema, quando il sistema continua a elaborare i carichi di lavoro di backup (I/O), incorporare gradualmente i contesti di replica associati alla migrazione. 
Definire un throughput di replica basso per limitare le risorse allocate a questi contesti di replica correlati alla migrazione.
Una volta che la replica inizia a creare ottimizzazioni sulla destinazione e i parametri operativi sono stati convalidati, aggiungere altri contesti di replica (migrazione). In alternativa, modificare il throughput di replica su quelli esistenti.

L'obiettivo è evitare di attivare i meccanismi di protezione del sistema. Ciò determina errori di sistema che possono influire sulle migrazioni.
Tenere presente che i riferimenti alle prestazioni di sistema vengono calcolati in base ai carichi di lavoro in funzione, non per i nuovi carichi di lavoro.
 

Configurare la limitazione gradualmente durante gli scenari di migrazione.
Il comando "replication throttle add" può essere utilizzato per pianificare un point-in-time specifico e allocare una larghezza di banda definita (in Mb/s) per la limitazione.
Avviare nuovi processi di replica con una larghezza di banda disponibile limitata (limitazione inferiore). Quindi, valutare l'impatto sul funzionamento del sistema.

Una volta che il lavoro di replica è in corso, la limitazione può essere aumentata per fornire larghezza di banda aggiuntiva.

Si consiglia inoltre di monitorare le analisi di sistema, tra cui il consumo di CPU, memoria e rete, disponibili su DDSM.

 

Errori hardware che influiscono sul processo di garbage collection (GC):
 

Un altro fattore che può potenzialmente causare un peggioramento delle prestazioni di backup o replica è associato agli errori hardware, in particolare durante le operazioni di garbage collection predefinite. In condizioni operative normali, il meccanismo di garbage collection sui sistemi PPDD completa le attività di riciclo dello spazio senza influire sulle operazioni di acquisizione, ripristino o replica. In alcune situazioni, il sistema offre opzioni per definire la limitazione della garbage collection, fornendo agli amministratori di sistema un ulteriore controllo su quando si verificano i processi di pulizia del sistema. 

La configurazione di limitazione predefinita per la garbage collection non influisce su backup e restore. La maggior parte dei casi in cui si osserva un impatto è legata a guasti hardware. Ad esempio, quando alcune unità richiedono la sostituzione, le continue richieste di I/O del sistema possono rallentare lo storage di backup e ripristini, influenzando di conseguenza le operazioni complessive di GC. 

Il sistema operativo Data Domain fornisce meccanismi di avviso completi per tali problemi hardware, generando avvisi in modo proattivo quando vengono rilevate queste condizioni. Ciò facilita gli operatori di backup nella risoluzione tempestiva dei problemi relativi all'hardware. 

Un altro fattore importante da considerare è che le attività di replica sono importanti quanto il backup e il ripristino. Per impostazione predefinita, ogni piattaforma fornisce un numero fisso di flussi per ogni job e può elaborare operazioni simultanee entro i limiti definiti per soddisfare gli accordi sui livelli di servizio (SLA).

 

Conclusione:
 

Una corretta migrazione dei dati utilizzando la replica MTree richiede un'attenta considerazione di quanto segue:

  • Monitoraggio del carico di lavoro del sistema corrente dalle operazioni di backup
  • Comprensione delle piattaforme legacy come DD9800 o DD9500
  • Utilizzare un algoritmo di compressione diverso (gzfast).
  • Quando vengono creati nuovi contesti di replica MTree (MRepl) in un sistema in funzione, incorporare gradualmente le nuove configurazioni di contesto Mrepl
  • Monitorare attentamente l'impatto dei nuovi carichi di lavoro sul sistema.
  • Monitorare i potenziali errori hardware (che influiscono sulle operazioni dal processo di Garbage Collection).


Seguendo queste best practice, riduce al minimo le interruzioni e mantiene la stabilità del sistema.
L'implementazione di questi suggerimenti consente di evitare downtime imprevisti e facilita la migrazione dei dati.

Additional Information

Affected Products

Data Domain
Article Properties
Article Number: 000317549
Article Type: How To
Last Modified: 08 May 2025
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.