Data Domain: MTree 복제를 사용한 PowerProtect Data Domain 시스템의 데이터 마이그레이션 모범 사례
Summary: 이 문서에서는 내부 QAT 카드 지원 없이 기존 PPDD(PowerProtect Data Domain) 시스템에서 Mtree 복제(MRepl)를 사용하여 데이터를 마이그레이션할 준비를 하는 방법에 대해 설명합니다. 예를 들어 DD9500 및 DD9800입니다. 데이터 마이그레이션 결과에 부정적인 영향을 미칠 수 있는 예기치 않은 부작용을 방지하려면 현재 시스템 운영 워크로드를 고려하는 것이 중요합니다. 이 문서는 기존 PPDD 시스템을 소스로 사용하여 새로운 MRepl(Mtree Replication) 컨텍스트 구성이 필요한 마이그레이션 작업을 계획하는 데 도움이 됩니다. ...
Instructions
16G 플랫폼이 출시되면서 특정 MTrees를 레거시 PPDD에서 최신 시스템으로 마이그레이션하는 것이 일반적인 요구 사항이 되었습니다.
마이그레이션 프로세스는 새 Mtree 복제 컨텍스트를 생성합니다. 중단을 최소화하려면 다음을 고려하십시오.
- 백업 작업의 현재 시스템 워크로드
- 압축 기능 차이(예: QAT 카드 지원)
- 새로운 Mrepl 컨텍스트 구성의 갑작스러운 통합
- 가비지 수집(GC) 프로세스에 영향을 주는 HW 오류
데이터 무결성을 유지하고 서비스 수준 계약을 충족하기 위해 시스템은 특정 작동 임계값에서 패닉이 발생할 수 있습니다.
패닉 메커니즘은 자체 개선 조치를 트리거하여 시스템이 항상 안정적으로 작동하도록 합니다.
여기에서는 이러한 고려 사항에 대해 설명하고 마이그레이션 계획을 방해할 수 있는 예기치 않은 다운타임을 방지하는 방법을 안내합니다.
백업 작업의 현재 시스템 워크로드:
처음에는 현재 시스템 운영에 집중합니다. 마이그레이션 전에 주요 메트릭을 모니터링합니다. 여기에는 지속적인 워크로드, CPU 사용률, 메모리 사용량, 네트워크 상태 및 하드웨어 경고가 포함됩니다.
목표는 정상적인 매개변수 내에서 시스템의 작동을 유지하는 것입니다.
압축 기능 차이:
Mrepl(Mtree replication)을 사용하여 마이그레이션을 준비할 때는 시스템 간 압축 기능의 차이를 고려하십시오.
일부 레거시 시스템에는 압축 관련 작업을 지원하는 온보드 압축 카드가 없습니다.
DD9900, DD9400 또는 DD6900 시스템을 사용하면 외부 QAT 카드를 연결하여 압축 작업을 가속화할 수 있습니다.
QAT 카드가 없는 경우(예: DD9800, DD9500) 압축 및 압축 해제 작업을 위해 CPU 및 메모리 리소스를 사용합니다.
QAT 지원 없이 새 복제 컨텍스트를 구성하는 경우 먼저 데이터의 압축을 풀어야 합니다.
이로 인해 복제 초기화 단계에서 CPU 사용량이 급증할 수 있습니다.
소스는 대상을 확인하여 사용 가능한 압축 카드 유형을 식별합니다.
16G 시스템(DD9910, DD9410 또는 DD6410)이 대상인 경우 소스는 레거시 'gzfast' 형식에서 데이터의 압축을 풀어야 합니다. 그런 다음 LZ 형식으로 압축해야 합니다.
점진적으로 새로운 mrepl 컨텍스트 구성을 통합합니다.
DR(Disaster Recovery) 중에 한 Data Domain에서 다른 Data Domain으로 데이터를 복제할 때는 일반적으로 데이터 수집이 완료된 후에 복제 작업이 시작됩니다.
이렇게 하면 대상 사이트가 복제된 모든 데이터를 수신합니다.
마이그레이션을 위해 새 복제 컨텍스트를 정의하면 소스에서 복제를 초기화하는 동안 중요한 데이터를 처리해야 합니다.
대상에 중복 제거된 데이터가 없어 아직 최적화가 불가능하기 때문입니다. 이로 인해 소스 시스템의 로드가 증가합니다.
이 문제를 완화하려면 시스템이 백업 워크로드(I/O)를 계속 처리할 때 마이그레이션과 관련된 복제 컨텍스트를 점진적으로 통합해야 합니다.
복제 처리량을 낮게 정의하여 이러한 마이그레이션 관련 복제 컨텍스트에 할당되는 리소스를 제한합니다.
복제가 대상에서 최적화를 구축하기 시작하고 운영 매개변수가 검증되면 복제(마이그레이션) 컨텍스트를 더 추가합니다. 또는 기존 복제 처리량을 수정합니다.
목표는 시스템의 보호 메커니즘이 트리거되지 않도록 하는 것입니다. 이로 인해 마이그레이션에 영향을 줄 수 있는 시스템 패닉이 발생합니다.
시스템 성능 참조는 새 워크로드가 아니라 작동 중인 워크로드를 기준으로 계산됩니다.
마이그레이션 시나리오 중에 제한을 점진적으로 구성합니다.
"replication throttle add" 명령을 사용하여 특정 시점을 예약하고 임계치 조절을 위해 정의된 대역폭(Mbps)을 할당할 수 있습니다.
제한된 가용 대역폭(낮은 스로틀)으로 새 복제 작업을 시작합니다. 그런 다음 시스템 작동에 미치는 영향을 평가합니다.
복제 작업이 진행 중이면 스로틀을 늘려 추가 대역폭을 제공할 수 있습니다.
또한 DDSM에서 사용할 수 있는 CPU, 메모리 및 네트워크 사용량을 포함한 시스템 분석을 모니터링하는 것이 좋습니다.
GC(Garbage Collection) 프로세스에 영향을 주는 HW 오류:
백업 또는 복제 성능 저하를 잠재적으로 유발할 수 있는 또 다른 요인은 특히 기본 가비지 수집 작업 중에 발생하는 하드웨어 오류와 관련이 있습니다. 정상적인 작동 조건에서 PPDD 시스템의 가비지 컬렉션 메커니즘은 수집, 복원 또는 복제 작업에 영향을 주지 않고 공간 재활용 작업을 완료합니다. 특정 상황에서 시스템은 가비지 컬렉션 임계치 조절을 정의하는 옵션을 제공하여 시스템 관리자가 시스템의 정리 프로세스가 발생하는 시기를 추가로 제어할 수 있도록 합니다.
가비지 컬렉션에 대한 기본 스로틀 구성은 백업 및 복원에 영향을 주지 않습니다. 영향이 관찰되는 대부분의 사례는 하드웨어 장애와 관련이 있습니다. 예를 들어 특정 드라이브를 교체해야 하는 경우 시스템의 지속적인 I/O 요구로 인해 백업 및 복원 스토리지 속도가 느려져 결과적으로 전체 GC 작업에 영향을 미칠 수 있습니다.
Data Domain Operating System은 이러한 하드웨어 문제에 대한 포괄적인 알림 메커니즘을 제공하며, 이러한 조건이 탐지되면 사전 예방적으로 알림을 표시합니다. 이를 통해 백업 운영자는 하드웨어 관련 문제를 신속하게 해결할 수 있습니다.
고려해야 할 또 다른 중요한 요소는 복제 작업이 백업 및 복원만큼 중요하다는 것입니다. 설계상 각 플랫폼은 각 작업에 대해 고정된 수의 스트림을 제공하며 정의된 제한 내에서 동시 작업을 처리하여 SLA(Service Level Agreement)를 충족할 수 있습니다.
결론:
Mtree 복제를 사용하여 데이터를 마이그레이션하려면 다음 사항을 신중하게 고려해야 합니다.
- 백업 작업에서 현재 시스템 워크로드 모니터링
- DD9800 또는 DD9500과 같은 기존 플랫폼 이해
- 다른 압축 알고리즘(gzfast)을 사용합니다.
- 새 MTree 복제(MRepl) 컨텍스트가 운영 중인 시스템에 생성되면 새 Mrepl 컨텍스트 구성을 점진적으로 통합합니다
- 새 워크로드가 시스템에 미치는 영향을 면밀히 모니터링합니다.
- 잠재적인 하드웨어 오류(가비지 컬렉션 프로세스의 작업에 영향을 미침)를 모니터링합니다.
이러한 모범 사례를 따르면 중단을 최소화하고 시스템 안정성을 유지할 수 있습니다.
이러한 권장 사항을 구현하면 예기치 않은 다운타임을 방지하고 데이터 마이그레이션을 용이하게 할 수 있습니다.