Avamar-Data Domain: 타겟의 높은 DD 활용도: 분석 및 모범 사례
Summary: 소스 및 타겟 Data Domain의 디스크 활용도가 정확히 같지 않습니다. 이 문서에서는 타겟 Data Domain이 소스 Data Domain보다 높은 활용도를 보일 수 있는 가능한 이유에 대해 설명합니다. 활용도 불일치는 아래와 같은 이유가 복합적으로 발생한 결과일 수 있습니다.
Symptoms
타겟 Data Domain의 활용도가 소스 Data Domain보다 높게 표시됩니다.
Cause
Avamar의 관점:
롤백
소스 Data Domain에서 롤백하는 경우 롤백 시간에 따라 대상 Data Domain에 추가 데이터 일수를 보관할 수 있습니다. 이러한 불일치는 대상의 추가 백업이 만료될 때까지 계속됩니다.
예: DD1은 DD2로 복제됩니다. 롤백이 2일 후이기 때문에 소스에 3개의 백업이 있지만, 대상에 5개의 백업이 복제된 것을 볼 수 있습니다.
부분 복제
복제가 성공적으로 완료되지 않은 경우 이미 복제된 데이터는 7일 이상 저장되고 Data Domain 정리로 삭제됩니다. 부분 복제에는 후속 데이터 복제 재시도를 더 빠르게 실행할 수 있는 데이터와 지문이 포함됩니다.
복제가 완료되기 직전에 실패할 경우 부분 복제 오버헤드가 복제된 데이터의 양만큼 많을 수 있습니다.
보존 기간의 차이
Avamar Server 구성에서는 대상 서버의 복제본을 소스보다 더 오래 유지하도록 설정할 수 있습니다. 이로 인해 용량 활용도가 달라질 수 있습니다.
Avamar 구성 차이점
Avamar Server의 체크포인트 백업은 상당히 클 수 있습니다. 대상 Avamar에만 구성된 경우 대상에서 Data Domain의 활용도가 높아집니다.
Data Domain의 관점:
지문.
복제 중에 Data Domain으로 데이터가 전송되면 중복이 제거됩니다. 먼저 대상 Data Domain으로 데이터의 지문을 전송하여 대상에 해당 데이터가 있는지 확인합니다.
-
Data Domain에서 지문이 있다는 결과가 반환되면 데이터를 다시 보낼 필요가 없습니다.
-
Data Domain에서 지문을 찾을 수 없다는 결과가 반환되지 않는 경우 다음 중 하나를 의미합니다.
-
해당 위치에 지문이 없음
-
대상 Data Domain에 지문이 있지만 Data Domain의 특별한 위치를 개선하기 위해 데이터를 전송하려고 합니다.
-
Data Domain이 사용 중이므로 전체 검색을 완료하지 않습니다.
-
중복 데이터가 Data Domain으로 전송되는 경우 데이터 복제본을 추가로 제거하면 정리 중에 데이터가 중복 제거됩니다.
대상 Data Domain의 활용도는 높지만 변동폭이 크지 않아야 합니다.
메타데이터 오버헤드.
각 백업 파일에는 파일 정보 메타데이터가 함께 제공되며 각 파일에 대한 지문도 포함되어 있습니다.
예: 1TB 파일의 경우 활용도 비용은 파일 크기의 0.3%입니다.
평균 8KB 데이터 청크의 경우 82B의 메타데이터가 있습니다. 이는 압축 후 보상 용량에 대한 약 0.01%의 오버헤드입니다.
Avamar는 백업을 결합하여 백업이 완료될 때마다 증분 백업을 통해 결합된 전체 백업을 가져오므로 Avamar 통합 시 이러한 오버헤드가 추가로 증가합니다.
또한 백업을 건너뛰거나 데이터가 순서 없이 복제될 때 메타데이터 오버헤드가 증가한다는 것이 관찰되었습니다.
이 오버헤드를 생성하지 않는 유일한 백업은 VM 백업입니다. 메타데이터 비용이 최소화됩니다.
예: 백업이 문제 없이 복제되면 백업이 타겟에 Inc보다 메타데이터 오버헤드가 훨씬 더 큰 L0 백업을 생성합니다. 5일 분량의 백업이 있다고 가정해 보겠습니다.
가장 오래된 복제부터 최신 복제:
첫 번째 복제는 L0이고 그 다음 복제는 모두 Inc가 됩니다.
1xL0 + 4xInc
최신 복제부터 가장 오래된 복제:
복제가 백업을 건너뜀:
파일 추적
Data Domain은 중복 제거된 청크에서 각 파일을 구축하는 방법을 알고 있어야 합니다. Data Domain에 이 정보가 없는 경우 이 정보를 재구축하고 지문 체인을 다시 생성해야 합니다. 이로 인해 용량이 크게 증가할 수 있습니다.
대상 Data Domain의 용량이 크게 증가할 수 있는 두 가지 시나리오가 있습니다.
1. 파일 추적이 손실됨:
예: 대상 Data Domain이 여러 IP가 있는 DNS에 설정되어 있고 IP가 라운드 로빈 방식으로 분산되면 소스 Data Domain은 매번 서로 다른 IP에 연결됩니다. 어제 보낸 데이터의 복제본이 인식되지 않은 상태에서 더 많은 데이터가 전송되므로 메타데이터 비용도 증가합니다.
이 문제는 Avamar Server 롤백이 완료된 후 SFS_BFT_ENABLED false로 유지될 때 발생할 수 있습니다.
이로 인해 매우 큰 불일치가 발생할 수 있습니다. 백업이 만료되면 공간이 재확보됩니다.
인라인 데이터 중복 제거
Data Domain은 인라인 데이터 중복 제거를 최적화하기 위해 논리적 데이터 크기의 최대 6%까지 중복 데이터를 요청합니다.
데이터 중복 제거와 압축의 차이점
Data Domains는 로컬 스토리지의 고유한 데이터 중복 제거 및 압축을 독립적으로 수행하므로 대상 데이터가 저장되는 방식에 따라 활용도가 달라지지 않습니다.
Data Domain 정리
소스 및 대상 Data Domain이 서로 다른 날짜에 정리를 실행하고 있거나 Data Domain 중 하나에서 실행 중인 시간이 더 자주 또는 더 길면 사용된 용량에 차이가 있을 수 있습니다.
Resolution
모범 사례:
소스와 대상 두 Data Domain 시스템 간의 활용도에 차이가 있을 수 있으므로 차이를 최소화하는 데 도움이 되는 몇 가지 모범 사례가 있습니다.
-
hfscheck 장애 및 하드웨어 장애가 발생하는 즉시 이를 확인하여 롤백 가능성을 최소화합니다.
-
복제가 성공적으로 완료되었는지 확인합니다. 복제 완료와 관련하여 지속적으로 문제가 발생하는 경우 Dell Technologies 지원 부서에 문의해 구성을 검토합니다.
-
두 Data Domain 을 유사한 활용도로 유지해야 하는 경우 백업의 소스 복제본과 타겟 복제본에 동일한 보존 기간을 유지하고 두 Avamar 서버에서 체크포인트 백업이 동일하게 설정되어 있는지 확인합니다.
-
복제는 항상 가장 오래된 것부터 가장 최신 순으로 있어야 하며 건너뛰지 않아야 합니다.
-
Data Domain에 여러 IP가 구성되어 있는 경우 IP가 라운드 로빈 방식으로 배포되지 않았는지 확인합니다.
-
소스와 대상 Data Domain 시스템이 모두 같은 날짜와 시간에 정리를 실행하도록 합니다.
-
SFS_BFT_ENABLED true로 설정합니다. 이는 기술 지원 부서에서 활성화해야 합니다(SR을 제출하고 이 KB# - 182755 참조).