GZ 압축으로 변환한 경우 Data Domain 시스템 및 정리 성능에 미치는 영향
Summary: 이 문서에서는 DDR에서 지원되는 다양한 압축 알고리즘과 GZ 알고리즘을 사용하도록 시스템을 변환하는 데 미치는 영향에 대한 정보를 제공합니다.
Instructions
해결책
DDOS는 현재 다양한 압축 CPU 로드를 가진 네 가지 압축 유형을 지원합니다. 다음 표에는 각 옵션의 특징이 요약되어 있습니다.
type expected-comp CPU-load ---------- -------------------- -------------- none 1.0x 0x lz(default) 2.0x 1x gzfast 2.5x 2x gz 3.0x 5x
예를 들어, gz 압축 알고리즘은 약 3배의 로컬 압축을 제공하지만 lz보다 코드의 압축 부분을 실행하는 데 약 5배 더 많은 CPU를 사용합니다. 예상 압축 수치는 데이터 형식에 따라 크게 달라질 수 있습니다. 일부 데이터형의 경우 gz가 lz보다 10%만 더 나을 수 있지만 다른 데이터형의 경우 lz보다 2배 이상일 수 있습니다.
일반적으로 유사한 데이터 문자열이 많은 파일은 lz보다 gz로 더 잘 압축되는 경향이 있습니다.
이러한 데이터 세트의 예는 다음과 같습니다.
- 데이터베이스 파일.
- 로그 파일.
GZ 압축 사용의 결과:
압축 알고리즘이 강력할수록 CPU를 더 많이 사용하므로 성능에 상당한 영향을 미칠 수 있습니다.
- 중복 제거율이 낮은 백업은 더 많은 새 데이터를 압축하여 디스크에 기록해야 하므로 실행 속도가 느립니다. 특히 첫 번째 전체 백업은 정격 최대 처리량의 50%를 달성할 가능성이 높습니다.
- 정리는 실행되는 동안 데이터의 압축을 풀고 다시 압축하므로 정리를 실행하는 데 시간이 더 오래 걸리고 백업 및 복제와 같은 시스템의 다른 활동이 느려질 수 있습니다.
- 디렉토리 복제 쌍의 소스 DDR은 데이터를 전송하기 전에 대상에서 사용하는 압축 알고리즘을 사용하여 데이터를 압축합니다. 따라서 대상에서 gz 압축 알고리듬을 사용하는 경우 복제 속도가 느려질 수 있으며 이로 인해 시스템에서 백업 및 정리와 같은 다른 작업이 느리게 실행될 수 있습니다.
따라서 GZ 압축으로 변환하는 것은 시스템에서 경험하게 될 워크로드에 따라 결정해야 합니다. 그렇지 않으면 용량 문제가 기본적으로 성능 문제로 변환됩니다.
다음 섹션에서는 GZ가 도움이 될 워크로드의 특성에 대해 설명합니다.
누가 GZ 압축을 사용해야 합니까?
중복 제거율이 높고, 변동률이 낮고, 백업 성능 요구 사항이 낮은 애플리케이션이 gz를 사용하기에 이상적인 후보입니다. 좋은 예가 니어라인 애플리케이션입니다. 니어라인 애플리케이션에 사용되는 현장의 대부분의 DDR은 이미 gz를 사용합니다.
압축 유형은 어떻게 변경합니까?
다음 명령을 사용하여 압축 유형을 변경합니다.
# filesys disable
# filesys option set local-compression-type {none | lz | gzfast | gz}
# filesys enable
압축 유형이 변경되면 모든 새 쓰기에 새 압축 유형이 사용되며 이미 기록된 모든 데이터는 정리 중에 새 압축 유형으로 느리게 변환됩니다. 지연 변환은 첫 번째 청소 라운드 동안 모든 컨테이너가 다시 압축되지 않음을 의미합니다. 압축 정책을 변경하기 전에 DDR에 존재하는 모든 데이터를 완전히 재압축하려면 여러 차례의 정리가 필요합니다.
정리 정책은 특정 정리 라운드에서 선택할 용기를 결정하고 해당 용기만 재압축됩니다. 정리 정책은 지정된 컨테이너가 보유하는 가비지 데이터의 양을 기반으로 합니다. 가비지 데이터는 네임스페이스에서 더 이상 참조되지 않는 삭제된 데이터를 의미합니다. 컨테이너에 쓰레기가 많을수록 청소 대상으로 선택될 가능성이 높아집니다.
고객이 일회성 히트를 지불하려는 경우 다음 절차를 따를 수 있습니다.
-
다음 명령을 사용하여 DDFS를 비활성화합니다.
filesys disable
-
다음 명령을 사용하여 지연 변환을 비활성화합니다( SE 모드 필요).
reg set system.GC_APPLY_LAZY_CONVERSION=false
-
다음 명령을 사용하여 DDFS를 활성화합니다.
filesys enable
따라서 압축 유형을 변경하고 지연 변환을 비활성화한 후 첫 번째 정리를 실행하는 데 시간이 더 오래 걸릴 수 있습니다. 압축 유형을 변경할 때마다 한두 주 동안 시스템을 주의 깊게 모니터링하여 제대로 작동하는지 확인해야 합니다.