PowerScale | L3 캐시 및 메타데이터 전략 이해
Summary: PowerScale은 노드 풀 내의 SSD(Solid State Drive)를 사용하여 성능을 향상시키는 방법에 유연성을 제공합니다. 두 가지 기본 전략은 L3 캐시와 메타데이터 가속화입니다. L3 캐시는 읽기 성능을 향상시키기 위해 자주 액세스하는 데이터와 메타데이터를 캐싱하도록 설계되었습니다. 메타데이터 가속화는 메타데이터 작업을 저장하고 가속화하는 데 SSD 전용으로 사용되므로 메타데이터 집약적인 워크로드에 유용할 수 있습니다. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Instructions
L3 캐시 이해:
L3 캐시: L3 캐시는 기본 메모리 캐시(L1 및 L2)를 보완하는 SSD에 상주하는 보조 수준의 캐시입니다. 제거 캐시로 작동하며, 자주 액세스하는 데이터와 메타데이터를 저장하여 읽기 레이턴시를 개선합니다. L3 캐시는 임의 파일 액세스와 관련된 워크플로에 가장 유용합니다. 아카이브 시리즈 스토리지 노드에 대해 메타데이터 전용 모드로 작동할 수 있습니다. SSD에 기존 데이터가 있는 노드 풀에서 L3 캐시를 활성화하려면 SSD를 캐싱에 사용하기 전에 드라이브에서 해당 데이터를 HDD로 비워야 합니다. L3 캐시를 비활성화하는 것이 일반적으로 더 빠른 작업입니다.
L3 캐시를 활용하는 워크플로:
-
- L3 캐시는 다음과 같은 특성을 가진 워크플로에 유용합니다.
- 랜덤 파일 액세스: 파일의 서로 다른 비순차적 부분을 자주 읽는 워크로드의 경우 L3 캐시를 사용하여 레이턴시를 크게 줄일 수 있습니다.
- 높은 읽기 대 쓰기 비율: L3 캐시는 주로 읽기 속도를 높이기 때문에 주요 읽기 구성 요소를 사용하는 워크플로가 가장 큰 이점을 제공합니다.
- 자주 액세스되는 "핫" 데이터 캐싱: L3 캐시는 자주 액세스하는 데이터를 자동으로 식별하고 저장하여 반복 액세스 성능을 향상시킵니다.
- 스트리밍 및 동시 파일 액세스(어느 정도): 랜덤 액세스가 가장 큰 이점을 제공하지만, 스트리밍 및 동시 액세스를 사용하는 워크플로에서도 L3 캐시를 통해 일부 성능이 향상될 수 있습니다.
L3 캐시를 선택하는 경우:
-
- 주요 성능 병목 현상이 데이터와 메타데이터 모두에 대한 랜덤 읽기 레이턴시인 경우
- RAM 비용을 늘리지 않고 노드의 유효 메모리 용량을 늘리기 위해서입니다.
- 최근에 L2에서 제거된 데이터 및 메타데이터를 상당히 많이 다시 읽는 워크로드의 경우.
- 파일 시스템 통과를 위한 메타데이터 성능이 중요한 아카이브 클래스 노드의 경우.
- 간단한 경우 "한 번 설정하면 안 되는" 읽기 성능 향상이 큰 구성 오버헤드 없이 이루어집니다.
메타데이터 가속화를 선택해야 하는 경우: - 메타데이터 작업(조회, 액세스, 수정)이 주요 성능 병목 현상인 경우.
- 메타데이터 읽기 볼륨이 많은 워크로드(메타데이터 읽기 가속) 또는 읽기와 쓰기 모두(메타데이터 읽기/쓰기 가속)
- 기본 데이터가 더 느린 스토리지에 상주하는 경우에도 빠른 메타데이터 액세스가 가장 중요한 지진 해석과 같은 시나리오에서.
- 메타데이터가 상주하는 위치에 대한 세부적인 제어가 필요한 경우
- 메타데이터 읽기 이점을 로컬 SSD가 없는 노드로 확장해야 하는 경우(다른 노드에서 메타데이터 읽기 가속과 함께 GNA 사용)
- 홈 디렉토리, 파일 열거량이 많은 워크플로, 수많은 비교가 필요한 작업과 같은 워크로드는 메타데이터 읽기 작업이 많은 경우가 많습니다. 이러한 경우 메타데이터 액세스 속도를 직접 높이면 성능이 크게 향상될 수 있습니다
메타데이터 전략 이해:
메타데이터 전략: 데이터를 캐싱하는 대신 메타데이터 작업을 주로 저장하고 가속화하도록 SSD를 구성할 수 있습니다. 이 전략은 다수의 작은 파일, 빈번한 디렉토리 조회, 메타데이터 집약적인 작업 엔진 작업과 같이 대량의 메타데이터 액세스가 필요한 워크로드에 유용할 수 있습니다. OneFS는 메타데이터 읽기 및 메타데이터 쓰기를 비롯한 다양한 메타데이터 SSD 전략을 지원합니다.
메타데이터 읽기: SSD는 주로 메타데이터 읽기 작업을 가속화하는 데 사용됩니다.
메타데이터 쓰기: SSD는 메타데이터 쓰기 작업을 가속화하는 데 사용됩니다.
- L3 캐시를 통한 메타데이터 전략의 이점:
- 메타데이터 가속화 는 SSD를 사용하여 특정 데이터 세트 및 워크플로에 대한 메타데이터 성능을 향상시키는 방법에 대해 보다 세분화된 제어 기능을 제공합니다. 반면에 L3 캐시는 광범위한 워크로드, 특히 데이터와 메타데이터 모두에 대한 반복적인 랜덤 읽기 액세스가 있는 워크로드에 도움이 되는 보다 일반적인 캐싱 계층입니다. L3 캐시는 자주 액세스하는 데이터에 대한 읽기 성능을 향상시키는 데 탁월하지만 전용 메타데이터 전략은 다음과 같은 구체적인 이점을 제공할 수 있습니다.
- 향상된 메타데이터 성능: 메타데이터 작업에 병목 현상이 발생하는 워크로드(예: 파일 열기, 닫기, 이름 변경, 많은 수의 파일 나열)의 경우 SSD를 메타데이터 전용으로 사용하면 레이턴시를 크게 줄이고 전체 처리량을 개선할 수 있습니다.
- 향상된 작업 엔진 성능: 특정 OneFS 작업 엔진 작업은 메타데이터 집약적입니다. 메타데이터 액세스 속도를 높이면 이러한 작업을 완료하는 데 걸리는 시간이 빨라집니다.
- 메타데이터 사용량이 많은 워크로드를 위한 예측 가능한 성능: 높은 메타데이터 활동의 일관된 패턴이 있는 환경에서 전용 메타데이터 전략은 제거 기반 캐시에 비해 더 예측 가능하고 지속적인 성능 향상을 제공할 수 있습니다.
- 특정 애플리케이션 및 워크플로는 실제 데이터 읽기 및 쓰기에 비해 불균형적으로 많은 수의 메타데이터 작업을 생성합니다. 예를 들어 파일 아카이빙, 미디어 자산 관리, EDA(Electronic Design Automation), 컴파일이 빈번한 소프트웨어 개발 환경, 수많은 소규모 파일 액세스 및 분석이 수반되는 유전체학 파이프라인 등이 있다. 이러한 경우 메타데이터 액세스 및 조작과 관련된 레이턴시가 심각한 성능 병목 현상이 될 수 있습니다
- 복잡한 디렉토리 구조를 탐색 하거나 많은 디렉토리의 콘텐츠를 나열하는 작업은 메타데이터 성능에 크게 좌우됩니다. 메타데이터 가속화는 시스템이 inode 정보 및 디렉토리 항목에 신속하게 액세스할 수 있도록 보장하며, 용량 제약 또는 낮은 액세스 빈도로 인해 이 정보를 제거할 수 있는 L3 캐시에 의존하는 것에 비해 이러한 작업의 속도를 크게 높입니다
- 백업, 복제 및 마이그레이션: 이러한 데이터 관리 작업에는 광범위한 메타데이터 검색 및 처리가 수반되는 경우가 많습니다. 가속화를 통한 더 빠른 메타데이터 액세스는 이러한 작업을 완료하는 데 필요한 시간을 크게 줄여 주요 워크로드의 중단을 최소화하고 운영 효율성을 개선할 수 있습니다.
- 검색 및 인덱싱: 사용자 또는 자동화된 프로세스가 메타데이터 속성(예: 이름, 크기, 수정 날짜)을 기반으로 특정 파일을 검색해야 하는 경우 가속화된 메타데이터 액세스를 통해 쿼리 실행 속도를 높일 수 있습니다. 이는 여러 클러스터에서 효율적인 쿼리 및 데이터 검색을 위해 파일 시스템 메타데이터를 인덱싱하는 MetadataIQ와 같은 솔루션과 관련이 있습니다
- 메타데이터를 선택해야 하는 경우:
- 디렉토리 탐색, 파일 또는 데이터 검색 작업, 인덱싱 작업이 많음.
- 디렉토리 열기, 닫기, 삭제, 생성(mkdir)과 같은 파일 작업.
- 조회, getattr 및 액세스 작업
- 홈 디렉토리, 특히 객체가 많은 디렉토리
- 열거 또는 비교가 많이 필요한 워크플로
- 메타데이터 적시성이 매우 중요한 지진 데이터 해석.
- 메타데이터 가속화는 처리량을 늘리고 레이턴시를 줄여 이러한 유형의 작업 성능을 크게 향상시킬 수 있습니다
요약: 선택 시기
-
- 워크로드가 파일 메타데이터에 액세스하거나 수정하는 작업(탐색, 검색, 인덱싱, 생성, 삭제, 속성 수정)에 크게 편중되어 있는 경우 메타데이터 가속화 전략(메타데이터 읽기 또는 메타데이터 읽기/쓰기)을 선택합니다.
- 워크로드가 주로 메타데이터 읽기 집약적이고 SSD 용량을 적게 사용하고 싶다면 메타데이터 읽기 가속화를 선택합니다.
- 워크로드에 상당한 양의 메타데이터 쓰기가 수반되거나, 더 빠른 스냅샷 삭제가 필요하거나, EDA와 같은 소규모 파일 HPC 워크로드에서 플래시의 인라인 소규모 파일을 활용하는 경우 메타데이터 읽기/쓰기 가속화를 선택하십시오. SSD 용량이 충분한지 확인합니다.
- 혼합 클러스터(SSD가 있는 노드와 SSD가 없는 노드)가 있고 클러스터 전체에서 SSD가 없는 노드에 상주하는 데이터에 대한 메타데이터 읽기를 가속화해야 하는 경우 GNA를 고려하십시오. 이는 분산되어 있는 메타데이터 집약적인 워크로드와 관련이 있습니다.
- GNA(Global namespace Acceleration): GNA는 SSD가 없는 노드 풀이 클러스터의 다른 SSD에 추가 메타데이터 미러를 저장하여 SSD를 활용할 수 있도록 하는 이전 메커니즘(모든 노드에 SSD가 있는 경우 L3 캐시로 대체됨)입니다. 이렇게 하면 HDD 전용 풀에 저장된 데이터에 대한 메타데이터 읽기 작업이 가속화됩니다. L3 캐시와 GNA는 동일한 클러스터에 공존할 수 있지만 일반적으로 서로 다른 노드 풀에서 작동합니다.
- 워크로드에 상당한 랜덤 읽기가 포함되거나, 대규모 작업 세트에 대해 확장된 캐싱의 이점이 있거나, 노드에 SSD가 있는 경우 작업 엔진 성능을 개선해야 하는 경우 L3 캐시를 고려하십시오.
도구 및 명령:
- 성능 모니터링: InsightIQ, CloudIQ 및 MetadataIQ와 같은 툴을 사용하여 클러스터 상태, 성능 메트릭 및 사용량 예측을 모니터링합니다. InsightIQ는 성능 추세를 추적하고, 패턴을 식별하고, 파일 분석을 수행할 수 있습니다. 또한 클러스터가 최대 용량에 도달하는 시기를 예측하는 데도 도움이 될 수 있습니다. CloudIQ는 클러스터 성능에 대한 통찰력을 제공합니다. MetadataIQ는 클러스터 전반에서 데이터 인덱싱 및 쿼리를 용이하게 하며 데이터 수명주기 관리 및 데이터 분포 이해에 사용할 수 있습니다.
- isi_cache_stats 유틸리티는 작업 데이터 세트 크기를 결정하는 데 유용하며, 이는 L2 및 L3 캐시용 SSD 사이징과 관련이 있습니다. 일반적인 규칙에 따르면 L2 용량 + L3 용량은 작업 세트 크기의 = 150%여야 합니다 >.
- MetadataIQ (OneFS 9.10+): MetadataIQ를 배포하고 구성하여 클러스터 전체에 걸쳐 메타데이터의 글로벌 카탈로그를 인덱싱 및 생성합니다. Kibana 대시보드를 사용하여 데이터 배포, 파일 수 및 메타데이터 속성을 시각화할 수 있습니다. 이는 데이터의 구성과 메타데이터의 증가 방식을 이해하는 데 도움이 됩니다. 주기적인 동기화를 통해 메타데이터 데이터베이스를 최신 상태로 유지
- InsightIQ 는 총 용량, 프로비저닝된 용량 및 사용된 용량을 포함하여 클러스터 용량에 대한 보고서를 제공하므로 기간별 추세를 기반으로 스토리지 요구 사항을 예측할 수 있습니다. 워크로드 성능, 레이턴시, IOPS 및 처리량을 모니터링할 수 있으므로 데이터 증가에 따른 잠재적인 병목 현상을 감지할 수 있습니다. InsightIQ의 파일 시스템 분석 보고서는 파일 수 및 크기 분포를 표시하여 LIN 수 증가와 직접적인 관련이 있는 데이터의 규모 및 구성에 대한 통찰력을 제공할 수 있습니다.
Affected Products
Isilon, PowerScale, PowerScale OneFSArticle Properties
Article Number: 000321641
Article Type: How To
Last Modified: 16 May 2025
Version: 1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.