PowerScale: NDMP 성능 문제 해결
Summary: PowerScale 클러스터에서 NDMP(Network Data Management Protocol) 성능 문제를 조사할 때 가능한 원인을 조사해야 하는 몇 가지 주요 영역이 있습니다.
Instructions
최신 버전의 OneFS 9.x.x에서는 NDMP의 성능이 몇 가지 향상되었습니다. 클러스터의 버전과 설치된 RUP를 확인하여 최신 개선 사항이 적용되고 있는지 확인합니다.
NDMP 성능을 평가하려면 세 가지 주요 시스템 리소스를 분석해야 합니다.
- CPU 사용률
- 디스크 I/O
- 네트워크 인프라스트럭처
CPU 성능 분석
느리게 실행되는 것으로 보고된 각 노드에 대해 isi_hw_status 및 top 출력.
- 가상 코어 식별
시작 isi_hw_status에서 가상 코어 계산:
Virtual Cores = CPUs × Cores per CPU × 2 (if Hyperthreading is enabled)
예:
PROC: Single-proc, Dual-HT-core → 1 × 2 × 2 = 4 virtual cores
- 하중 평균 확인
에서 top 출력에서 1분, 3분 및 5분 로드 평균을 검토합니다.
load averages: 4.71, 3.48, 3.09
로드 평균이 가상 코어 수를 초과하는 경우 CPU 로드가 NDMP 성능 문제의 원인이 될 수 있습니다. 권장 사항은 활성 프로세스 수를 줄이거나 덜 많이 사용되는 노드로 로드를 재분배하는 것입니다.
디스크 성능 분석
단계:
- 드라이브 통계 검토
느리게 실행되는 것으로 보고된 각 노드에 대해 isi statistics drive을 클릭하고 대기열 열을 검사합니다. 값:
- > 1.0은 대기열을 나타냄
- > 1.5는 상당한 성능 저하를 시사함
Queued: 2.3 → High I/O wait on the spindle
- 스토리지 사용률 확인
디스크 사용량이 90% 미만이어야 합니다. 활용도가 높으면 성능 문제가 악화될 수 있습니다.
예:
Used: 63.2% <-- Within acceptable range
- 권장 사항
대기열이 많을 경우 I/O 로드를 줄이거나, 백업을 재분배하거나, 리소스를 확장합니다.
네트워크 성능 분석(3방향 NDMP만 해당)
단계:
- NDMP 연결 식별
안에 netstat 출력에서 NDMP CONTROL 연결(포트 10000)을 찾아 해당 DATA 연결(일반적으로 위에 나열됨)을 식별합니다.
예:
tcp4 0 384563 172.19.220.31.23261 172.19.200.22.55621 ESTABLISHED ← DATA tcp4 0 0 172.17.2.91.10000 172.19.200.22.55424 ESTABLISHED ← CONTROL
- Send-Q 분석
높고 안정적인 Send-Q(예: 6자리 값)는 데이터가 전송되고 있지만 수신되지 않았음을 나타내며 병목 현상을 나타냅니다.
- 백업 서버 확인
- 권장 사항
DMA(Data Management Application)에서 병목 현상이 발생하는 경우 DMA 지원 팀에 문의하여 추가 지원을 받는 것이 좋습니다.