Dell Unity: Unity 성능 분석에 필요한 정보를 수집하는 방법
Summary: 이 문서에서는 Unity 어레이에서 성능 문제를 진단하기 위해 로그 및 데이터를 수집하는 방법을 보여줍니다.
Instructions
문제
-
연결된 호스트의 읽기 또는 쓰기(또는 둘 다) 성능이 미흡하거나 응답 시간이 오래 소요됩니다.
-
호스트 애플리케이션에 대한 응답 시간이 증가했거나 허용할 수 없을 정도로 높습니다.
-
성능 분석이 필요한 Dell Unity 어레이의 성능 문제입니다.
성능 문제에는 여러 가지 원인이 있을 수 있습니다. 이는 네트워크 구성, 혼잡, 호스트 구성, 하드웨어 장애, 디스크 경합(사용 중인 여러 LUN이 동일한 드라이브 공유) 또는 최대 사용량을 기록 중인 스토리지 어레이 등 여러 가지 원인이 있을 수 있습니다.
Unity 기술 지원 부서에서는 다음과 같은 사항이 제공될 때까지 성능 문제를 완전히 조사하고 해결할 수 없습니다.
- 서비스 데이터 파일(데이터 수집)
- UPA(Unity Performance Archives) 파일
- 운영 환경에서 경험한 증상에 대한 자세한 설명
이 Dell Knowledgebase Article(KB)에 정보를 즉시 제공하지 않으면 해결 시간이 길어질 수 있습니다.
성능 문제(증상, 타임스탬프 등)에 대한 세부 정보가 있으면 엔지니어가 문제의 원인이 아니라 해당 문제를 찾는 데 몇 시간을 허비하지 않고 집중해야 할 부분(시간, LUN, 호스트 등)을 알 수 있기 때문에 매우 중요합니다. 이 세부 정보가 없으면 문제를 찾는 데 몇 시간이 소요되고도 결국 일반적인 성능 통계만 분석하는 데 그칠 수 있습니다.
범위
고객 지원 서비스는 성능 케이스를 조사하여 고객 사이트에 영향을 미치는 문제를 파악합니다. 성능 튜닝(호스트 또는 애플리케이션이 최대 성능에 도달하도록) 및 재구성은 스토리지 관리자 또는 솔루션 설계자의 작업이므로 고장/수리 서비스 요청에서는 처리되지 않습니다.
어레이의 현재 워크로드 수준에 대한 보고서 요청과 같이 명확한 문제와 관련되지 않은 서비스 요청은 문제 해결 지원 범위를 벗어납니다. 자체 도움말을 위해 또는 어레이의 워크로드 수준을 결정하는 데 도움이 필요한 사용자는 LiveOptics 서비스를 사용할 수 있습니다. 이 옵션에 대한 자세한 내용은 다음 문서를 참조하십시오.
상세 성능 분석을 위한 데이터 및 정보 요구 사항
각 이벤트에 대해 기술 지원 부서는 해당 이벤트 기간을 다루는 다음과 같은 로그 및 정보를 필요로 합니다.
- 문제가 발생한 직후 생성되는 서비스 데이터 파일(데이터 수집이라고도 함)
- 복제를 사용 중인 경우 두 어레이 모두의 데이터 수집 및 UPA 파일이 필요합니다.
- 문제가 발생한 전체 기간이 포함된 Unity UPA(Unity Performance Archives) 파일
- 문제가 어레이 외부에 있는 것으로 보이는 경우 호스트 Grab 및 스위치 로그도 필요할 수 있습니다.
- Unity 네트워크 추적도 필요할 수 있습니다.
차단 문제
- 명확하고 상세한 문제 설명 제공:
- 문제가 언제 발생했습니까? (날짜, 시간 및 시간대)
- 어떤 LUN이 영향을 받습니까?
- 검색 범위를 좁히는 데 중요합니다.
- 문제가 발생한 LUN에서 Data Reduction 또는 Advanced Deduplication이 활성화되어 있습니까? 다른 LUN에 대해 Data Reduction이 설정되어 있습니까? (Unity 모범 사례 백서 - CPU Utilization 섹션 - 9페이지 참조)
- 복제를 사용 중입니까? 복제에 대한 RPO와 복제를 일시 중지하면 성능 문제가 개선되는지 여부에 대한 정보를 제공하십시오.
- 활성 데이터를 사용할 수 없거나 사용할 수 없었습니까?
- 지정된 시간에 다른 작업이 실행되고 있습니까? (백업, 작업, 배치, 바이러스 검사, 호스트 디스크 최적화(TRIM/UNMAP) 등)
- 작동하지 않는 항목이 있다면, 원래는 제대로 작동되었습니까? 아니면 새로운 구현/설정의 일부입니까? 최근에 추가된 새 애플리케이션 또는 호스트가 있습니까?
- 성능은 어떻게 측정합니까? 또는 그 영향은 무엇입니까? 호스트 측에서 지연 또는 오류가 발생했습니까? 최종 사용자가 속도 저하를 보고합니까?
- SAN 환경(호스트, 스위치, 어레이)에 최근 변경 사항이 있습니까?
- 영향(영향을 받는 애플리케이션, 영향을 받는 서버 수, 영향을 받는 사용자 수 등)
- 해당 문제가 얼마나 자주 발생합니까? (지속적으로/정기적으로/한 번/무작위로)
- 영향을 받는 호스트의 이름은 무엇입니까?
- 어떤 토폴로지가 사용됩니까? FC, iSCSI 또는 이더넷? iSCSI를 사용하는 경우 모든 호스트에서 반드시 TCP 지연 ACK를 비활성화해야 합니다.
- 연결 관련 문제일 수 있는 경우 지원 팀에서 토폴로지 다이어그램을 요청할 수 있습니다.
- 네트워크에서 알려진 문제가 동시에 발생합니까, 아니면 최근에 네트워크를 업그레이드했습니까? 또한 내부 LAN에서 iSCSI가 사용되지 않는지 확인하고 사용되는 스위치는 엔터프라이즈급 스위치여야 합니다.
파일 문제
- 명확하고 상세한 문제 설명 제공:
- 관련된 특정 프로토콜은 무엇입니까?
- 예: NFS(버전), CIFS(버전), NDMP, iSCSI, FTP, 등
- 문제가 특정 내보내기/공유, 파일 시스템/LUN과 관련이 있습니까?
- 문제가 발생하는 시간은 하루 중 언제입니까? (날짜, 시간 및 시간대)
- 현재 활성 워크로드는 얼마입니까?
- 예: 로그인, 로그아웃, 백업, 배치 작업 등
- 어떤 호스트가 관련되어 있습니까?
- 예: 백업, VM, 워크스테이션, 서버 등
- 애플리케이션에 대한 구체적인 세부 정보입니다.
- 네트워크 구성은 어떻습니까?
- 구체적인 인터페이스/NIC 세부 정보를 제공합니다.
- 네트워크 인터페이스가 별도의 NIC에 격리되어 있습니까?
- 예: 전용 NIC의 복제 트래픽
서비스 데이터 파일 수집(데이터 수집)
서비스 데이터 파일(데이터 수집)을 수집하려면 LKB 000023676을 참조하십시오. 어레이에서 서비스 데이터 파일을 실행하여 얻은 출력 파일은 해당 어레이의 세부 구성 정보와 발생한 모든 이벤트를 표시하는 데 필요합니다. 이벤트가 발생한 후 최대한 빨리 서비스 데이터 파일(데이터 수집)을 수집할 것을 권장합니다.
서비스 데이터 파일에는 마지막 전체 UPA 파일(1시간)과 사용 가능한 파일만 포함됩니다. -tmp.archive UPA 파일입니다. 적절한 성능 검토를 위한 정보로는 충분하지 않으며 추가 UPA가 필요한 경우가 많습니다.
서비스 데이터 파일(데이터 수집)에서 UPA 파일을 찾으려면 spx\cmd_outputs\metrics\
-
spx= 주 SP로 이동합니다. -
예: SPA가 활성 SP인 경우 UPA는 다음과 같은 상태입니다.
spa\cmd_outputs\metrics
UPA 파일 수집
- 지원 부서에서 추가 UPA 파일을 요청할 수 있습니다.
- 서비스 데이터 파일(데이터 수집)과 달리 어레이는 최대 48시간 분량의 UPA 파일을 저장합니다.
- UPA 파일은 아래 예와 같습니다. 각 파일 이름에는 파일에 있는 첫 번째 데이터 포인트의 날짜와 시간이 포함됩니다. 간격은 10초이며 1시간에서 10초를 뺀 값입니다. 파일 이름의 날짜와 시간은 UTC/GMT입니다.
- 아래 예에서 마지막 UPA 파일은 가장 최신 아카이브입니다.
-tmp.archive(Flash Translation Layer)을 사용하는 데이터 저장 애플리케이션과 시스템에서 일반적으로 수행되는 반복 프로그램과 삭제 사이클로 인해 마모되기 쉽습니다. 여기에는 현재 성능 데이터가 포함되며 SSH/CLI를 통해서만 어레이에서 복제하여 가장 최신 데이터를 볼 수 있습니다. 이 파일을 사용하면 다음 시간까지 기다릴 필요 없이 성능 이벤트를 확인할 수 있습니다.
- 아래 예에서 마지막 UPA 파일은 가장 최신 아카이브입니다.
Dell Unity 어레이에 저장된 UPA 파일의 예:01/05/2017 10:59 AM 11,017,216 _default_20170105_150000.archive
01/05/2017 11:59 AM 11,017,216 _default_20170105_160000.archive
01/05/2017 01:00 PM 11,017,216 _default_20170105_170000.archive
01/05/2017 01:59 PM 10,983,424 _default_20170105_180000.archive
01/05/2017 02:45 PM 8,308,736 _default_20170105_190000-tmp.archive
옵션 1: Unisphere 나열
이 옵션은 Unity OE 4.2 이상에서만 사용할 수 있습니다. 여기에는 사용 가능한 모든 UPA가 나열되지 않습니다. UI(Unisphere)에는 제한 사항이 있으며 사용 가능한 일부 파일만 나열할 수 있습니다. 필요한 UPA 파일이 나열되지 않으면 옵션 2로 이동하거나 SSH/CLI를 사용합니다.
옵션 2: Unisphere 시간 범위
- 시스템에서 사용 가능한 UPA를 가져올 시간 범위를 선택할 수 있습니다.
- 필요한 로그만 다운로드되도록 로그를 수집하기 전에 문제 시간을 확인하십시오.
- 고객 시간 범위는 로컬 브라우저 시간이며 현재 워크스테이션 시간과 동일한 경우도 있습니다.
- 이 옵션은 Unity OE 4.2 이상에서만 사용할 수 있습니다.

SSH/CLI 사용
또한 CLI를 사용하여 Unity 어레이에 있지만 옵션 1에 따라 UI(Unisphere)에 나열되지 않은 다른 UPA에 액세스할 수도 있습니다.
-
서비스 사용자 및 서비스 비밀번호를 사용하여 로그인합니다.
-
원하는 로그를 다음으로 복사
/cores/service/userfrom/EMC/backend/metricsluna1/archives -
WinSCP 또는 유사한 툴을 통해 이러한 로그를 다운로드합니다.
-
어레이가 OE 4.5.X 이상인 경우 파일 프로토콜을 SCP로 변경하십시오.
-
서비스 사용자와 서비스 비밀번호를 사용하여 로그인합니다.
-
ll /EMC/backend/metricsluna1/archives/
cp /EMC/backend/metricsluna1/archives/_default_20230221_180000.archive.gz /cores/service/user
참고: 현재 UPA만 수집하는 경우 백엔드에서 사용할 수 있는 UPA 파일이 수십 개이므로 |tail-10을 사용할 수 있지만 원하는 경우 모두 나열할 수 있습니다.

호스트 데이터 수집
특히 특정 호스트에 국한된 문제인 경우 호스트 Grab(또는 EMC Report) 출력 파일이 필요할 수 있습니다.
-
https://www.dell.com/support/home/(Dell 지원 사이트)로 이동하여 올바른 호스트 OS(예: ESXi 호스트 Grab)에 대한 Grab 유틸리티를 검색합니다.
-
유틸리티와 README 파일을 다운로드합니다.
-
README 파일에 따라 선택한 호스트 운영 체제에 대한 유틸리티를 실행합니다.
스위치 로그
성능 문제가 특정 경로에만 존재하는 경우 스위치 로그가 필요할 수 있습니다. 사용 중인 모델에 따라 지침은 다음 LKB를 참조하십시오.
Brocade/Connectrix