PowerStore: 데이터 수집에 실패하고 PowerStore Manager 사용자 인터페이스에서 비정상적인 정보를 보고함

Summary: PowerStore Manager 사용자 인터페이스에서 잘못된 값, 오류 또는 작업 실패를 보고합니다. 지원 자료 또는 지원 DC(Data Collection)가 실행되지 않거나 실행 중인 상태에서 멈춥니다.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

다음 증상이 포함됩니다.

  • 지원 자료 또는 지원 DC(Data Collection)가 실행되지 않거나 PowerStore Manager UI(User Interface)에서 실행 중인 상태로 멈춥니다. CLI(svc_dc run)를 통해 DC를 실행하면 다음 메시지와 함께 실패합니다. 
    • FAILURE, Running too long
    • Timed out receiving service data bundle command response from container
  • 볼륨에 0GB의 용량이 표시됩니다.  
  • 오브젝트(예: 볼륨 등)를 생성하거나 삭제할 수 없습니다.  
  • 볼륨을 확장할 수 없습니다. 오류 0xE0A080030019.
  • 보호 정책이 더 이상 작동하지 않고(새 스냅샷이 생성되지 않고 이전 스냅샷이 만료되지 않음) 복제 확인이 실패합니다.
  • SSH 상태를 보거나 변경할 수 없습니다. 오류: There was an error retrieving this information. Unknown property is_ssh_enabled requested. (0xE04040020002)
  • LDAP 도메인 연결 오류
  • 루트 파티션이 가득 찼거나 공간이 부족하다고 경고합니다. 보조 노드의 /cyc_var/cyc_service/tmp에서 임시 DC 파일이 정리되지 않아 루트 파티션이 가득 찰 수 있습니다. 시스템에서 다음과 같은 경고를 생성합니다. Root partition usage of node X has exceeded Y% (codes: 0x00400601 또는 0x00400602)
  • 루트 파티션 공간 문제를 해결하기 위한 조치를 즉시 취하지 않는 일부 극단적인 경우 보조 노드가 서비스 모드로 전환될 수 있습니다.
  • Fireman 명령이 실패하여 시스템 검사 실행이 시스템 검사 > 모니터링 > 에 실패합니다. (0xE0F010200004)



PowerStore Manager에서 볼 수 있는 DC 문제의 예:

image.png


PowerStore Manager에서 볼 수 있는 시스템 점검 실패의 예:

image.png


 

Cause

systemd 로그인 세션이 많이 누출되면 서비스 컨테이너에서 메모리 누수가 발생합니다. 서비스 컨테이너의 fireman 서비스가 메모리 부족 상태로 인해 DC 수집 중에 중단됩니다.

fireman 서비스가 중단된 후 시스템이 장애를 감지하지 못하면 fireman 서비스가 중단된 상태로 유지됩니다.

Resolution

수정

이 문제를 방지하기 위한 수정 사항은 PowerStoreOS 2.1.1.0-1649887에 있습니다. 업그레이드하는 것이 좋습니다.

이 수정 사항은 PowerStoreOS 버전 2.1.1.0 릴리스 노트 개정 A03 이상에 나열되어 있습니다.
문제 ID 기능 영역 설명
MDT-361718  PowerStore Manager(GUI) 컨트롤 경로 또는 관리 리소스의 문제로 인해 시간이 지남에 따라 PowerStore 시스템 사용자 인터페이스의 성능이 저하될 수 있습니다. 성능 저하로 인해 응답 속도가 느려지거나 PowerStore Manager(UI)에서 데이터를 수집하지 못할 수 있습니다.

해결 방법


참고: 이 해결 방법은 PowerStore T 모델에만 해당됩니다. PowerStore X에는 서비스를 재시작하기 전에 수행해야 하는 더 많은 요구 사항과 단계가 있습니다.

문제가 이미 발생한 경우 업그레이드를 시도하기 전에 Dell 기술 지원 부서 또는 공인 서비스 담당자에게 문의하고 이 기술 자료 문서 ID를 인용하십시오.

이미 있는 경우 이 문제를 해결하려면 두 개의 서비스를 다시 시작해야 합니다.
  • 영향을 받는 노드의 서비스 컨테이너입니다.
    • 서비스 컨테이너를 다시 시작하는 데 약 10분이 걸립니다.
    • 영향을 받는 노드의 서비스 컨테이너(SSH 또는 CLI)에 대한 액세스가 일시적으로 손실되는 것 외에는 시스템에 영향을 미치지 않습니다.
  • CP(Control Path) 또는 관리 서비스입니다.
    • 재시작하는 데 약 5분이 걸립니다.
    • PowerStore Manager 사용자 인터페이스에 대한 액세스가 일시적으로 손실되는 것 외에는 시스템에 영향을 미치지 않습니다.

몇 분 후 보조 노드의 루트 파티션에 있는 공간이 정상 수준으로 떨어집니다.

/cyc_cfs 파티션이 85%를 초과하는 경우 PowerStore Manager 사용자 인터페이스에서 이전 DC를 삭제합니다.

서비스를 다시 시작한 후 다음과 같은 몇 가지 경고가 표시될 수 있습니다.
  • SupportAssist 연결 알림
  • 복제 RPO 충족 안 됨 알림.
  • 스냅샷 자동 삭제 알림.
이러한 모든 알림은 작업 계획 후에 자체적으로 해결되어야 합니다. 다음 RPO 주기(복제) 또는 스냅 스케줄이 시작될 때까지 기다려야 할 수 있으므로 충분한 시간을 할애하십시오.

Additional Information

문제 식별

누출된 로그인 세션 수가 많은지 확인합니다(5,000보다 크면 문제가 있음).
[SVC:service@xxxxxxx-A ~]$ ll /run/systemd/system/ | wc -l  
23251


DC가 FAILURE, Running too long 오류와 함께 실패합니다.
[SVC:service@xxxxxxx-A user]$ svc_dc list e62c17be-7716-49ef-a0b0-7365db383e6e
start_timestamp            2022-01-19 04:42:46
end_timestamp              2022-01-19 04:59:46
status                     FAILURE
status_message             FAILURE, Running too long.
state                      OFFLINE
description
profiles                   Essential
creator_type               Manual
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         e62c17be-7716-49ef-a0b0-7365db383e6e


주 노드에 fireman 프로세스가 더 이상 존재하지 않으면 DC는 "Timed out receiving service data bundle command response from container"라는 오류와 함께 실패합니다.
[SVC:service@xxxxxxx-B user]$ svc_dc list 7ad948cb-5029-422f-b4dc-5bf2f9abf512
start_timestamp            2021-10-21 06:03:11
end_timestamp              2021-10-21 06:03:11
status                     FAILURE
status_message             Timed out receiving service data bundle command response from container  
state                      OFFLINE
description                2021-10-21 Daily Data Collection
profiles                   Essential
creator_type               Scheduled
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         7ad948cb-5029-422f-b4dc-5bf2f9abf512

Affected Products

PowerStore

Products

Storage, Entry Level & Midrange, PowerStore, PowerStore 1000X, PowerStore 1000T, PowerStore 3000X, PowerStore 3000T, PowerStore 5000X, PowerStore 5000T, PowerStore 500T, PowerStore 7000X, PowerStore 7000T, PowerStore 9000X, PowerStore 9000T
Article Properties
Article Number: 000193605
Article Type: Solution
Last Modified: 29 May 2024
Version:  21
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.