Data Domain: EVT-FILESYS-00008 / FILESYS-00008 또는 EVT-FILESYS-00010 / FILESYS-00010 또는 EVT-FILESYS-00011 / FILESYS-00011 알림과 함께 예기치 않게 DDFS(Data Domain File System)가 재시작됨

Summary: 이 기술 자료 문서에서는 예기치 않게 파일 시스템이 재시작될 경우 발생할 수 있는 알림 및 분류 목적으로 캡처할 정보를 설명합니다.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms



DDFS 프로세스는 DDOS(Data Domain Operating System) 데이터 중복 제거 파일 시스템의 운영을 담당하는 주요 프로세스입니다.

이 프로세스에 문제가 발생하면 다음 중 하나의 알림이 생성됩니다.
  • EVT-FILESYS-00008 / FILESYS-00008
  • EVT-FILESYS-00010 / FILESYS-00010
  • EVT-FILESYS-00011 / FILESYS-00011
위의 알림은 발생한 문제가 예상치 못한 문제임을 나타내며 원인을 확인하려면 추가 정보가 필요합니다.

알림은 Data Domain 시스템에 구성된 알림 메커니즘(예: 이메일/snmp)을 통해 전송됩니다. 'alerts show history' 출력에도 알림이 표시됩니다.

Cause

이 프로세스는 다음과 같이 여러 가지 경우에 재시작될 수 있습니다.
  • 직접적인 패닉(예: 명시적 코드 버그)
  • 내부 시간 초과가 발생했습니다. DDFS에는 DDFS 프로세스 내의 다양한 하위 시스템의 상태를 모니터링하는 내부 하트비트 모니터 스레드(hmon이라고 함)가 있습니다. hmon이 하위 시스템이 중단되었거나 너무 오래 대기 중임을 확인하면 DDFS 프로세스를 종료합니다.
  • 외부 시간 초과가 발생했습니다. ddr_stated라는 프로세스는 하트비트 메커니즘을 통해 DDFS 프로세스를 외부에서 모니터링하는 역할을 합니다. DDFS가 특정 기간 내에 명시된 ddr_stated에 하트비트를 보내지 않으면 ddr_stated는 DDFS가 중단되었다고 가정하고 DDFS 프로세스를 종료합니다.
  • 프로세스에서 허용된 것보다 더 많은 메모리를 요청합니다.
  • 내부 상태 확인에 실패했습니다.
이러한 조건이 하나라도 발생하면 파일 시스템에서 자동으로 재시작을 시도하여 정상 운영을 재개합니다. 

DDFS가 재시작되는 동안에는 복구/백업(예: 읽기/쓰기) 등 진행 중이던 모든 작업이 중단되며 재시작해야 합니다. 대부분의 백업 애플리케이션은 읽기/쓰기가 중단되었음을 인식하고 이러한 작업을 자동으로 재시작할 수 있습니다.

예기치 않게 DDFS가 재시작되면 다음과 같은 상황이 발생합니다.
  • 프로세스가 중단됩니다.
  • 프로세스에서 사용 중인 메모리 공간이 코어 덤프 디바이스에 기록되는 '코어 파일'에 기록됩니다. 코어 덤프 디바이스는 헤드 유닛 디스크 중 하나의 특수 영역입니다. 코어 파일에는 예기치 않은 재시작이 발생한 이유를 디버깅하는 데 필요한 정보가 들어 있습니다.
  • 위 단계가 완료되면 DDFS 프로세스를 재시작할 수 있습니다.
  • 동시에, 예를 들어 DDFS가 재시작되면 코어 덤프 디바이스에서 DDOS 파일 시스템으로 핵심 파일을 추출하여 액세스할 수 있도록 해야 합니다. 이 작업을 수행하는 프로세스를 'savecore'라고 합니다.
  • Savecore는 /ddvar/core에 초기 임시 디렉토리를 생성합니다. 디렉토리 이름은 '앱-<코어 파일이 발생한 날짜 및 시간>'입니다.
  • DDFS는 시스템의 메모리 대부분을 사용하므로 DDFS의 메모리 공간이 클 수 있습니다. 코어 파일에 기록되는 데이터의 양을 최소화하기 위해 savecore는 코어 덤프 디바이스에서 읽고 gzip을 통해 이 정보를 전달하여 코어 파일의 크기를 최소화하고 'core-incomplete.gz'라는 파일에 쓰기 시작합니다.
  • 이 프로세스가 완료되면 임시 디렉토리가 제거되고 코어 파일이 /ddvar/core에 배치되며 이름이 변경됩니다. 핵심 파일의 이름 지정 규칙은 다음과 같습니다.
    • 프로세스 이름
    • 프로세스 ID
    • 문자열 "core"
    • 코어가 UNIX 시간 형식으로 생성된 날짜/시간
    • 예를 들어 DDFS의 코어 파일은 'ddfs.core.14226.1469256407.gz'가 될 수 있습니다.
메모리 공간이 크기 때문에 코어 파일을 즉시 생성할 수 없으며 완료하는 데 몇 분 정도 걸릴 수 있습니다.

Resolution

위에서 언급한 것처럼 코어 파일 생성은 즉시 수행되지는 않으므로 NFS 또는 CIFS 공유를 통해 주기적으로 /ddvar/core 디렉토리를 확인하여 코어 파일 생성이 완료되는 시점을 확인할 수 있습니다. 

코어 파일 생성이 완료되면 예기치 않은 재시작을 유발한 원인을 분류하기 위해 두 가지 항목의 정보가 필요합니다. 다음과 같은 항목이 있습니다.
  1. 새 지원 번들. 지원 번들을 캡처하고 업로드하는 방법에 대한 자세한 내용은 다음 문서를 참조하십시오. https://support.emc.com/kb/323283
  2. 문제가 발생했을 때 생성된 코어 파일. 코어 파일을 업로드하고 액세스하는 데 사용할 수 있는 다양한 방법에 대한 다음 기술 자료 문서를 참조하십시오. https://support.emc.com/kb/457974
위의 항목을 지원 케이스에 업로드하십시오.

Affected Products

Data Domain

Products

Data Domain, DD OS, Data Domain Virtual Edition
Article Properties
Article Number: 000064290
Article Type: Solution
Last Modified: 19 Sept 2022
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.