Data Domain: 컨트롤러 업그레이드 후 재부팅 루프 - 메모리가 부족하고 중단 가능한 프로세스 없음
Summary: 컨트롤러 업그레이드 후 FS(File System)를 활성화한 후 5분 이내에 시스템이 계속 재부팅됩니다. 근본 원인은 메모리 부족(OOM) 상태로, 커널 패닉이 발생합니다. 시스템이 잘못된 레지스트리 설정으로 인해 '메모리 부족'을 보고합니다. 이 문제는 시스템 을 제거하여 해결할 수 있습니다. MEM_HUGETLB=FALSE' 레지스트리 키를 추가하고 시스템을 재부팅합니다. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
증상:
- 컨트롤러 업그레이드 후 DD가 계속 재부팅됩니다. FS(Filesystem)가 활성화되면 DD가 5분 이내에 재부팅됩니다.
- FS를 비활성화하여 재부팅 루프 방지(커널 패닉)
- 커널 패닉 메시지가 로그에 있습니다.
- 로그에 메모리 부족 오류가 있습니다.
- kern.info: '커널 패닉 - 동기화되지 않음: 메모리가 부족하고 죽일 수 있는 프로세스가 없습니다.
Kern.info 에 '메모리 부족' 오류가 표시됩니다.
Aug 26 14:45:05 xxxx kernel: [ 1332.027261] (E4)Out of memory: Kill process 4769 (java) score 1 or sacrifice child Aug 26 14:45:05 xxxx kernel: [ 1332.044831] (E4)Out of memory: Kill process 22332 (sms) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.305280] (E4)Out of memory: Kill process 6131 (sms) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.321218] (E4)Out of memory: Kill process 5647 (lwsmd) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.324153] (E4)Out of memory: Kill process 22442 (dd_usm) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.325088] (E4)Out of memory: Kill process 25402 (dd_ha_vol-ha_li) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.326060] (E4)Out of memory: Kill process 22459 (csmd) score 0 or sacrifice child Aug 26 14:45:12 xxxx kernel: [ 1338.519181] (E4)Out of memory: Kill process 6415 (lwsmd) score 0 or sacrifice child Aug 26 14:45:12 xxxx kernel: [ 1338.522521] (E4)Out of memory: Kill process 6412 (sms) score 0 or sacrifice child
Cause
컨트롤러 업그레이드 후 시스템이 계속 재부팅됩니다(예: DD9300에서 DD9900으로). DD가 루프에서 재부팅되지 않도록 파일 시스템이 비활성화되었습니다.
커널 로그에는 커널 패닉과 후속 재부팅을 유발하는 여러 OOM(메모리 부족) 오류가 표시됩니다.
이 문제의 근본 원인은 시스템이 올바르게 작동하는 데 사용할 수 있는 메모리가 부족하기 때문입니다. 이는 다음을 포함하되 이에 국한되지 않는 여러 이유 때문일 수 있습니다.
- 시스템 소프트웨어의 메모리 누수
- 특정 프로세스 또는 서비스에 할당된 메모리가 부족합니다.
- 과도한 메모리 사용을 초래하는 잘못된 시스템 구성
- 결함이 있는 메모리 모듈 또는 기타 구성 요소와 같은 하드웨어 문제
- 잘못된 레지스트리 키가 설정되었을 수 있습니다. 지원 팀에서 이 키를 제거해야 합니다. 체계. MEM_HUGETLB=거짓입니다.
메모리 소모의 정확한 원인을 파악하고 그에 따라 해결하려면 추가 조사가 필요합니다.
시스템 로그 및 오류 메시지를 검토하여 메모리를 과도하게 소비하여 OOM 오류를 일으킬 수 있는 특정 프로세스 또는 서비스를 식별합니다.
또한 시스템의 메모리 사용량 및 구성을 확인하면 문제의 원인이 될 수 있는 잘못된 구성 또는 하드웨어 문제를 식별하는 데 도움이 될 수 있습니다.
예를 들어: DIMM이 누락되거나 잘못 배치되면 지원되지 않는 구성이 될 수 있습니다. FS가 시작되지 않도록 합니다.
Resolution
- 시스템 로그에서 메모리 사용 또는 시스템 구성 오류와 관련된 오류 메시지 또는 경고를 확인합니다. 이에 따라 이러한 문제를 해결하십시오.
- 문제가 계속되면 Dell 지원 부서에 문의하여 추가 지원을 받으십시오. 문제 해결에 도움이 되도록 관련 시스템 로그 또는 진단 정보를 제공해야 합니다.
- 지원 번들 및 관련 코어|업로드할 커널 덤프 파일
Affected Products
Data DomainProducts
Data ProtectionArticle Properties
Article Number: 000228075
Article Type: Solution
Last Modified: 01 Nov 2024
Version: 1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.