Data Domain. Поиск и устранение ошибок памяти

Summary: В этой статье базы знаний описано, как устранить неполадки памяти, в том числе как определить неисправный модуль DIMM, который необходимо заменить.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

В этой статье базы знаний описано, как устранить неполадки памяти, в том числе как определить неисправный модуль DIMM, который необходимо заменить.

Возможные симптомы / оповещения:
 

DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert. 
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)

*These may also be reported without the hyphen (-): e.g.
DIMM00001, DIMM00002, DIMM00003, ENVIRONMENT00009, ENVIRONMENT00013, ENVIRONMENT00044, MEM00001, MEM00002
  • Перезагрузка таймера наблюдения IPMI
  • Меньше памяти, чем ожидалось оповещение
  • Возможное зависание во время самотестирования при включении питания (POST)
  • Система не загружается или происходит сбой системы

Cause

Модули DIMM, установленные в системах Datadomain, имеют ECC (код проверки ошибок), который позволяет исправлять ошибки памяти в процессе работы. Если превышено пороговое значение для ошибок, DDOS помечает эту ошибку и следует заменить затронутый модуль DIMM.
Неустранимые ошибки памяти могут привести к перезагрузке системы и считаются неисправностью жесткой памяти.
Полный сбой одного модуля DIMM или переходной платы памяти (к которой подключены несколько модулей DIMM) может привести к сбою системы и невозможности включения файловой системы. Это связано с тем, что процесс DDFS (файловая система DD) заполняет большую часть физической памяти.

ЗАМЕТКА: Ошибки памяти могут маскироваться другими признаками или оповещениями, например ошибкой CPU Machine Check — может потребоваться более глубокий анализ журнала и устранение неполадок.

Resolution

Отчеты об ошибках DIMM отслеживаются для всех версий DDOS. Однако может потребоваться анализ системных журналов для определения конкретного неисправного модуля DIMM.
Примечание. Модуль DIMM может находиться в переходнике памяти, подключенном к системной плате.
         Для включения файловой системы Data Domain (DDFS) ВСЯ установленная память должна присутствовать и быть работоспособной.

Поиск и устранение неисправностей может включать в себя:

  • Автономная диагностика  
  • Анализ файлов журналов
  • Переустановка подозрительных модулей DIMM
  • Перемещение неисправных модулей DIMM в заведомо исправные разъемы (т. е. неисправность следует за модулем DIMM, разъемом, каналом или контроллером?)
  • Замена неисправного модуля DIMM или переходника (при необходимости)  
  • Непрерывный мониторинг для подтверждения стабильности системы после изменения или замены оборудования

Примечание. Если после выполнения действий, описанных в этой статье базы знаний, проблема не устранена, обратитесь к поставщику услуг поддержки или создайте сервисную заявку .

Additional Information

Ссылки:
- См. соответствующие руководства по оборудованию системы DD для конфигурации/компоновки
DIMM - Data Domain: Требования к системной памяти и расширенные конфигурации
системы хранения данных- Домен данных: Карта памяти | Сбой DIMM, ошибка или сбой
- Data Domain: Сбой или ошибка карты памяти или DIMM
 

Affected Products

Data Domain, PowerProtect Data Protection Appliance, Data Domain, Data Domain Deduplication Storage Systems, PowerProtect Data Protection Hardware
Article Properties
Article Number: 000034334
Article Type: Solution
Last Modified: 05 Aug 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.