Data Domain. Поиск и устранение ошибок памяти
Summary: В этой статье базы знаний описано, как устранить неполадки памяти, в том числе как определить неисправный модуль DIMM, который необходимо заменить.
Symptoms
В этой статье базы знаний описано, как устранить неполадки памяти, в том числе как определить неисправный модуль DIMM, который необходимо заменить.
Возможные симптомы / оповещения:
DIMM-00001: Correctable ECC logging limit reached DIMM-00002: Multibit Uncorrectable ECC error DIMM-00003: A memory card has failed ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold ENVIRONMENT-00013: Memory uncorrectable ECC error alert. ENVIRONMENT-00044: Memory riser fault has been detected MEM-00001: DIMM failure detected after install. DDFS ""will not be started. MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)
*These may also be reported without the hyphen (-): e.g.
DIMM00001, DIMM00002, DIMM00003, ENVIRONMENT00009, ENVIRONMENT00013, ENVIRONMENT00044, MEM00001, MEM00002
- Перезагрузка таймера наблюдения IPMI
- Меньше памяти, чем ожидалось оповещение
- Возможное зависание во время самотестирования при включении питания (POST)
- Система не загружается или происходит сбой системы
Cause
Неустранимые ошибки памяти могут привести к перезагрузке системы и считаются неисправностью жесткой памяти.
Полный сбой одного модуля DIMM или переходной платы памяти (к которой подключены несколько модулей DIMM) может привести к сбою системы и невозможности включения файловой системы. Это связано с тем, что процесс DDFS (файловая система DD) заполняет большую часть физической памяти.
ЗАМЕТКА: Ошибки памяти могут маскироваться другими признаками или оповещениями, например ошибкой CPU Machine Check — может потребоваться более глубокий анализ журнала и устранение неполадок.
Resolution
Отчеты об ошибках DIMM отслеживаются для всех версий DDOS. Однако может потребоваться анализ системных журналов для определения конкретного неисправного модуля DIMM.
Примечание. Модуль DIMM может находиться в переходнике памяти, подключенном к системной плате.
Для включения файловой системы Data Domain (DDFS) ВСЯ установленная память должна присутствовать и быть работоспособной.
Поиск и устранение неисправностей может включать в себя:
- Автономная диагностика
- Анализ файлов журналов
- Переустановка подозрительных модулей DIMM
- Перемещение неисправных модулей DIMM в заведомо исправные разъемы (т. е. неисправность следует за модулем DIMM, разъемом, каналом или контроллером?)
- См. «Руководство по тестированию Dell Swap» Data Domain. Сбой или ошибка карты памяти или DIMM
- Замена неисправного модуля DIMM или переходника (при необходимости)
- Непрерывный мониторинг для подтверждения стабильности системы после изменения или замены оборудования
Примечание. Если после выполнения действий, описанных в этой статье базы знаний, проблема не устранена, обратитесь к поставщику услуг поддержки или создайте сервисную заявку .
Additional Information
Ссылки:
- См. соответствующие руководства по оборудованию системы DD для конфигурации/компоновки
DIMM - Data Domain: Требования к системной памяти и расширенные конфигурации
системы хранения данных- Домен данных: Карта памяти | Сбой DIMM, ошибка или сбой
- Data Domain: Сбой или ошибка карты памяти или DIMM