PowerEdge. Рекомендации по поиску и устранению неисправностей при проблемах с памятью
Summary:В этой статье приведены рекомендуемые действия для поиска и устранения неисправностей событий, связанных с памятью, на серверах Dell PowerEdge.
Please select a product to check article relevancy
This article applies to This article does not apply toThis article is not tied to any specific product.Not all product versions are identified in this article.
Сервер может сообщать о таких событиях памяти (но не ограничиваясь ими):
MEM0802
MEM6102
MEM6101
MEM5100
MEM5104
UEFI0103 — ошибка инициализации памяти в разъеме:
MEM6101 — диагностическое предупреждение в устройстве памяти при проверке конфигурации устройства и системы. (Расширенный идентификатор: )
MEM0001 - Потребление неисправимого события; Если восстановление ОС невозможно, это может привести к перезагрузке сервера.
MEM9072 - Patrol scrub found uncorrectable error (не используется); Не влияет, если ОС не использует память.
MEM6104 - Неустранимая ошибка; Расширенные байты показывают, был ли адрес использован или идентифицирован службой очистки Patrol.
Начальные действия по поиску и устранению неисправностей
Большинство вышеперечисленных проблем устраняются или точно диагностируются путем обновления микропрограммы конкретных компонентов. Обновления микропрограммы содержат исправления известных проблем и улучшения, что делает их критически важным первым шагом к решению.
Обновите микропрограмму следующих компонентов:
CPLD
iDRAC
BIOS
Примечание. Если микропрограмма CPLD недоступна для данной модели сервера, это не проблема, выполните установку остальных обновлений
Расширенные действия по поиску и устранению неисправностей
После выполнения начальных действий проблема может быть устранена или может потребоваться дальнейший поиск и устранение неисправностей для определения неисправного компонента в зависимости от информации в журналах TSR.
После просмотра журналов TSR могут быть выявлены следующие сообщения об ошибках:
События одноразрядной памяти (снижение производительности памяти), найденные в журналах:
Выключите систему, отсоедините питание, нажмите и удерживайте кнопку питания в течение 10 секунд, чтобы удалить остаточный заряд
Износостойкие устройства для защиты от электростатического разряда (ЭСР)
Извлеките указанный модуль DIMM
Установите модуль DIMM в другой разъем с заведомо исправным модулем DIMM
Закройте его и снова подключите к источнику питания
Включите его
Перезапустите его два раза (перезапуск POST > OS > , перезапуск > POST > OS > )
Соберите новый TSR и снова проверьте наличие событий памяти
В журналах обнаружены события многобитовой памяти (сбой памяти):
Выключите систему, отсоедините питание, нажмите и удерживайте кнопку питания в течение 10 секунд, чтобы удалить остаточный заряд
Износостойкие устройства для защиты от электростатического разряда (ЭСР)
Извлеките указанный модуль DIMM
Проверьте, поддерживается ли на компьютере конфигурация памяти. Если нет, извлеките дополнительные модули DIMM, чтобы достичь поддерживаемой конфигурации
Закройте его и снова подключите к источнику питания
Включите его
Соберите новый TSR и снова проверьте наличие событий памяти
В зависимости от результатов расширенных действий по поиску и устранению неисправностей требуется замена компонентов либо для модуля памяти DIMM, если произошло изменение разъема памяти, либо для системной платы, если событие памяти остается в том же разъеме.