Omitir para ir al contenido principal
  • Hacer pedidos rápida y fácilmente
  • Ver pedidos y realizar seguimiento al estado del envío
  • Cree y acceda a una lista de sus productos
  • Administre sus sitios, productos y contactos de nivel de producto de Dell EMC con Administración de la empresa.

Усунення помилок пам'яті в системах PowerEdge за допомогою тестування підкачки

Resumen: Заміна модулів DIMM пам'яті для усунення помилок пам'яті на серверах Dell Technologies PowerEdge.

Es posible que este artículo se traduzca automáticamente. Si tiene comentarios sobre su calidad, háganoslo saber mediante el formulario en la parte inferior de esta página.

Contenido del artículo


Síntomas

ПРИМІТКА: Ця стаття не стосується нових систем із процесором Xeon Scalable. Для новіших систем перегляньте цю статтю Що таке самовідновлення DDR4 на серверах Dell PowerEdge із масштабованими процесорами Intel Xeon.

Усунення помилок пам'яті в системах PowerEdge за допомогою тестування підкачки

Якщо в одному або кількох місцях пам'яті DIMM повідомляється про однобітну помилку (SBE) та/або багатобітну помилку (MBE), причина може бути не в самому модулі DIMM, тому необхідно виконати просте виправлення неполадок, щоб визначити, де саме криється несправність. На малюнку 1 наведено приклад помилок пам'яті, що з'являються в інтерфейсі iDRAC на R715.

Журнали iDRAC 6
Малюнок 1: Помилки пам'яті, які відображаються в журналах iDRAC 6 (лише англійською мовою)Ізоляція

проблем із пам'яттю означає заміну модулів DIMM пам'яті на різні роз'єми пам'яті, канали, банки та контролери. Існує кілька способів поміняти місцями модулі DIMM, щоб звузити проблему. Можливо, вам доведеться скористатися кількома з цих методів, щоб точно визначити несправний модуль DIMM або роз'єм. Нижче ви знайдете зображення цих методів. Щоб спростити пояснення, ми припускаємо, що несправний модуль DIMM — це A1 або один із наборів, позначених синім кольором на зображеннях.

ПРИМІТКА: Ви можете прочитати більше про пам'ять для ваших систем у наших статтях про пам'ять.


Заміна модулів DIMM у групах (за каналами або банками), а не окремо є найкращим способом виявлення несправних модулів DIMM або модулів DIMM.
Визначивши групу модулів DIMM або модулів DIMM або DIMM, що вийшли з ладу, можна використовувати пересувні окремі модулі DIMM, щоб визначити, які модулі DIMM вийшли з ладу.


Спосіб 1:

Заміна модуля DIMM A1 (позначено синім) на модуль DIMM A9 (позначено червоним), щоб спробувати модуль DIMM в іншому каналі пам'яті та банку


Модуль DIMM від A1 до A9Рисунок 2: Заміна модуля DIMM A1 на DIMM A9
 

Спосіб 2:

Заміна модуля DIMM A1 (позначена синім кольором) на DIMM B1 (позначена червоним) переводить модуль DIMM на зовсім інший контролер пам'яті (ЦП).

Модуль DIMM від A1 до B1
Малюнок 3: Заміна модуля DIMM A1 на DIMM B1
 

Спосіб 3:

Заміна всього банку модулів DIMMS (A1, A2, A3 - позначено синім) на інший банк (B1, B2, B3 - позначений червоним) тестує весь банк модулів DIMM у новому банку на новому контролері пам'яті.

Від DIMMA 123 до B123
Малюнок 4: Заміна модулів DIMM A1, A2, A3 на модулі DIMM B1, B2, B3
 

Спосіб 4

Помінявши місцями цілий канал модулів DIMM (A1, A4, A7 - позначені синім кольором) на інший канал (B1, B2, B3 - позначені червоним) протестуйте весь канал модулів DIMM як на новому каналі, так і на новому контролері пам'яті.

Модуль DIMM від A147 до B147
Малюнок 5: Заміна модулів DIMM A1, A4, A7 на модулі DIMM B1, B4, B7
 

Інтерпретація результатів після заміни модулів DIMM

Як правило, помилки модуля DIMM, як правило, з'являються відповідно до модулів DIMM, визначених у помилках. Наприклад, у випадку зі звітом SBE у DIMM A1 заміна цього модуля на інший модуль DIMM призводить до одного з наведених нижче випадків.

  1. Повідомлення про помилку більше не відображається, а проблему вирішено
  •   Це вказує на те, що перевстановлення пам'яті вирішило проблему
  1. Повідомлення про помилку з'являється після модуля DIMM (модуль DIMM A1 замінено на модуль DIMM B1, а повідомлення про помилки тепер надсилаються для модуля DIMM B1)
  • Це вказує на те, що модуль DIMM, швидше за все, вийшов з ладу і потребує заміни.
  1. Повідомлення про помилку з'являється після роз'єму DIMM (модуль DIMM A1 замінено на модуль DIMM B1, а повідомлення про помилки все одно надсилаються для модуля DIMM A1)
  • Це вказує на те, що, швидше за все, вийшла з ладу системна плата або центральний процесор
  • Заміна процесорів підтверджує, який компонент потребує заміни
  • Якщо проблема пов'язана з центральним процесором (повідомлення про помилку переміщується після заміни процесорів), замініть процесор
  • Якщо проблема не зникає з роз'ємом DIMM, замініть системну плату
  1. Повідомлення про помилку не відповідає шаблону DIMM або сокету (про помилку повідомляється для іншого модуля DIMM після заміни)
  • Це вказує на те, що інший модуль DIMM або DIMM, швидше за все, несправний
 
ПРИМІТКА: Ми також радимо вам підтримувати рівень прошивки в актуальному стані, оскільки це може зменшити ризик отримання помилок пам'яті та продовжити термін служби модулів DIMM.
Для отримання додаткової інформації перегляньте статтю бази знань Dell Dell Repository Manager (DRM).

Causa

Не застосовується

Resolución

Не застосовується

Propiedades del artículo


Producto comprometido

PowerEdge

Fecha de la última publicación

15 abr. 2024

Versión

8

Tipo de artículo

Solution