Сервери PowerEdge 14G Intel та 15G: Керування подіями порогу помилки, які можна виправити

摘要: У цій статті наведено оновлені рекомендації щодо керування подіями порогу помилки, які можна виправити (MEM0802 або MEM5104) на RDIMM або LRDIMM, встановлених на серверах PowerEdge 14G і 15G на базі Intel і 15G PowerEdge на базі AMD. ...

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

Примітка: Ця стаття не стосується серверів PowerEdge на базі 14G AMD, таких як платформи 64x5 або 74x5, оскільки вони не мають цієї можливості автоматичного повторного встановлення після відновлення пакетів, хоча сам DIMM підтримує її.

Завдяки еволюції функцій надійності, доступності та сервісності (RAS) у пам'яті корпоративного класу, Dell застосувала консервативний підхід до забезпечення прозорості для наших клієнтів. У міру того, як ця еволюція триває, змінюється і підхід Dell до звітування про помилки, що дозволяє зосередитися на повідомленнях, які вимагають більш термінової реакції, порівняно з повідомленнями, які мають переважно інформаційний характер.

Оскільки геометрія пам'яті на основі DRAM продовжує скорочуватися, надаючи клієнтам підвищену продуктивність, якої вони потребують, очікується все більша кількість помилок, які можна виправити, як природна частина рівномірного масштабування.

原因

У світовій індустрії серверів все частіше прийнято розуміти, що деякі помилки, які можна виправити в кожному модулі DIMM, неминучі і за своєю суттю не вимагають заміни модуля пам'яті або навіть негайного перезавантаження для ініціювання автоматичної повторної інсталяції.

解决方案

Продовження роботи системи, яка повідомляє про виправні помилки без перезавантаження для самовідновлення, не збільшує ризик виникнення невиправних помилок, які можуть призвести до незапланованих простоїв. Інші представники галузі публічно повідомили, що їхня обробка пам'яті не повідомляє про помилки, які можна виправити.

У 14G Intel PowerEdge BIOS версії 2.5.4 і новіших було додано налаштування BIOS під назвою «Журнал виправлених помилок», щоб дозволити клієнтам вимкнути звітування про помилки, які можна виправити, якщо вони цього виберуть, і багато хто так і зробив. BIOS продовжує планувати автоматичну повторну інсталяцію для виправлених порогових подій навіть без ведення журналу. Ця запланована автоматична перевстановлення автоматично відбувається під час наступного перезавантаження системи.

Щоб більше відповідати галузевим якостям і постійним відгукам клієнтів, починаючи з березня 2022 року, оновлення Dell PowerEdge BIOS змінюють налаштування BIOS, що виправляється помилками, на вимкнені за замовчуванням. Цю опцію BIOS можна повторно ввімкнути для клієнтів, які хочуть і надалі бачити події порогу пам'яті, які можна виправити. Версії BIOS з цією зміною налаштувань BIOS:

  • Платформи 14G Intel - версії BIOS 2.13.3 або новіші
  • 15G платформи AMD - версії BIOS 2.6.5 або новіші
  • 15G Intel Platforms - версії BIOS 1.5.5 або новіше.

Переваги самовідновлення DDR4 DIMM шляхом перезавантаження системи:

  • Це дозволяє виконувати ремонт модулів DDR4 DIMM без вилучення з системи; Усі модулі DDR4 DIMM від Dell підтримують функцію самовідновлення пам'яті.
 
Примітка: Сервери 14G AMD PowerEdge не мають цієї можливості автоматичного перевстановлення.
 
  • Використовує доступні запасні ряди, спроектовані в DRAM, де поганий ряд назавжди замінюється на завідомо справний ряд за допомогою електричного плавлення.
  • Подальший перезаряд пам'яті оптимізує «очі даних» шляхом повторного калібрування центральних точок для забезпечення того, що шина пам'яті працює на найвищому рівні цілісності сигналізації.

Для порогових подій, які можна виправити, з увімкненим налаштуванням BIOS «Виправлення помилок logging», у разі виникнення подій порогу пам'яті, Dell Technologies рекомендує перезавантажуватися за регулярним графіком обслуговування клієнта, щоб забезпечити автоматичне повторне встановлення або самовиправлення запланованої пам'яті. Після перезавантаження успішні або невдалі події автоматичної повторної інсталяції реєструються для пов'язаних модулів DIMM.

За допомогою параметра BIOS «Виправлення помилок logging» Disabled, Dell Technologies рекомендує перезавантаження за регулярним графіком обслуговування клієнта. Після перезавантаження всі заплановані операції автоматичної повторної інсталяції виконуються автоматично. Система реєструє подію (події типу MEM0805 або MEM7114), якщо автоматична повторна інсталяція або самовиправлення не увінчалися успіхом, і додатково рекомендує фізичну заміну відповідного модуля DIMM.

Рекомендація:
Dell Memory Engineering рекомендує клієнтам PowerEdge Server на старіших версіях BIOS (до випусків березневого блоку 2022 року) змінити налаштування BIOS «Виправлення помилок журналювання» на «Вимкнено». Це усуває спорадичні порогові події в пам'яті, які можна виправити (такі як події типу MEM0802 або MEM5104) у всій інфраструктурі сервера, яка рекомендує перезавантаження сервера, щоб забезпечити автоматичне повторне встановлення або самовиправлення. Як згадувалося раніше, будь-які заплановані операції автоматичної повторної інсталяції або самовиправлення виконуються автоматично, коли сервер перезавантажується та повідомляється про будь-які збої.

Налаштування BIOS "Correctable Error Logging" можна змінити або перезавантаживши сервер до налаштувань F2, або за допомогою веб-інтерфейсу iDRAC.

Щоб змінити налаштування BIOS у розділі «Системні параметри F2», виконайте такі дії:

  • Перезавантажте сервери, зупинившись на налаштуваннях F2
  • У виборі налаштувань пам'ятіналаштувань BIOS> змініть параметр Logging Error Gingging (Журнал виправлених помилок) на Disabled (Вимкнено).
  • Збережіть налаштування BIOS і вийдіть з налаштувань F2

Щоб змінити налаштування BIOS за допомогою веб-інтерфейсу iDRAC:

  • Увійдіть у веб-інтерфейс iDRAC
  • У розділі «Параметри конфігурації >BIOS» розгорніть розділ «Параметри пам'яті »
  • Змініть параметр «Журналювання помилок, які можна виправити» на «Вимкнено»
  • Натисніть кнопку «Застосувати », щоб зберегти параметри пам'яті
  • Не забудьте вибрати або кнопку «Застосувати і перезавантажити» (для негайного перезавантаження), або кнопку «При наступному перезавантаженні », щоб застосувати зміни в BIOS.

Наявні статті та офіційні документи, пов'язані з пам'яттю, оновлюються, щоб відобразити цю рекомендовану зміну.
 

Примітка: Затверджене повідомлення, яке стикається з клієнтом, додається як файл до цієї статті - "Managing Correctable Error Notices Dec 2021 v1.pdf."


Ця стаття оновлюється в міру надходження нової інформації.

受影响的产品

Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, PowerEdge XR2, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R840, OEMR R940, OEMR R940xa, Poweredge C4140, PowerEdge C6420, PowerEdge C6520 , PowerEdge C6525, PowerEdge MX740C, PowerEdge MX750c, PowerEdge MX840C, PowerEdge R350, PowerEdge R440, PowerEdge R450, PowerEdge R540, PowerEdge R550, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T340, PowerEdge T350, PowerEdge T360, PowerEdge T440, PowerEdge T550, PowerEdge T560, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE7440, PowerEdge XE8545, PowerEdge XR11, PowerEdge XR12, PowerEdge XR4510c, PowerEdge XR4520c, VxFlex Ready Node R740xd, Dell EMC vSAN R740 Ready Node, Dell EMC vSAN R740xd Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840 ...

产品

Dell EMC XC Series XC6420 Appliance, Dell EMC XC Core 6420 System, Storage Spaces Direct R440 Ready Node, Storage Spaces Direct R640 Ready Node, Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, OEMR R340, OEMR R440 , PowerEdge XR2, OEMR R540, OEMR R640, OEMR XL R640, OEMR R650, OEMR R650xs, OEMR R6515, OEMR R6525, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R750, OEMR R750xa, OEMR R750xs, OEMR R7515, OEMR R7525, OEMR R840, OEMR R940, OEMR R940xa, OEMR T440, OEMR T550, OEMR T640, OEMR XL T640, OEMR XL R340, PowerEdge C6420, PowerEdge C6525, PowerEdge MX740C, PowerEdge MX840C, PowerEdge R340, PowerEdge R540, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T440, PowerEdge T550, PowerEdge T640, PowerFlex appliance R650, PowerFlex appliance R6525, Powerflex appliance R750, PowerFlex custom node R650, PowerFlex custom node R6525, PowerFlex custom node R750, VxFlex Ready Node R640, VxFlex Ready Node R740xd, Dell EMC vSAN R750 Ready Node, Dell EMC vSAN R7515 Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R640, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840, Dell EMC XC Core XC7525 ...
文章属性
文章编号: 000194574
文章类型: Solution
上次修改时间: 07 11月 2025
版本:  5
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。