Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Сервери 14G Intel та 15G Intel / AMD PowerEdge: Пам'ять DDR4: керування пороговими подіями помилок, які можна виправити

Summary: Оновлені рекомендації для клієнтів щодо керування пороговими подіями помилок, які можна виправити (MEM0802 або MEM5104) на DDR4 RDIMM або LRDIMM, установлених на серверах 14G і 15G PowerEdge на базі Intel, а також на серверах 15G PowerEdge на базі AMD. Примітка: Ця стаття не стосується серверів PowerEdge 14G на базі AMD, таких як платформи 64x5 або 74x5, оскільки вони не мають цієї можливості відновлення після пакета / самовідновлення, хоча сам модуль DIMM її підтримує. ...

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

Завдяки еволюції функцій RAS (Reliability, Accessibility and Serviceability) у пам'яті корпоративного класу, Dell застосувала консервативний підхід до звітування про помилки, щоб забезпечити прозорість для наших клієнтів. У міру того, як ця еволюція триває, змінюється і підхід Dell до звітування про помилки, щоб дозволити зосередитися на повідомленнях, які вимагають більш термінової відповіді, на відміну від повідомлень, які мають переважно інформаційний характер.

Оскільки геометрія пам'яті на основі DRAM продовжує скорочуватися, забезпечуючи клієнтам підвищену продуктивність, яку вони потребують, очікується, що все більша кількість помилок, які можна виправити, є природною частиною рівномірного масштабування.

Cause

У світовій індустрії серверів все частіше прийнято вважати, що деякі помилки, які можна виправити в кожному модулі DIMM, неминучі і за своєю суттю не вимагають заміни модуля пам'яті або навіть негайного перезавантаження для ініціювання самовідновлення.

Resolution

Продовження роботи системи, яка повідомляє про помилки, які можна виправити, без перезавантаження для самовідновлення, суттєво не збільшує ризик виникнення помилок, які неможливо виправити, які можуть призвести до незапланованих простоїв. Фактично, інші представники галузі публічно повідомили, що їхня обробка пам'яті не повідомляє про помилки, які можна виправити.

У 14G Intel PowerEdge BIOS версії 2.5.4 і новіших було додано налаштування BIOS під назвою «Журналювання помилок, які можна виправити», щоб дозволити клієнтам вимкнути звітування про помилки, які можна виправити, якщо вони захочуть, і багато хто так і зробив.  BIOS продовжуватиме планувати самовідновлення для порогових подій, які можна виправити, навіть без ведення журналу. Це заплановане самовідновлення автоматично відбудеться під час наступного перезавантаження системи.

Щоб більше відповідати галузевим і постійним відгукам клієнтів, починаючи з березня 2022 року, оновлення BIOS Dell PowerEdge змінять налаштування BIOS «Виправлення помилок журналювання» на вимкнене за замовчуванням.  Цю опцію BIOS можна повторно ввімкнути для клієнтів, які хочуть і надалі бачити порогові значення пам'яті, які можна виправити. Версії BIOS із цією зміною налаштувань BIOS:
  • Платформи Intel 14G - BIOS версії 2.13.3 або новіші
  • Платформи AMD 15G - версії BIOS 2.6.5 або новіші
  • 15G Intel Platforms - BIOS версії 1.5.5 або новіше.

Переваги самовідновлення DDR4 DIMM за допомогою перезавантаження системи:
  • Дозволяє ремонтувати модулі DDR4 DIMM без вилучення з системи; всі модулі DIMM DDR4 від Dell підтримують самовідновлення пам'яті. Примітка - 14G сервери AMD PowerEdge не мають такої можливості самовідновлення.
  • Використовує наявні запасні рядки, спроектовані в DRAM, де поганий ряд постійно замінюється на завідомо хороший ряд за допомогою електричного плавлення.
  • Подальше перенавчання пам'яті оптимізує «очі даних» шляхом повторного калібрування центральних точок, щоб забезпечити роботу шини пам'яті на найвищому рівні цілісності сигналізації.


Для порогових подій, які можна виправити, з увімкненим параметром BIOS «Виправлення помилок журналювання», якщо виникають порогові події пам'яті, Dell рекомендує перезавантажитися за регулярним графіком технічного обслуговування клієнта, щоб дозволити заплановане самовідновлення пам'яті або самовиправлення. Після перезавантаження успішні або невдалі події самовідновлення реєструватимуться для пов'язаних модулів DIMM.

З налаштуванням BIOS «Виправлення помилок журналювання» Di sabled, Dell рекомендує перезавантажуватися за графіком регулярного технічного обслуговування клієнта. Після перезавантаження автоматично запустяться будь-які заплановані операції самовідновлення. Система зареєструє подію (події типу MEM0805 або MEM7114), якщо операція самовідновлення/самокорекції не увінчалася успіхом, і надалі рекомендуватиме фізичну заміну відповідного модуля DIMM.

Рекомендація:
Dell EMC Memory Engineering рекомендує клієнтам PowerEdge Server на старіших версіях BIOS (випуски BIOS до березня 2022 року) змінити налаштування BIOS «Виправлення помилок журналювання» на «Вимкнено». Це усуне спорадичні порогові події пам'яті, які можна виправити (наприклад, події типу MEM0802 або MEM5104) у серверній інфраструктурі, яка рекомендує перезавантаження сервера, щоб забезпечити самовідновлення або самовиправлення. Як згадувалося раніше, будь-які заплановані операції самовідновлення або самовиправлення виконуватимуться автоматично під час перезавантаження сервера та повідомлення про будь-які збої.
 

Налаштування BIOS «Виправлення помилок журналювання» можна змінити, перезавантаживши сервер у налаштування F2 або через графічний інтерфейс iDRAC.
 

Щоб змінити налаштування BIOS за допомогою F2 Settings, виконайте такі дії:

  • Перезавантажте сервери, зупинившись на налаштуваннях F2
  • У виборі BIOS Settings -> Memory Settings (Налаштування пам'яті) змініть параметр "Logging Error Logging, що виправляється" на вимкнений.
  • Збережіть налаштування BIOS і вийдіть з налаштувань F2

Щоб змінити налаштування BIOS за допомогою графічного інтерфейсу iDRAC, виконайте такі дії:

  • Увійдіть у графічний інтерфейс iDRAC
  • У розділі Конфігурація -> Налаштування BIOS розгорніть розділ Налаштування пам'яті
  • Змініть параметр "Журналювання помилок, які можна виправити" на вимкнений
  • Натисніть кнопку Застосувати, щоб зберегти налаштування пам'яті
  • Не забудьте натиснути кнопку «Застосувати та перезавантажити» (для негайного перезавантаження) або кнопку «При наступному перезавантаженні », щоб застосувати зміни в BIOS.


Наявні статті бази знань, пов'язані з пам'яттю, і офіційні документи буде оновлено відповідно до цієї рекомендованої зміни.

ПРИМІТКИ: Схвалені повідомлення, звернені до клієнтів, прикріплені як файл до цієї статті - "Керування повідомленнями про помилки, які можна виправити, грудень 2021 v1.pdf".

Ця стаття буде оновлюватися в міру надходження нової інформації.

Article Properties


Affected Product
AX-6515, AX-7525, Dell EMC vSAN C6420 Ready Node, Dell EMC vSAN MX740c Ready Node, Dell EMC vSAN R440 Ready Node, Dell EMC vSAN R640 Ready Node, Dell EMC vSAN R650 Ready Node, Dell EMC vSAN R6515 Ready Node, Dell EMC vSAN R740 Ready Node , Dell EMC vSAN R740xd Ready Node ...
Product
Dell EMC XC Series XC6420 Appliance, Dell EMC XC Core 6420 System, Storage Spaces Direct R440 Ready Node, Storage Spaces Direct R640 Ready Node, Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, OEMR R340, OEMR R440 , PowerEdge XR2, OEMR R540, OEMR R640, OEMR XL R640, OEMR R650, OEMR R650xs, OEMR R6515, OEMR R6525, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R750, OEMR R750xa, OEMR R750xs, OEMR R7515, OEMR R7525, OEMR R840, OEMR R940, OEMR R940xa, OEMR T440, OEMR T550, OEMR T640, OEMR XL T640, OEMR XL R340, PowerEdge C6420, PowerEdge C6525, PowerEdge MX740C, PowerEdge MX840C, PowerEdge R340, PowerEdge R540, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T440, PowerEdge T550, PowerEdge T640, PowerFlex appliance R650, PowerFlex appliance R6525, Powerflex appliance R750, PowerFlex custom node R650, PowerFlex custom node R6525, PowerFlex custom node R750, VxFlex Ready Node R640, VxFlex Ready Node R740xd, Dell EMC vSAN R750 Ready Node, Dell EMC vSAN R7515 Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R640, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840, Dell EMC XC Core XC7525 ...
Last Published Date

10 Feb 2022

Version

2

Article Type

Solution