PowerEdge 14G Intel- och 15G-servrar: Hantera korrigerbara händelser vid tröskelvärdet för fel

摘要: Den här artikeln innehåller uppdaterade rekommendationer för hantering av korrigerbara feltröskelhändelser (MEM0802 eller MEM5104) på DDR4 RDIMM- eller LRDIMM-moduler som är installerade i Intel-baserade 14G och 15G PowerEdge-servrar och AMD-baserade 15G PowerEdge-servrar. ...

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

Obs! Den här artikeln gäller inte AMD-baserade 14G PowerEdge-servrar, till exempel 64x5- eller 74x5-plattformarna, eftersom de inte har den här funktionen för automatisk ominstallation efter paketreparation, även om själva DIMM-modulen stöder den.

Genom utvecklingen av RAS-funktioner (pålitlighet, tillgänglighet och servicemöjligheter) i minnen i företagsklass har Dell valt en konservativ inställning när det gäller att ge transparens till våra kunder. I takt med att den här utvecklingen fortsätter även Dells strategi för felrapportering, vilket gör det möjligt att fokusera på meddelanden som kräver mer brådskande svar jämfört med meddelanden som främst är av informationskaraktär.

I takt med att DRAM-baserade minnesgeometrier fortsätter att krympa, vilket ger kunderna den ökade prestanda de kräver, förväntas ett ökande antal korrigerbara fel som en naturlig del av enhetlig skalning.

原因

Inom den globala serverbranschen finns det en alltmer accepterad uppfattning, som delas av Dell, att vissa korrigerbara fel per DIMM är oundvikliga och inte i sig motiverar ett byte av minnesmodulen eller ens en omedelbar omstart för att initiera automatisk ominstallation.

解决方案

Att fortsätta driva ett system som rapporterar korrigerbara fel utan en omstart för att självläka ökar inte risken för att uppleva icke-korrigerbara fel som kan leda till oplanerade driftstopp. Andra i branschen har offentligt kommunicerat att deras minneshantering inte rapporterar korrigerbara fel.

I 14G Intel PowerEdge BIOS version 2.5.4 och senare har en BIOS-inställning lagts till som kallas "Correctable Error Logging", för att ge kunderna möjlighet att inaktivera korrigerbar felrapportering om de vill, och många har gjort det. BIOS fortsätter att schemalägga automatisk ominstallation för korrigerbara tröskelhändelser även utan loggning. Den här schemalagda automatiska ominstallationen sker automatiskt under den efterföljande systemomstarten.

Från och med mars 2022 ändrar Dell PowerEdge BIOS-uppdateringen BIOS-inställningen "Correctable Error Logging" så att den inaktiveras som standard, för att bättre anpassa sig till branschen och fortsatt feedback från kunder. Det här BIOS-alternativet kan återaktiveras för kunder som vill fortsätta att se korrigerbara händelser för minnets tröskelvärde. BIOS-versioner där den här ändringen av BIOS-inställningarna ingår är:

  • 14G Intel-plattformar – BIOS-version 2.13.3 eller senare
  • 15G AMD-plattformar – BIOS-version 2.6.5 eller senare
  • 15G Intel-plattformar – BIOS-versionerna 1.5.5 eller senare.

Fördelarna med DDR4 DIMM självläker genom en omstart av systemet:

  • Det möjliggör reparation av en DDR4 DIMM utan borttagning från systemet; Alla DDR4 DIMM-moduler från Dell har stöd för funktionen för självläkning av minne.
 
Obs! 14G AMD PowerEdge-servrar har inte den här funktionen för automatisk ominstallation.
 
  • Använder tillgängliga reservrader som är inbyggda i DRAM-minnet där en felaktig rad permanent ersätts med en känd fungerande rad genom elektrisk säkring.
  • Den efterföljande minnesinlärningen optimerar "dataögonen" genom att kalibrera om mittpunkterna för att säkerställa att minnesbussen arbetar på högsta nivå av signalintegritet.

För korrigerbara tröskelhändelser med BIOS-inställningen "Correctable Error Logging" aktiverad, om minneströskelhändelser inträffar, rekommenderar Dell Technologies att du startar om enligt kundens ordinarie underhållsschema så att den schemalagda automatiska ominstallationen eller självkorrigeringen av minnet kan utföras. Efter omstarten loggas lyckade eller misslyckade automatiska ominstallationshändelser för de associerade DIMM-modulerna.

Med BIOS-inställningen "Correctable Error Logging" aktiverad rekommenderar Dell Technologies att du startar om enligt kundens ordinarie underhållsschema. Vid omstart körs alla schemalagda automatiska ominstallationsåtgärder automatiskt. Systemet loggar en händelse (händelser av typen MEM0805 eller MEM7114) om den automatiska ominstallationen eller självkorrigeringen misslyckades och rekommenderar vidare att fysiskt byte av berörd DIMM-modul byts ut.

Rekommendation:
Dell Memory Engineering rekommenderar att PowerEdge Server-kunder med äldre BIOS-versioner (före mars 2022-versionerna) inför att ändra BIOS-inställningen "Correctable Error Logging" till Inaktiverad. Detta eliminerar de sporadiska korrigerbara minneströskelhändelserna (t.ex. händelser av typen MEM0802 eller MEM5104) i serverinfrastrukturen som rekommenderar omstart av servern så att automatisk ominstallation eller självkorrigering kan ske. Som tidigare nämnts körs alla schemalagda automatiska ominstallations- eller självkorrigeringsåtgärder automatiskt när servern startas om och eventuella fel rapporteras.

BIOS-inställningen "Correctable Error Logging" kan ändras antingen genom att starta om servern till F2-inställningar eller genom att använda iDRAC WebUI.

Så här ändrar du BIOS-inställningen från F2-systeminställningarna:

  • Starta om servrarna och stoppa vid F2-inställningarna
  • I valet BIOS Settings>Memory Settings ändrar du Correctable Error Logging till Disabled.
  • Spara BIOS-inställningarna och avsluta F2-inställningarna

Så här ändrar du BIOS-inställningen med hjälp av iDRAC WebUI:

  • Logga in på iDRAC-webbgränssnittet
  • Under Inställningar för konfigurations-BIOS >utökar du avsnittet Minnesinställningar
  • Ändra inställningen Korrigerbar felloggning till Inaktiverad
  • Klicka på knappen Verkställ för att spara minnesinställningarna
  • Glöm inte att välja antingen knappen Verkställ och starta om (för att starta om omedelbart) eller Vid nästa omstart  för att tillämpa BIOS-ändringarna.

Befintliga minnesrelaterade artiklar och informationsdokument uppdateras för att återspegla den här rekommenderade ändringen.
 

Obs! Meddelandet som är avsett för godkända kunder bifogas som en fil i den här artikeln – "Managing Correctable Error Notices Dec 2021 v1.pdf.”


Den här artikeln uppdateras när ny information blir tillgänglig.

受影响的产品

Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, PowerEdge XR2, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R840, OEMR R940, OEMR R940xa, Poweredge C4140, PowerEdge C6420, PowerEdge C6520 , PowerEdge C6525, PowerEdge MX740C, PowerEdge MX750c, PowerEdge MX840C, PowerEdge R350, PowerEdge R440, PowerEdge R450, PowerEdge R540, PowerEdge R550, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T340, PowerEdge T350, PowerEdge T360, PowerEdge T440, PowerEdge T550, PowerEdge T560, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE7440, PowerEdge XE8545, PowerEdge XR11, PowerEdge XR12, PowerEdge XR4510c, PowerEdge XR4520c, VxFlex Ready Node R740xd, Dell EMC vSAN R740 Ready Node, Dell EMC vSAN R740xd Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840 ...

产品

Dell EMC XC Series XC6420 Appliance, Dell EMC XC Core 6420 System, Storage Spaces Direct R440 Ready Node, Storage Spaces Direct R640 Ready Node, Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, OEMR R340, OEMR R440 , PowerEdge XR2, OEMR R540, OEMR R640, OEMR XL R640, OEMR R650, OEMR R650xs, OEMR R6515, OEMR R6525, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R750, OEMR R750xa, OEMR R750xs, OEMR R7515, OEMR R7525, OEMR R840, OEMR R940, OEMR R940xa, OEMR T440, OEMR T550, OEMR T640, OEMR XL T640, OEMR XL R340, PowerEdge C6420, PowerEdge C6525, PowerEdge MX740C, PowerEdge MX840C, PowerEdge R340, PowerEdge R540, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T440, PowerEdge T550, PowerEdge T640, PowerFlex appliance R650, PowerFlex appliance R6525, Powerflex appliance R750, PowerFlex custom node R650, PowerFlex custom node R6525, PowerFlex custom node R750, VxFlex Ready Node R640, VxFlex Ready Node R740xd, Dell EMC vSAN R750 Ready Node, Dell EMC vSAN R7515 Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R640, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840, Dell EMC XC Core XC7525 ...
文章属性
文章编号: 000194574
文章类型: Solution
上次修改时间: 07 11月 2025
版本:  5
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。