PowerEdge 14G Intel- en 15G-servers: Gebeurtenissen met een herstelbare foutdrempel beheren

Samenvatting: Dit artikel bevat bijgewerkte aanbevelingen voor het beheren van corrigeerbare foutdrempelgebeurtenissen (MEM0802 of MEM5104) op DDR4 RDIMM's of LRDIMM's die zijn geïnstalleerd in op Intel gebaseerde 14G en 15G PowerEdge servers en AMD op 15G PowerEdge servers. ...

Dit artikel is van toepassing op Dit artikel is niet van toepassing op Dit artikel is niet gebonden aan een specifiek product. Niet alle productversies worden in dit artikel vermeld.

Symptomen

Opmerking: Dit artikel is niet van toepassing op 14G AMD-gebaseerde PowerEdge servers, zoals de 64x5- of 74x5-platforms, omdat ze deze functie voor automatische herinstallatie na pakketreparatie niet hebben, ook al ondersteunt de DIMM zelf dit zelf.

Door de ontwikkeling van de RAS-functies (Reliability, Accessibility en Serviceability) in het Enterprise-Class geheugen, heeft Dell een conservatieve benadering gekozen bij het bieden van transparantie aan onze klanten. Naarmate deze evolutie zich voortzet, doet Dell dat ook voor foutrapportage, waardoor de focus kan worden gelegd op meldingen die een dringender reactie vereisen in vergelijking met meldingen die voornamelijk informatief van aard zijn.

Naarmate de op DRAM gebaseerde geheugengeometrieën steeds kleiner worden, waardoor klanten de hogere prestaties krijgen die ze eisen, wordt een toenemend aantal corrigeerbare fouten verwacht als een natuurlijk onderdeel van uniforme schaalbaarheid.

Oorzaak

Binnen de wereldwijde serverindustrie is Dell het er steeds meer over eens dat sommige corrigeerbare fouten per DIMM onvermijdelijk zijn en niet inherent een vervanging van de geheugenmodule rechtvaardigen of zelfs een onmiddellijke herstart om automatische herinstallatie te starten.

Oplossing

Het blijven werken van een systeem dat corrigeerbare fouten meldt zonder opnieuw op te starten om het systeem zelf te herstellen, verhoogt het risico op niet-corrigeerbare fouten die kunnen leiden tot ongeplande downtime niet. Anderen in de branche hebben publiekelijk gecommuniceerd dat hun geheugenverwerking geen corrigeerbare fouten rapporteert.

In 14G Intel PowerEdge BIOS versie 2.5.4 en nieuwer is een BIOS-instelling toegevoegd met de naam "Correctable Error Logging", zodat klanten de mogelijkheid hebben om corrigeerbare foutrapportage uit te schakelen als ze dat willen, en velen hebben dat gedaan. Het BIOS blijft automatische herinstallatie plannen voor herstelbare drempelgebeurtenissen, zelfs zonder de logboekregistratie. Deze geplande automatische herinstallatie vindt automatisch plaats tijdens de daaropvolgende herstart van het systeem.

Om meer in lijn te komen met de branche en de voortdurende feedback van klanten, wordt vanaf maart 2022 de BIOS-instelling "Correctable Error Logging" gewijzigd in standaard uitgeschakeld. Deze BIOS-optie kan opnieuw worden ingeschakeld voor klanten die corrigeerbare geheugendrempelgebeurtenissen willen blijven zien. BIOS-versies met deze wijziging van de BIOS-instelling zijn:

  • 14G Intel platforms - BIOS-versie 2.13.3 of nieuwer
  • 15G AMD platforms - BIOS-versie 2.6.5 of nieuwer
  • 15G Intel platforms - BIOS-versie 1.5.5 of nieuwer.

De voordelen van DDR4 DIMM zelfherstel door een herstart van het systeem:

  • Het maakt reparatie van een DDR4 DIMM mogelijk zonder verwijdering uit het systeem; alle DDR4 DIMM's van Dell ondersteunen de functie voor zelfherstel van het geheugen.
 
Opmerking: 14G AMD PowerEdge servers hebben deze automatische herinstallatiemogelijkheid niet.
 
  • Maakt gebruik van beschikbare reserverijen die zijn ingebouwd in de DRAM waar een slechte rij permanent wordt vervangen door een bekende goede rij door elektrische zekering.
  • De daaropvolgende hertraining van het geheugen optimaliseert de "data-ogen" door de centrale punten opnieuw te kalibreren om er zeker van te zijn dat de geheugenbus op het hoogste niveau van signaalintegriteit werkt.

Voor corrigeerbare drempelgebeurtenissen waarbij de BIOS-instelling "Correctable Error Logging" is ingeschakeld raadt Dell Technologies aan om tijdens gebeurtenissen met een geheugendrempel opnieuw op te starten volgens het normale onderhoudsschema van de klant, zodat het geplande geheugen automatisch opnieuw kan worden geïnstalleerd of zichzelf kan corrigeren. Na het opnieuw opstarten worden geslaagde of mislukte automatische herinstallatiegebeurtenissen geregistreerd voor de bijbehorende DIMM's.

Als de BIOS-instelling "Correctable Error Logging" is uitgeschakeld, raadt Dell Technologies aan om opnieuw op te starten volgens het normale onderhoudsschema van de klant. Bij het opnieuw opstarten worden alle geplande automatische herinstallatiebewerkingen automatisch uitgevoerd. Het systeem registreert een gebeurtenis (MEM0805 of gebeurtenissen van het MEM7114-type) als de automatische herinstallatie of zelfcorrectie niet is gelukt en raadt verder aan de betreffende DIMM fysiek te vervangen.

Aanbeveling:
Dell Memory Engineering raadt PowerEdge Server klanten met oudere BIOS-versies (vóór maart 2022 releases) aan om de BIOS-instelling "Correctable Error Logging" te wijzigen in Uitgeschakeld. Dit elimineert de sporadische herstelbare geheugendrempelgebeurtenissen (zoals gebeurtenissen van het MEM0802- of MEM5104-type) in hun serverinfrastructuur die aanbevelen de server opnieuw op te starten om automatische herinstallatie of zelfcorrectie mogelijk te maken. Zoals eerder vermeld, worden geplande automatische herinstallatie- of zelfcorrectiebewerkingen automatisch uitgevoerd wanneer de server opnieuw wordt opgestart en eventuele storingen worden gemeld.

De BIOS-instelling "Correctable Error Logging" kan worden gewijzigd door de server opnieuw op te starten naar F2-instellingen of door de iDRAC WebUI te gebruiken.

De BIOS-instelling wijzigen in F2-systeeminstellingen:

  • Start de servers opnieuw op en stop bij de F2-instellingen
  • Wijzig in de selectie BIOS-instellingen>Geheugeninstellingen de Correctable Error Logging in Disabled.
  • Sla de BIOS-instellingen op en sluit de F2-instellingen af

De BIOS-instelling wijzigen met behulp van de iDRAC WebUI:

  • Meld u aan bij de iDRAC WebUI
  • Vouw onder Configuration >BIOS Settings het gedeelte Memory Settings uit
  • Wijzig de instelling voor herstelbare foutregistratie in Uitgeschakeld
  • Klik op de knop Toepassen om de geheugeninstellingen op te slaan
  • Vergeet niet de knop Toepassen en opnieuw opstartente selecteren (om onmiddellijk opnieuw op te starten) of Bij volgende keer opnieuw opstarten om de BIOS-wijzigingen toe te passen.

Bestaande artikelen en whitepapers over geheugen worden bijgewerkt om deze aanbevolen wijziging weer te geven.
 

Opmerking: De goedgekeurde klantgerichte berichten zijn als bestand aan dit artikel toegevoegd - "Managing Correctable Error Notices Dec 2021 v1.pdf."


Dit artikel wordt bijgewerkt zodra er nieuwe informatie beschikbaar komt.

Getroffen producten

Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, PowerEdge XR2, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R840, OEMR R940, OEMR R940xa, Poweredge C4140, PowerEdge C6420, PowerEdge C6520 , PowerEdge C6525, PowerEdge MX740C, PowerEdge MX750c, PowerEdge MX840C, PowerEdge R350, PowerEdge R440, PowerEdge R450, PowerEdge R540, PowerEdge R550, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T340, PowerEdge T350, PowerEdge T360, PowerEdge T440, PowerEdge T550, PowerEdge T560, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE7440, PowerEdge XE8545, PowerEdge XR11, PowerEdge XR12, PowerEdge XR4510c, PowerEdge XR4520c, VxFlex Ready Node R740xd, Dell EMC vSAN R740 Ready Node, Dell EMC vSAN R740xd Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840 ...

Producten

Dell EMC XC Series XC6420 Appliance, Dell EMC XC Core 6420 System, Storage Spaces Direct R440 Ready Node, Storage Spaces Direct R640 Ready Node, Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, OEMR R340, OEMR R440 , PowerEdge XR2, OEMR R540, OEMR R640, OEMR XL R640, OEMR R650, OEMR R650xs, OEMR R6515, OEMR R6525, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R750, OEMR R750xa, OEMR R750xs, OEMR R7515, OEMR R7525, OEMR R840, OEMR R940, OEMR R940xa, OEMR T440, OEMR T550, OEMR T640, OEMR XL T640, OEMR XL R340, PowerEdge C6420, PowerEdge C6525, PowerEdge MX740C, PowerEdge MX840C, PowerEdge R340, PowerEdge R540, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T440, PowerEdge T550, PowerEdge T640, PowerFlex appliance R650, PowerFlex appliance R6525, Powerflex appliance R750, PowerFlex custom node R650, PowerFlex custom node R6525, PowerFlex custom node R750, VxFlex Ready Node R640, VxFlex Ready Node R740xd, Dell EMC vSAN R750 Ready Node, Dell EMC vSAN R7515 Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R640, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840, Dell EMC XC Core XC7525 ...
Artikeleigenschappen
Artikelnummer: 000194574
Artikeltype: Solution
Laatst aangepast: 07 nov. 2025
Versie:  5
Vind antwoorden op uw vragen via andere Dell gebruikers
Support Services
Controleer of uw apparaat wordt gedekt door Support Services.