PowerEdge 14G Intel- og 15G-servere: Administration af fejltærskelhændelser, der kan rettes

摘要: Denne artikel indeholder opdaterede anbefalinger til administration af fejltærskelhændelser (MEM0802 eller MEM5104) på DDR4 RDIMM er eller LRDIMM er, der er installeret i Intel-baserede 14G og 15G PowerEdge-servere og AMD-baserede 15G PowerEdge-servere. ...

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

Bemærk: Denne artikel gælder ikke for 14G AMD-baserede PowerEdge-servere, som f.eks. 64x5- eller 74x5-platformene, da de ikke har denne mulighed for automatisk geninstallation af Post Package Repair, selvom DIMM-modulet selv understøtter det.

Gennem udviklingen af funktionerne Pålidelighed, Tilgængelighed og Servicevenlighed (RAS) på tværs af hukommelsen i virksomhedsklassen har Dell indtaget en konservativ tilgang til at give gennemsigtighed til vores kunder. I takt med at denne udvikling fortsætter, gør Dells tilgang til fejlrapportering det også muligt at fokusere på meddelelser, der kræver en hurtigere reaktion sammenlignet med meddelelser, der primært er informative.

Da DRAM-baserede hukommelsesgeometrier fortsætter med at skrumpe, hvilket giver kunderne den øgede ydeevne, de kræver, forventes et stigende antal korrigerbare fejl som en naturlig del af ensartet skalering.

原因

Inden for den globale serverbranche er der en stadig mere accepteret opfattelse, som deles af Dell, om, at nogle fejl, der kan rettes pr. DIMM, er uundgåelige og ikke i sig selv berettiger en udskiftning af hukommelsesmodulet eller endda en øjeblikkelig genstart for at starte automatisk geninstallation.

解决方案

Fortsat drift af et system, der rapporterer fejl, der kan rettes uden genstart til selvreparation, øger ikke risikoen for at opleve fejl, der ikke kan rettes, og som kan føre til uplanlagt nedetid. Andre i branchen har offentligt meddelt, at deres hukommelseshåndtering ikke rapporterer fejl, der kan rettes.

I 14G Intel PowerEdge BIOS version 2.5.4 og nyere blev der tilføjet en BIOS-indstilling kaldet "Logføring af korrigerbare fejl" for at give kunderne mulighed for at deaktivere fejlrapportering, der kan rettes, hvis de ønsker det, hvilket mange har. BIOS fortsætter med at planlægge automatisk geninstallation for tærskelhændelser, der kan rettes, selv uden logføring. Denne planlagte automatiske geninstallation sker automatisk under den efterfølgende genstart af systemet.

For at drage mere i tråd med branchen og løbende kundefeedback ændrer Dell PowerEdge BIOS-opdateringer fra marts 2022 BIOS-indstillingen "Logføring af korrigerbare fejl" til at være deaktiveret som standard. Denne BIOS-indstilling kan genaktiveres for kunder, der fortsat ønsker at se fejlbehæftede hukommelsestærskelhændelser, der kan rettes. BIOS-versioner med denne inkluderede ændring af BIOS-indstillinger er:

  • 14G Intel-platforme – BIOS-version 2.13.3 eller nyere
  • 15G AMD-platforme – BIOS-version 2.6.5 eller nyere
  • 15G Intel-platforme – BIOS-version 1.5.5 eller nyere.

Fordelene ved DDR4 DIMM-selvreparation ved systemgenstart:

  • Det muliggør reparation af en DDR4 DIMM uden at fjerne den fra systemet; alle DDR4 DIMM'er fra Dell understøtter funktionen til selvreparation af hukommelse.
 
Bemærk: 14G AMD PowerEdge-servere har ikke denne automatiske geninstallationsfunktion.
 
  • Bruger tilgængelige reserverækker, der er indbygget i DRAM, hvor en dårlig række permanent erstattes med en kendt fungerende række ved elektrisk indbrænding.
  • Den efterfølgende omskoling af hukommelsen optimerer "dataøjnene" ved at kalibrere midtpunkterne igen for at sikre, at hukommelsesbussen fungerer på det højeste niveau af signalintegritet.

Hvis der opstår hukommelsestærskelhændelser med BIOS-indstillingen "Logføring af korrigerbare fejl" aktiveret, anbefaler Dell Technologies, at hvis der opstår hukommelsestærskelhændelser, anbefaler Dell Technologies genstart efter kundens almindelige vedligeholdelsesplan, så den planlagte hukommelse kan geninstalleres automatisk eller selvkorrigeres. Efter genstarten logføres vellykkede eller mislykkede automatiske geninstallationshændelser for de tilknyttede DIMM-moduler.

Med BIOS-indstillingen "Logføring af korrigerbar fejl" D isabled anbefaler Dell Technologies en genstart efter kundens almindelige vedligeholdelsesplan. Ved genstart køres alle planlagte automatiske geninstallationshandlinger automatisk. Systemet logfører en hændelse (MEM0805 eller hændelser af typen MEM7114), hvis den automatiske geninstallation eller selvrettelse mislykkedes, og anbefaler desuden fysisk udskiftning af det berørte DIMM-modul.

Anbefaling:
Dell Memory Engineering anbefaler, at PowerEdge-serverkunder på ældre BIOS-versioner (før martsblokudgivelserne for 2022) indfører at ændre BIOS-indstillingen "Logføring af korrigerbare fejl" til Deaktiveret. Dette eliminerer de sporadiske hukommelsestærskelhændelser, der kan rettes (f.eks. MEM0802- eller MEM5104 typehændelser) på tværs af serverinfrastrukturen, som anbefaler genstart af serveren, så der kan ske automatisk geninstallation eller selvkorrektion. Som tidligere nævnt kører alle planlagte automatiske geninstallations- eller selvkorrektionshandlinger automatisk, når serveren genstartes, og eventuelle fejl rapporteres.

BIOS-indstillingen "Logføring af korrigerbar fejl" kan ændres enten ved at genstarte serveren til F2-indstillinger eller ved hjælp af iDRAC WebUI.

Sådan ændres BIOS-indstillingen fra F2 Systemindstillinger:

  • Genstart serverne, der stopper ved F2-indstillinger
  • I valget af hukommelsesindstillinger i BIOS-indstillinger> skal du ændre logføring af fejl, der kan rettes til Deaktiveret.
  • Gem BIOS-indstillingerne, og afslut F2-indstillingerne

Sådan ændres BIOS-indstillingen ved hjælp af iDRAC WebUI:

  • Log på iDRAC WebUI
  • Under Konfiguration >af BIOS-indstillinger skal du udvide afsnittet Hukommelsesindstillinger
  • Skift indstillingen Logføring af fejl, der kan rettes til Deaktiveret
  • Klik på knappen Anvend for at gemme hukommelsesindstillingerne
  • Glem ikke at vælge enten knappen Anvend og genstart(for at genstarte med det samme) eller knappen Ved næste genstart  for at anvende BIOS-ændringerne.

Eksisterende hukommelsesrelaterede artikler og hvidbøger opdateres for at afspejle denne anbefalede ændring.
 

Bemærk: Den godkendte kundeorienterede meddelelse er vedhæftet som en fil til denne artikel - "Managing Correctable Error Notices Dec 2021 v1.pdf."


Denne artikel opdateres, efterhånden som nye oplysninger bliver tilgængelige.

受影响的产品

Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, PowerEdge XR2, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R840, OEMR R940, OEMR R940xa, Poweredge C4140, PowerEdge C6420, PowerEdge C6520 , PowerEdge C6525, PowerEdge MX740C, PowerEdge MX750c, PowerEdge MX840C, PowerEdge R350, PowerEdge R440, PowerEdge R450, PowerEdge R540, PowerEdge R550, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T340, PowerEdge T350, PowerEdge T360, PowerEdge T440, PowerEdge T550, PowerEdge T560, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE7440, PowerEdge XE8545, PowerEdge XR11, PowerEdge XR12, PowerEdge XR4510c, PowerEdge XR4520c, VxFlex Ready Node R740xd, Dell EMC vSAN R740 Ready Node, Dell EMC vSAN R740xd Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840 ...

产品

Dell EMC XC Series XC6420 Appliance, Dell EMC XC Core 6420 System, Storage Spaces Direct R440 Ready Node, Storage Spaces Direct R640 Ready Node, Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, OEMR R340, OEMR R440 , PowerEdge XR2, OEMR R540, OEMR R640, OEMR XL R640, OEMR R650, OEMR R650xs, OEMR R6515, OEMR R6525, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R750, OEMR R750xa, OEMR R750xs, OEMR R7515, OEMR R7525, OEMR R840, OEMR R940, OEMR R940xa, OEMR T440, OEMR T550, OEMR T640, OEMR XL T640, OEMR XL R340, PowerEdge C6420, PowerEdge C6525, PowerEdge MX740C, PowerEdge MX840C, PowerEdge R340, PowerEdge R540, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T440, PowerEdge T550, PowerEdge T640, PowerFlex appliance R650, PowerFlex appliance R6525, Powerflex appliance R750, PowerFlex custom node R650, PowerFlex custom node R6525, PowerFlex custom node R750, VxFlex Ready Node R640, VxFlex Ready Node R740xd, Dell EMC vSAN R750 Ready Node, Dell EMC vSAN R7515 Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R640, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840, Dell EMC XC Core XC7525 ...
文章属性
文章编号: 000194574
文章类型: Solution
上次修改时间: 07 11月 2025
版本:  5
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。