PowerEdge 14G Intel- og 15G-servere: Håndtere korrigerbare feilterskelhendelser

摘要: Denne artikkelen inneholder oppdaterte anbefalinger for håndtering av korrigerbare feilterskelhendelser (MEM0802 eller MEM5104) på DDR4 RDIMM-er eller LRDIMM-er installert i Intel-baserte 14G- og 15G PowerEdge-servere og AMD-baserte 15G PowerEdge-servere. ...

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

Merk: Denne artikkelen gjelder ikke for 14G AMD-baserte PowerEdge-servere, for eksempel 64x5- eller 74x5-plattformene, ettersom de ikke har denne funksjonen for automatisk ny installasjon av Post Package Repair, selv om DIMM-en selv støtter det.

Gjennom utviklingen av pålitelighets-, tilgjengelighets- og tilgjengelighetsfunksjoner (RAS) i hele minnet i virksomhetsklassen, har Dell tatt en konservativ tilnærming når det gjelder å gi åpenhet til kundene våre. Etter hvert som denne utviklingen fortsetter, fortsetter også Dells tilnærming til feilrapportering, noe som gjør det mulig å fokusere på meldinger som krever en mer presserende respons sammenlignet med meldinger som hovedsakelig er informative.

Etter hvert som DRAM-baserte minnegeometrier fortsetter å krympe, noe som gir kundene den økte ytelsen de krever, forventes et økende antall korrigerbare feil som en naturlig del av uniform skalering.

原因

I den globale serverbransjen er det en stadig mer akseptert forståelse, delt av Dell, om at enkelte korrigerbare feil per DIMM er uunngåelige og ikke i seg selv garanterer utskifting av minnemodul eller til og med umiddelbar omstart for å starte automatisk ny installasjon.

解决方案

Fortsatt drift av et system som rapporterer korrigerbare feil uten en omstart for å reparere seg selv, øker ikke risikoen for å oppleve uopprettelige feil som kan føre til ikke-planlagt nedetid. Andre i bransjen har offentlig kommunisert at deres minnehåndtering ikke rapporterer korrigerbare feil.

I 14G Intel PowerEdge BIOS versjon 2.5.4 og nyere ble det lagt til en BIOS-innstilling kalt "Korrigerbar feillogging", for å gi kundene muligheten til å deaktivere korrigerbar feilrapportering hvis de ønsker det, og mange har det. BIOS fortsetter å planlegge automatisk ny installasjon for korrigerbare terskelhendelser selv uten logging. Denne planlagte automatiske installasjonen utføres automatisk under den påfølgende omstarten av systemet.

For å trekke mer i tråd med bransjen og kontinuerlig tilbakemeldinger fra kunder, endrer Dell PowerEdge BIOS-oppdateringer fra og med mars 2022 BIOS-innstillingen "Korrigerbar feillogging" til å være deaktivert som standard. Dette BIOS-alternativet kan aktiveres på nytt for kunder som fortsatt ønsker å se hendelser for korrigerbar minneterskel. BIOS-versjoner der denne BIOS-innstillingsendringen er inkludert, er:

  • 14G Intel-plattformer – BIOS-versjon 2.13.3 eller nyere
  • 15G AMD-plattformer – BIOS-versjon 2.6.5 eller nyere
  • 15G Intel-plattformer – BIOS-versjon 1.5.5 eller nyere.

Fordelene med selvhjelp for DDR4 DIMM ved omstart av systemet:

  • Det muliggjør reparasjon av en DDR4 DIMM uten å ta den ut av systemet. Alle DDR4 DIMM-er anskaffet fra Dell støtter funksjonen selvhjelp for minne.
 
Merk: 14G AMD PowerEdge-servere har ikke denne automatiske reinstalleringsfunksjonen.
 
  • Bruker tilgjengelige reserverader som er arkitektonert inn i DRAM, der en dårlig rad erstattes permanent med en fungerende rad med elektrisk gass.
  • Den påfølgende minneomskoleringen optimaliserer "dataøynene" ved å kalibrere senterpunktene på nytt for å sikre at minnebussen opererer på høyeste nivå av signalintegritet.

For korrigerbare terskelhendelser med BIOS-innstillingen Korrigerbar feilloggingHvis minneterskelhendelser oppstår, anbefaler Dell Technologies at du starter på nytt etter kundens regelmessige vedlikeholdsplan, slik at den planlagte minnestandarden automatisk installeres på nytt eller korrigeres selv. Etter omstarten loggføres vellykkede eller mislykkede automatiske reinstalleringshendelser for de tilknyttede DIMM-ene.

Når BIOS-innstillingen "Korrigerbar feillogging" er aktivert, anbefaler Dell Technologies å starte på nytt etter kundens regelmessige vedlikeholdsplan. Ved omstart kjøres alle planlagte automatiske reinstalleringsoperasjoner automatisk. Systemet logger en hendelse (MEM0805 eller MEM7114 typehendelser) hvis den automatiske installasjonen eller selvkorrigeringen mislyktes, og anbefaler videre fysisk utskifting av berørt DIMM.

Anbefaling:
Dell Memory Engineering anbefaler at PowerEdge Server-kunder på eldre BIOS-versjoner (før mars 2022-utgivelser), tar i bruk å endre BIOS-innstillingen "Korrigerbar feillogging" til Deaktivert. Dette eliminerer sporadiske korrigerbare minneterskelhendelser (for eksempel hendelser av MEM0802 eller MEM5104 type) på tvers av serverinfrastrukturen som anbefaler omstart av serveren for å tillate automatisk ny installasjon eller selvkorrigering. Som nevnt tidligere, kjøres alle planlagte automatiske reinstallasjoner eller selvkorrigeringsoperasjoner automatisk når serveren startes på nytt og eventuelle feil rapporteres.

BIOS-innstillingen "Correctable Error Logging" kan endres enten ved å starte serveren på nytt til F2-innstillinger eller ved hjelp av iDRAC-webgrensesnittet.

Slik endrer du BIOS-innstillingen fra F2-systeminnstillinger:

  • Start serverne på nytt ved F2-innstillinger
  • I valget av minneinnstillinger for BIOS-innstillinger> endrer du den korrigerbare feilloggingen til deaktivert.
  • Lagre BIOS-innstillingene, og avslutt F2-innstillingene

Slik endrer du BIOS-innstillingen ved hjelp av iDRAC-webgrensesnittet:

  • Logg på iDRAC-webgrensesnittet
  • Under Configuration >BIOS Settings utvider du delen Memory Settings
  • Endre innstillingen for korrigerbar feillogging til Deaktivert
  • Klikk på Bruk-knappen for å lagre minneinnstillingene
  • Ikke glem å velge enten Bruk og start på nytt knappen (for å starte på nytt umiddelbart) eller Ved neste omstart-knappen for å bruke BIOS-endringene .

Eksisterende minnerelaterte artikler og whitepapers oppdateres for å gjenspeile denne anbefalte endringen.
 

Merk: De godkjente kunderettede meldingene er vedlagt som en fil i denne artikkelen - "Managing Correctable Error Notices Dec 2021 v1.pdf."


Denne artikkelen oppdateres etter hvert som ny informasjon blir tilgjengelig.

受影响的产品

Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, PowerEdge XR2, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R840, OEMR R940, OEMR R940xa, Poweredge C4140, PowerEdge C6420, PowerEdge C6520 , PowerEdge C6525, PowerEdge MX740C, PowerEdge MX750c, PowerEdge MX840C, PowerEdge R350, PowerEdge R440, PowerEdge R450, PowerEdge R540, PowerEdge R550, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T340, PowerEdge T350, PowerEdge T360, PowerEdge T440, PowerEdge T550, PowerEdge T560, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE7440, PowerEdge XE8545, PowerEdge XR11, PowerEdge XR12, PowerEdge XR4510c, PowerEdge XR4520c, VxFlex Ready Node R740xd, Dell EMC vSAN R740 Ready Node, Dell EMC vSAN R740xd Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840 ...

产品

Dell EMC XC Series XC6420 Appliance, Dell EMC XC Core 6420 System, Storage Spaces Direct R440 Ready Node, Storage Spaces Direct R640 Ready Node, Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, OEMR R340, OEMR R440 , PowerEdge XR2, OEMR R540, OEMR R640, OEMR XL R640, OEMR R650, OEMR R650xs, OEMR R6515, OEMR R6525, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R750, OEMR R750xa, OEMR R750xs, OEMR R7515, OEMR R7525, OEMR R840, OEMR R940, OEMR R940xa, OEMR T440, OEMR T550, OEMR T640, OEMR XL T640, OEMR XL R340, PowerEdge C6420, PowerEdge C6525, PowerEdge MX740C, PowerEdge MX840C, PowerEdge R340, PowerEdge R540, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T440, PowerEdge T550, PowerEdge T640, PowerFlex appliance R650, PowerFlex appliance R6525, Powerflex appliance R750, PowerFlex custom node R650, PowerFlex custom node R6525, PowerFlex custom node R750, VxFlex Ready Node R640, VxFlex Ready Node R740xd, Dell EMC vSAN R750 Ready Node, Dell EMC vSAN R7515 Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R640, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840, Dell EMC XC Core XC7525 ...
文章属性
文章编号: 000194574
文章类型: Solution
上次修改时间: 07 11月 2025
版本:  5
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。