PowerEdge 14G Intel- ja 15G-palvelimet: Korjattavissa olevien virhekynnystapahtumien hallinta

摘要: Artikkeli sisältää päivitettyjä suosituksia korjattavissa olevien virhekynnystapahtumien (MEM0802 tai MEM5104) hallintaan DDR4 RDIMM- tai LRDIMM-moduuleissa, jotka on asennettu Intelin 14G- ja 15G-pohjaisiin PowerEdge- sekä AMD-pohjaisiin 15G PowerEdge -palvelimiin. ...

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

Huomautus: Tämä artikkeli ei koske 14G AMD -pohjaisia PowerEdge-palvelimia, kuten 64x5- tai 74x5-ympäristöjä, koska niissä ei ole tätä Post Package Repair -toimintoa, vaikka DIMM-kampa itsessään tukee sitä.

Yritysluokan muistin luotettavuus-, käytettävyys- ja huollettavuusominaisuuksien (RAS) kehittymisen ansiosta Dell on omaksunut konservatiivisen lähestymistavan tarjotakseen läpinäkyvyyttä asiakkailleen. Tämän kehityksen jatkuessa myös Dellin lähestymistapa virheiden raportointiin muuttuu siten, että se pystyy keskittymään ilmoituksiin, jotka edellyttävät kiireellisempiä vastauksia kuin ilmoituksiin, jotka ovat luonteeltaan ensisijaisesti informatiivisia.

Koska DRAM-pohjaiset muistigeometriat kutistuvat edelleen, mikä tarjoaa asiakkaille heidän tarvitsemansa paremman suorituskyvyn, yhä enemmän korjattavissa olevia virheitä odotetaan olevan luonnollinen osa yhtenäistä skaalausta.

原因

Maailmanlaajuisella palvelinalalla ollaan yhä yhtä mieltä siitä, että jotkin DIMM-moduulikohtaiset korjattavissa olevat virheet ovat väistämättömiä eivätkä oikeuta muistimoduulin vaihtamiseen tai edes välittömään uudelleenkäynnistykseen, jolloin automaattinen uudelleenasennus käynnistyy.

解决方案

Korjattavissa olevista virheistä ilmoittavan järjestelmän käytön jatkaminen ilman uudelleenkäynnistystä tai itsekorjausta ei lisää korjauskelvottomien virheiden riskiä, jotka voivat johtaa suunnittelemattomiin käyttökatkoksiin. Muut alan toimijat ovat julkisesti ilmoittaneet, että heidän muistinkäsittelynsä ei ilmoita korjattavissa olevista virheistä.

14G Intel PowerEdge BIOS -versioon 2.5.4 ja uudempiin lisättiin BIOS-asetus nimeltä "Correctable Error Logging", jotta asiakkaat voivat halutessaan poistaa korjattavissa olevien virheiden raportoinnin käytöstä, kuten monet ovat tehneet. BIOS ajoittaa korjattavissa olevien kynnystapahtumien automaattisen uudelleenasennuksen myös ilman kirjaamista. Tämä ajoitettu automaattinen uudelleenasennus tapahtuu automaattisesti seuraavan järjestelmän uudelleenkäynnistyksen yhteydessä.

Dell PowerEdgen BIOS-päivityksissä muutetaan maaliskuussa 2022 voimaan tulevan Correctable Error Logging -BIOS-asetuksen niin, että Correctable Error Logging -asetus on oletusarvoisesti poissa käytöstä. Tämä BIOS-vaihtoehto voidaan ottaa uudelleen käyttöön, kun asiakkaat haluavat nähdä korjattavissa olevat muistin kynnysarvotapahtumat. Tämä BIOS-asetusten muutos sisältää seuraavat BIOS-versiot:

  • 14G-Intel-alustat – BIOS-versio 2.13.3 tai uudempi
  • 15G AMD -alustat – BIOS-versio 2.6.5 tai uudempi
  • 15G-Intel-alustat – BIOS-versio 1.5.5 tai uudempi.

DDR4 DIMM -muistimoduulin itsekorjauksen edut järjestelmän uudelleenkäynnistyksellä:

  • Se mahdollistaa DDR4 DIMM -moduulin korjauksen poistamatta sitä järjestelmästä. Kaikki Delliltä peräisin olevat DDR4 DIMM -moduulit tukevat muistin itsekorjausominaisuutta.
 
Huomautus: 14G AMD PowerEdge -palvelimissa ei ole tätä automaattista uudelleenasennusmahdollisuutta.
 
  • Käyttää DRAM-muistiin suunniteltuja käytettävissä olevia vararivejä, joissa huono rivi korvataan pysyvästi hyväksi tiedetyllä rivillä sähköisellä sulakkeella.
  • Seuraava muistin uudelleenkoulutus optimoi "datasilmät" kalibroimalla keskipisteet uudelleen varmistaakseen, että muistiväylä toimii korkeimmalla signaloinnin eheyden tasolla.

Jos muistin kynnystapahtumat ovat korjattavissa ja BIOS Correctable Error Logging -asetus on käytössä, Dell Technologies suosittelee muistin kynnysarvon tapahtumien tapauksessa uudelleenkäynnistystä asiakkaan normaalin ylläpitoaikataulun mukaisesti, jotta ajoitettu muisti voidaan asentaa uudelleen tai korjata automaattisesti. Uudelleenkäynnistyksen jälkeen siihen liittyvien DIMM-moduulien onnistunut tai epäonnistunut automaattinen uudelleenasennus kirjataan.

Kun BIOSin Correctable Error Logging -asetus on disable, Dell Technologies suosittelee uudelleenkäynnistystä asiakkaan normaalin ylläpitoaikataulun mukaisesti. Uudelleenkäynnistyksen yhteydessä ajoitetut automaattiset uudelleenasennustoiminnot suoritetaan automaattisesti. Järjestelmä kirjaa tapahtuman (MEM0805- tai MEM7114-tyyppiset tapahtumat), jos automaattinen uudelleenasennus tai itsekorjaus epäonnistui, ja suosittelee lisäksi viallisen DIMM-moduulin fyysistä vaihtamista.

Suositus:
Dell Memory Engineering suosittelee, että PowerEdge Server -asiakkaat, jotka käyttävät vanhempia BIOS-versioita (ennen maaliskuun lohkoa 2022 koskevia julkaisuja), ottavat käyttöön Correctable Error Logging -asetuksen muuttamisen pois käytöstä. Tämä eliminoi satunnaiset korjattavissa olevat muistikynnystapahtumat (kuten MEM0802- tai MEM5104 tyyppiset tapahtumat) koko palvelininfrastruktuurissa, jotka suosittelevat palvelimen uudelleenkäynnistystä automaattisen uudelleenasennuksen tai itsekorjauksen mahdollistamiseksi. Kuten edellä mainittiin, kaikki ajoitetut automaattiset uudelleenasennus- tai itsekorjaustoiminnot suoritetaan automaattisesti, kun palvelin käynnistetään uudelleen ja mahdollisista virheistä ilmoitetaan.

BIOSin Correctable Error Logging -asetusta voi muuttaa joko käynnistämällä palvelimen uudelleen F2-asetuksiin tai käyttämällä iDRAC WebUI -käyttöliittymää.

BIOS-asetuksen muuttaminen F2-järjestelmäasetuksista:

  • Käynnistä palvelimet uudelleen pysähtyen F2-asetuksiin
  • Muuta BIOS-asetusten>Muistiasetukset-valinnallaCorrectable Error Logging -kohdan arvoksi Disabled.
  • Tallenna BIOS-asetukset ja poistu F2-asetuksista

BIOS-asetuksen muuttaminen iDRAC-verkkokäyttöliittymässä:

  • Kirjaudu iDRAC-verkkokäyttöliittymään
  • Laajenna Configuration >BIOS Settings -kohdassa Memory Settings -kohta
  • Vaihda Korjattavissa olevien virheiden kirjaus -asetukseksi Ei käytössä
  • Tallenna muistiasetukset napsauttamalla Käytä-painiketta
  • Älä unohda ottaa BIOS-muutokset käyttöön valitsemalla joko Käytä ja käynnistä uudelleen-painiketta (käynnistääksesi uudelleen välittömästi) tai Seuraavassa uudelleenkäynnistyksessä -painiketta .

Olemassa olevat muistiin liittyvät artikkelit ja tekniset raportit päivitetään vastaamaan tätä suositeltua muutosta.
 

Huomautus: Hyväksytty asiakasviestintä on liitetty tiedostona tähän artikkeliin - "Managing Correctable Error Notices Dec 2021 v1.pdf.


Tätä artikkelia päivitetään, kun uutta tietoa tulee saataville.

受影响的产品

Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, PowerEdge XR2, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R840, OEMR R940, OEMR R940xa, Poweredge C4140, PowerEdge C6420, PowerEdge C6520 , PowerEdge C6525, PowerEdge MX740C, PowerEdge MX750c, PowerEdge MX840C, PowerEdge R350, PowerEdge R440, PowerEdge R450, PowerEdge R540, PowerEdge R550, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T340, PowerEdge T350, PowerEdge T360, PowerEdge T440, PowerEdge T550, PowerEdge T560, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE7440, PowerEdge XE8545, PowerEdge XR11, PowerEdge XR12, PowerEdge XR4510c, PowerEdge XR4520c, VxFlex Ready Node R740xd, Dell EMC vSAN R740 Ready Node, Dell EMC vSAN R740xd Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840 ...

产品

Dell EMC XC Series XC6420 Appliance, Dell EMC XC Core 6420 System, Storage Spaces Direct R440 Ready Node, Storage Spaces Direct R640 Ready Node, Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, OEMR R340, OEMR R440 , PowerEdge XR2, OEMR R540, OEMR R640, OEMR XL R640, OEMR R650, OEMR R650xs, OEMR R6515, OEMR R6525, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R750, OEMR R750xa, OEMR R750xs, OEMR R7515, OEMR R7525, OEMR R840, OEMR R940, OEMR R940xa, OEMR T440, OEMR T550, OEMR T640, OEMR XL T640, OEMR XL R340, PowerEdge C6420, PowerEdge C6525, PowerEdge MX740C, PowerEdge MX840C, PowerEdge R340, PowerEdge R540, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T440, PowerEdge T550, PowerEdge T640, PowerFlex appliance R650, PowerFlex appliance R6525, Powerflex appliance R750, PowerFlex custom node R650, PowerFlex custom node R6525, PowerFlex custom node R750, VxFlex Ready Node R640, VxFlex Ready Node R740xd, Dell EMC vSAN R750 Ready Node, Dell EMC vSAN R7515 Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R640, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840, Dell EMC XC Core XC7525 ...
文章属性
文章编号: 000194574
文章类型: Solution
上次修改时间: 07 11月 2025
版本:  5
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。