VxBlock: Förbättrade minnes-RAS-funktioner för Cisco UCS M5-plattformar

Summary: På grund av minnes-DIMM-fel och arkitekturförändringar i minnesfelhanteringen på Intel Xeon skalbara processorer (tidigare kodnamn "Skylake Server") och 2:a generationens Intel Xeon skalbara processorer (tidigare kodnamn "Cascade Lake Server") kan Cisco UCS M5-kunder som upplever minnes-DIMM-fel uppleva en högre frekvens av icke-korrigerbara minnesfel än de upplevde på tidigare generationer med standard SDDC Memory RAS-läge. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Problembeskrivning

Cisco UCS M5-servrar med vissa Intel Xeon skalbara processorer kan uppleva en högre frekvens av icke-korrigerbara minnesfel än tidigare generationer med standardkonfigurationen för Single Device Data Correction (SDDC) för minnestillförlitlighet, tillgänglighet och servicemöjligheter (RAS).


Bakgrund

Intel Xeon skalbara processorer och andra generationens skalbara Xeon processorer implementerade ändringar i SDDC. SDDC är en grundläggande Intel RAS-funktion som finns på alla Cisco-plattformar. Som ett resultat av dessa arkitekturförändringar och fel i minnet med dubbla inline-minnesmoduler (DIMM) finns det en skillnad i vilka fel som korrigeras mellan den föregående processorgenerationen och generationen i Xeon skalbara processorfamiljen.

De senaste förbättringarna av Intels mikrokod och BIOS förbättrar hanteringen av minnesfel genom att aktivera ytterligare minnes-RAS-funktioner, till exempel ADDDC Sparing (Adaptive Double Device Data Correction) och PPR (Post Packet Repair). ADDDC Sparing och PPR är nu standardkonfigurationen för minnes-RAS på Cisco UCS M5-servrar med Intel Xeon skalbara processorer.

Ytterligare information om RAS-minnesfunktioner, till exempel ADDDC och PPR, finns i följande dokument:  Teknisk översikt av Cisco UCS HX M5-minne – RAS-minnesfunktioner.

Release Certification Matrix (RCM) som påverkas

  • RCM-versioner före 7.0.3.0
  • RCM-versioner före 6.7.9.0

RCM-versioner före 6.5.16.0.
 

UCS M5-bladservrar och integrerade UCS M5-rackservrar

Cisco UCS 4.1(1d) eller senare utökar minnesfelstäckningen. Den här versionen och senare versioner innehåller ytterligare RAS-funktioner, ADDDC Sparing (Adaptive Double Device Data Correction) och PPR (Post Package Repair). De är aktiverade och konfigurerade som "Platform Default" för Memory RAS-konfigurationer. I tidigare versioner var RAS-konfigurationen för minne inställd på "Maximal prestanda". Den ursprungliga fasta programvaran som införlivade ADDDC och PPR inkluderade UCS Manager 4.1(1d), men ett fel identifierades i den här versionen som kan påverka flera system, nämligen CSCvr79388. På grund av denna defekt har Cisco ändrat den minsta firmware som krävs. Vi rekommenderar nu att du uppgraderar USC-versionen till 4.1(3b) eller senare, som innehåller korrigeringen för det här felet. UCS 4.1(3b)-versionen finns i RCM-versionerna nedan.


Fristående UCS M5-rack

I Cisco Integrated Manager Controller (IMC) version 4.1(1d) och senare är funktionerna ADDDC Sparing (Adaptive Double Device Data Correction) och PPR (Post Package Repair) tillgängliga. De är aktiverade och konfigurerade som "Platform Default" för Memory RAS-konfigurationer.  I tidigare versioner var RAS-konfigurationen för minne inställd på "Maximal prestanda".  Samma bugg som finns i UCSM version 4.1(1d) påverkar även CIMC 4.1(1d)-versionen. Den ursprungliga CIMC-versionen med korrigeringen, 4.1(3b), ingår i RCM-versionerna nedan.


Nödvändiga BIOS-inställningar

  • För UCS Manager-hanterade servrar med BIOS-POLICYN för RAS-konfigurationen inställd på "Platform Default" krävs inga ändringar för att ADDDC Sparing ska börja gälla.
  • För UCS Manager-hanterade servrar med BIOS-POLICYN för RAS-konfiguration INTE inställd på "Platform Default" måste policyn ändras till ADDDC Sparing (eller Platform Default) för att dra nytta av ADDDC.
  • För fristående servrar (som inte hanteras av UCS Manager) krävs inga ändringar för att ADDDC Sparing ska börja gälla.


Release Certification Matrix (RCM) inklusive korrigering för version 4.1(3b)

  • RCM version 7.0.3.0 och senare för följande system
    • VxBlock 340, 350, 540, 540-40G, 740 och 1000
    • Tekniskt tillägg för beräkning
  • RCM version 6.7.9.0 och senare för följande system
    • Vblock 240, 340, 350, 540 och 740
    • VxBlock 240, 340, 350, 540, 540-40G, 740 och 1000
    • Tekniskt tillägg för beräkning
  • RCM version 6.5.16.0 och senare för följande system
    • Vblock 240, 340, 350, 540 och 740
    • VxBlock 240, 340, 350, 540, 740 och 1000

*Not* RCM-versionsnumren kan variera för olika VxBlock-system. Kontrollera RCM-versionen innan du uppgraderar VxBlock-systemet för att säkerställa korrekt kodefterlevnad. 

VIKTIGT! Uppgradera endast om det påverkas direkt av problemet!

Mer information om problemet som beskrivs i den här artikeln finns i Ciscos fältmeddelande: Fältmeddelande: FN - 70432
Fel-ID CSCvq38078


Se den här videon för mer information:

Affected Products

VxBlock and vBlock Systems Series
Article Properties
Article Number: 000191333
Article Type: How To
Last Modified: 19 تشرين الثاني 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.