VxBlock: Forbedrede Memory RAS-funktioner til Cisco UCS M5-platforme
Summary: På grund af hukommelses-DIMM-fejl og arkitektoniske ændringer i håndtering af hukommelsesfejl på skalerbare Intel Xeon-processorer (tidligere kodenavnet "Skylake Server") og 2. generations skalerbare Intel Xeon-processorer (tidligere kodenavnet "Cascade Lake Server") kan Cisco UCS M5-kunder, der oplever DIMM-hukommelseshukommelsesfejl, opleve en højere hastighed af runtime-hukommelsesfejl, end de oplevede på tidligere generationer med standard SDDC Memory RAS-tilstand. ...
Instructions
Problembeskrivelse
Cisco UCS M5-servere med visse skalerbare Intel Xeon-processorer kan opleve en højere driftstid for hukommelsesfejl, der ikke kan rettes, end tidligere generationer med standardkonfigurationen af Single Device Data Correction (SDDC) Memory Reliability, Availability, and Serviceability (RAS).
Baggrund
Skalerbare Intel Xeon-processorer og 2. generations skalerbare Xeon-processorer implementerede ændringer i SDDC. SDDC er en grundlæggende Intel RAS-funktion, der er tilgængelig på alle Cisco-platforme. Som et resultat af disse arkitekturændringer og hukommelsesdobbelte DIMM-fejl (inline memory module) er der forskel på, hvilke fejl der rettes mellem den forrige generation af processorer og Xeon Scalable-processorserien.
De seneste Intel-mikrokode- og BIOS-forbedringer forbedrer styringen af hukommelsesfejl ved at aktivere yderligere Memory RAS-funktioner såsom Adaptive Double Device Data Correction (ADDDC Sparing) og Post Packet Repair (PPR). ADDDC Sparing og PPR er nu standard Memory RAS-konfigurationen på Cisco UCS M5-servere med skalerbare Intel Xeon-processorer.
Yderligere oplysninger om RAS-hukommelsesfunktioner, f.eks. ADDDC og PPR, kan findes i følgende dokument: Cisco UCS HX M5-hukommelse Teknisk oversigt – Memory RAS-funktioner.
Berørt Release Certification Matrix (RCM)
- RCM-udgivelser før 7.0.3.0
- RCM-udgivelser før 6.7.9.0
RCM-versioner før 6.5.16.0.
UCS M5-blades og integrerede UCS M5-rackservere
Cisco UCS 4.1 (1d) eller nyere udvider dækningen af hukommelsesfejl. Denne udgivelse og senere versioner indeholder yderligere RAS-funktioner, adaptiv dobbelt enhedsdatakorrektion (ADDDC Sparing) og PPR (Post Package Repair). De er aktiveret og konfigureret som "Platform Default" for Memory RAS-konfigurationer. Tidligere versioner havde Memory RAS-konfiguration indstillet til "Maksimal ydeevne". Den originale firmware, der inkorporerede ADDDC og PPR, omfattede UCS Manager 4.1 (1d), men der blev identificeret en fejl i denne version, der kan påvirke flere systemer, nemlig CSCvr79388. På grund af denne defekt har Cisco ændret minimumskravet til firmware. Det anbefales nu at opgradere USC-versionen til 4.1(3b) eller nyere, som indeholder rettelsen af denne fejl. UCS 4.1(3b)-udgivelsen findes i RCM-versionerne nedenfor.
Standalone UCS M5-racks
I Cisco Integrated Manager Controller (IMC) version 4.1(1d) og nyere er funktionerne Adaptive Double Device Data Correction (ADDDC Sparing) og PPR (Post Package Repair) tilgængelige. De er aktiveret og konfigureret som "Platform Default" for Memory RAS-konfigurationer. Tidligere versioner havde Memory RAS-konfiguration indstillet til "Maksimal ydeevne". Den samme fejl fundet i UCSM version 4.1 (1d) påvirker også CIMC 4.1 (1d) versionen. Den oprindelige CIMC-version med rettelsen, 4.1(3b), er inkluderet i RCM-udgivelserne nedenfor.
Påkrævede BIOS-indstillinger
- For UCS Manager-administrerede servere med BIOS-POLICY for RAS-konfiguration indstillet til "Platform Default", kræves der ingen ændringer, for at ADDDC Sparing kan træde i kraft.
- For UCS Manager-administrerede servere, hvor BIOS-POLICY for RAS-konfiguration IKKE er indstillet til "Platform Default", skal politikken ændres til ADDDC Sparing (eller Platform Default) for at drage fordel af ADDDC.
- For enkeltstående (ikke-UCS Manager-administrerede) servere kræves der ingen ændringer, for at ADDDC Sparing kan træde i kraft.
Release Certification Matrix (RCM), herunder rettelse til version 4.1(3b)
- RCM-version 7.0.3.0 og nyere til følgende systemer
- VxBlock 340, 350, 540, 540-40G, 740 og 1000
- Teknisk udvidelse til beregning
- RCM-version 6.7.9.0 og nyere til følgende systemer
- Vblock 240, 340, 350, 540 og 740
- VxBlock 240, 340, 350, 540, 540-40G, 740 og 1000
- Teknisk udvidelse til beregning
- RCM-version 6.5.16.0 og nyere til følgende systemer
- Vblock 240, 340, 350, 540 og 740
- VxBlock 240, 340, 350, 540, 740 og 1000
*Seddel* RCM-frigivelsesnumrene kan variere afhængigt af VxBlock-systemet. Se RCM-versionen, før du opgraderer dit VxBlock-system for at sikre korrekt kodeoverholdelse.
VIGTIGT! Opgrader kun, hvis du er direkte berørt af det nævnte problem!
Du kan finde yderligere oplysninger om det problem, der er beskrevet i denne artikel, i Cisco-feltmeddelelse: Feltmeddelelse: FN - 70432
Defekt-id CSCvq38078
Se denne video for at få flere oplysninger: