VxBlock: Verbeterde geheugen-RAS-functies voor Cisco UCS M5-platforms
Summary: Als gevolg van geheugen-DIMM-fouten en architecturale veranderingen in de verwerking van geheugenfouten op Intel Xeon schaalbare processors (voorheen codenaam "Skylake Server") en 2e generatie Intel Xeon schaalbare processors (voorheen codenaam "Cascade Lake Server"), kunnen Cisco UCS M5-klanten die geheugen-DIMM-fouten ervaren, een hogere frequentie van runtime-niet-corrigeerbare geheugenfouten ervaren dan op eerdere generaties met standaard SDDC-geheugen-RAS-modus. ...
Instructions
Probleembeschrijving
Cisco UCS M5-servers met bepaalde Intel Xeon schaalbare processors kunnen vaker runtime-onherstelbare geheugenfouten ervaren dan eerdere generaties met de standaard Single Device Data Correction (SDDC) Memory Reliability, Availability, and Serviceability (RAS)-configuratie.
Achtergrond
Intel Xeon schaalbare processors en 2e generatie Xeon schaalbare processors hebben wijzigingen doorgevoerd in SDDC. SDDC is een fundamentele Intel RAS-functie die beschikbaar is op alle Cisco-platforms. Als gevolg van deze architecturale wijzigingen en fouten met de Dual Inline Memory Module (DIMM) van het geheugen, is er een verschil in welke fouten worden gecorrigeerd tussen de vorige generatie processors en de generatie van de Xeon schaalbare processorreeks.
De nieuwste microcode- en BIOS-verbeteringen van Intel verbeteren het beheer van geheugenfouten door extra Memory RAS-functies mogelijk te maken, zoals Adaptive Double Device Data Correction (ADDDC Sparing) en Post Packet Repair (PPR). ADDDC Sparing en PPR zijn nu de standaard RAS-geheugenconfiguratie op Cisco UCS M5-servers met Intel Xeon schaalbare processors.
Aanvullende informatie over RAS-functies van geheugen, zoals ADDDC en PPR, vindt u in het volgende document: Technisch overzicht Cisco UCS HX M5 geheugen - RAS-functies van geheugen.
Gevolgen voor Release Certification Matrix (RCM)
- RCM-releases vóór 7.0.3.0
- RCM-releases vóór 6.7.9.0
RCM-releases vóór 6.5.16.0.
UCS M5-blades en geïntegreerde UCS M5-rackservers
Cisco UCS 4.1(1d) of hoger breidt de dekking van geheugenfouten uit. Deze release en latere versies bevatten extra RAS-functies, Adaptive Double Device Data Correction (ADDDC Sparing) en Post Package Repair (PPR). Ze zijn ingeschakeld en geconfigureerd als "Platform Default" voor geheugen-RAS-configuraties. Bij eerdere releases was de Memory RAS-configuratie ingesteld op Maximum Performance. De oorspronkelijke firmware die ADDDC en PPR bevatte, bevatte UCS Manager 4.1 (1d), maar er werd een defect geïdentificeerd in deze versie die van invloed kan zijn op meerdere systemen, namelijk CSCvr79388. Vanwege dit defect heeft Cisco de minimaal vereiste firmware gewijzigd. Het wordt nu aanbevolen om de USC-versie te upgraden naar 4.1(3b) of hoger, waarin de oplossing voor dit probleem is opgenomen. De UCS 4.1(3b)-release is in de onderstaande RCM-versies.
Standalone UCS M5-racks
In Cisco Integrated Manager Controller (IMC) release 4.1 (1d) en hoger zijn de functies Adaptive Double Device Data Correction (ADDDC Sparing) en Post Package Repair (PPR) beschikbaar. Ze zijn ingeschakeld en geconfigureerd als "Platform Default" voor geheugen-RAS-configuraties. Bij eerdere releases was de Memory RAS-configuratie ingesteld op Maximum Performance. Dezelfde bug die wordt aangetroffen in de UCSM-versie 4.1 (1d) is ook van invloed op de CIMC 4.1 (1d)-versie. De eerste CIMC-versie met de oplossing, 4.1(3b), is opgenomen in de onderstaande RCM-releases.
Vereiste BIOS-instellingen
- Voor door UCS Manager beheerde servers met het BIOS-BELEID voor RAS-configuratie ingesteld op "Platform Default", zijn er geen wijzigingen vereist om ADDDC Sparing van kracht te laten worden.
- Voor door UCS Manager beheerde servers met het BIOS-BELEID voor RAS-configuratie NIET ingesteld op "Platform Default", moet het beleid worden gewijzigd in ADDDC Sparing (of Platform Default) om te profiteren van ADDDC.
- Voor standalone (niet door UCS Manager beheerde) servers zijn er geen wijzigingen vereist om ADDDC Sparing van kracht te laten worden.
Release Certification Matrix (RCM) inclusief oplossing voor release 4.1(3b)
- RCM release 7.0.3.0 en hoger voor de volgende systemen
- VxBlock 340, 350, 540, 540-40G, 740 en 1000
- Tech Extension for Compute
- RCM release 6.7.9.0 en hoger voor de volgende systemen
- Vblock 240, 340, 350, 540 en 740
- VxBlock 240, 340, 350, 540, 540-40G, 740 en 1000
- Tech Extension for Compute
- RCM release 6.5.16.0 en hoger voor de volgende systemen
- Vblock 240, 340, 350, 540 en 740
- VxBlock 240, 340, 350, 540, 740 en 1000
*Notitie* RCM-releasenummers kunnen per VxBlock systeem verschillen. Raadpleeg de RCM-versie voordat u uw VxBlock-systeem upgradet om er zeker van te zijn dat u aan de juiste naleving van de code voldoet.
BELANGRIJK: Voer alleen een upgrade uit als u direct last hebt van het genoemde probleem!
Voor meer informatie over het probleem dat in dit artikel wordt beschreven, raadpleegt u Cisco Field Notice: Kennisgeving in het veld: FN - 70432
Defect-ID CSCvq38078
Bekijk deze video voor meer informatie: