VxBlock: Verbesserte Arbeitsspeicher-RAS-Funktionen für Cisco UCS M5-Plattformen
Summary: Aufgrund von Speicher-DIMM-Fehlern und Architekturänderungen bei der Behandlung von Speicherfehlern auf skalierbaren Intel Xeon Prozessoren (ehemals Codename "Skylake Server") und skalierbaren Intel Xeon Prozessoren der 2. Generation (früher Codename "Cascade Lake Server") treten bei Cisco UCS M5-Kunden, bei denen DIMM-Speicherfehler auftreten, möglicherweise eine höhere Rate nicht korrigierbarer Speicherfehler zur Laufzeit auf als bei früheren Generationen mit dem standardmäßigen SDDC Memory RAS-Modus. ...
Instructions
Problembeschreibung
Cisco UCS M5-Server mit bestimmten skalierbaren Intel Xeon Prozessoren weisen möglicherweise eine höhere Rate an nicht korrigierbaren Speicherfehlern zur Laufzeit auf als frühere Generationen mit der standardmäßigen SDDC-Speicherzuverlässigkeit, -verfügbarkeit und -betriebsfähigkeit (Single Device Data Correction, SDDC)-Speicherzuverlässigkeit, Verfügbarkeit und Betriebsfähigkeit (RAS).
Hintergrund
Bei den skalierbaren Intel Xeon Prozessoren und den skalierbaren Xeon Prozessoren der 2. Generation wurden Änderungen in SDDC implementiert. SDDC ist eine grundlegende Intel RAS-Funktion, die auf allen Cisco-Plattformen verfügbar ist. Aufgrund dieser Architekturänderungen und DIMM-Speicherfehler (Dual Inline Memory Module) gibt es einen Unterschied darin, welche Fehler zwischen der vorherigen Generation von Prozessoren und der skalierbaren Xeon-Prozessorgeneration behoben werden.
Die neuesten Intel Microcode- und BIOS-Verbesserungen verbessern das Management von Arbeitsspeicherfehlern, indem zusätzliche Speicher-RAS-Funktionen wie Adaptive Double Device Data Correction (ADDDC-Sparing) und Post Packet Repair (PPR) aktiviert werden. ADDDC-Sparing und PPR sind jetzt die Standard-Speicher-RAS-Konfiguration auf Cisco UCS M5-Servern mit skalierbaren Intel Xeon Prozessoren.
Weitere Informationen zu Arbeitsspeicher-RAS-Funktionen wie ADDDC und PPR finden Sie im folgenden Dokument: Cisco UCS HX M5-Arbeitsspeicher – Technische Übersicht – Speicher-RAS-Funktionen.
Release Certification Matrix (RCM) betroffen
- RCM-Versionen vor 7.0.3.0
- RCM-Versionen vor 6.7.9.0
RCM-Versionen vor 6.5.16.0.
UCS M5 Blades und integrierte UCS M5 Rack-Server
Cisco UCS 4.1(1d) oder höher erweitert die Abdeckung von Speicherfehlern. Diese Version und spätere Versionen enthalten zusätzliche RAS-Funktionen, Adaptive Double Device Data Correction (ADDDC-Sparing) und Post Package Repair (PPR). Sie sind aktiviert und als "Plattformstandard" für Speicher-RAS-Konfigurationen konfiguriert. In früheren Versionen war die Speicher-RAS-Konfiguration auf "Maximale Leistung" eingestellt. Die ursprüngliche Firmware, die ADDDC und PPR enthielt, enthielt UCS Manager 4.1(1d). In dieser Version wurde jedoch ein Fehler identifiziert, der mehrere Systeme betreffen kann, nämlich CSCvr79388. Aufgrund dieses Fehlers hat Cisco die minimal erforderliche Firmware geändert. Es wird jetzt empfohlen, die USC-Version auf 4.1(3b) oder höher zu aktualisieren, die die Korrektur für diesen Fehler enthält. Die Version UCS 4.1(3b) ist in den folgenden RCM-Versionen enthalten.
Eigenständige UCS M5-Racks
In Cisco Integrated Manager Controller (IMC) Version 4.1 (1d) und höher sind die Funktionen Adaptive Double Device Data Correction (ADDDC Sparing) und Post Package Repair (PPR) verfügbar. Sie sind aktiviert und als "Plattformstandard" für Speicher-RAS-Konfigurationen konfiguriert. In früheren Versionen war die Speicher-RAS-Konfiguration auf "Maximale Leistung" eingestellt. Derselbe Fehler, der in der UCSM-Version 4.1(1d) gefunden wurde, betrifft auch die CIMC 4.1(1d)-Version. Die erste CIMC-Version mit der Korrektur, 4.1(3b), ist in den unten aufgeführten RCM-Versionen enthalten.
Erforderliche BIOS-Einstellungen
- Für von UCS Manager verwaltete Server, bei denen die BIOS-POLICY für die RAS-Konfiguration auf "Plattformstandard" festgelegt ist, sind keine Änderungen erforderlich, damit das ADDDC-Sparing wirksam wird.
- Bei von UCS Manager verwalteten Servern, bei denen die BIOS-POLICY für RAS-Konfiguration NICHT auf "Platform Default" festgelegt ist, muss die Policy zu "ADDDC Sparing" (oder "Platform Default") geändert werden, um die Vorteile von ADDDC zu nutzen.
- Bei eigenständigen (nicht von UCS Manager verwalteten) Servern sind keine Änderungen erforderlich, damit das ADDDC-Sparing wirksam wird.
Release Certification Matrix (RCM) einschließlich Korrektur für Version 4.1(3b)
- RCM-Version 7.0.3.0 und höher für die folgenden Systeme
- VxBlock 340, 350, 540, 540-40G, 740 und 1000
- Tech Extension for Compute
- RCM-Version 6.7.9.0 und höher für die folgenden Systeme
- Vblock 240, 340, 350, 540 und 740
- VxBlock 240, 340, 350, 540, 540-40G, 740 und 1000
- Tech Extension for Compute
- RCM-Version 6.5.16.0 und höher für die folgenden Systeme
- Vblock 240, 340, 350, 540 und 740
- VxBlock 240, 340, 350, 540, 740 und 1000
*Anmerkung* RCM-Versionsnummern können je nach VxBlock-System unterschiedlich sein. Referenzieren Sie die RCM-Version vor dem Upgrade Ihres VxBlock-Systems, um eine ordnungsgemäße Codecompliance sicherzustellen.
WICHTIG! Aktualisieren Sie nur, wenn Sie direkt von dem genannten Problem betroffen sind!
Weitere Informationen zu dem in diesem Artikel beschriebenen Problem finden Sie unter Cisco Field Notice: Feldhinweis: FN - 70432
Fehler-ID CSCvq38078
Weitere Informationen finden Sie in diesem Video: