VxBlock: Funzionalità RAS della memoria migliorate per le piattaforme Cisco UCS M5
Summary: A causa di errori DIMM di memoria e modifiche architetturali nella gestione degli errori di memoria sui processori scalabili Intel Xeon (in precedenza denominati in codice "Skylake Server") e sui processori scalabili Intel Xeon di seconda generazione (in precedenza noti con nome in codice "Cascade Lake Server"), i clienti Cisco UCS M5 che riscontrano errori di memoria DIMM di memoria potrebbero riscontrare una frequenza più elevata di errori di memoria non correggibili in fase di esecuzione rispetto alle generazioni precedenti con la modalità RAS della memoria SDDC predefinita. ...
Instructions
Descrizione del problema
I server Cisco UCS M5 con determinati processori scalabili Intel Xeon potrebbero riscontrare un tasso più elevato di errori di memoria non correggibili in fase di esecuzione rispetto alle generazioni precedenti con la configurazione RAS (Single Device Data Correction) Memory Reliability, Availability, and Serviceability (RAS) predefinita.
Informazioni preliminari
I processori scalabili Intel Xeon e Xeon scalabili di seconda generazione hanno implementato modifiche in SDDC. SDDC è una funzionalità fondamentale di Intel RAS disponibile su tutte le piattaforme Cisco. Come risultato di queste modifiche architetturali e degli errori del modulo DIMM (Dual Inline Memory Module) di memoria, si verifica una differenza nel modo in cui gli errori verranno corretti tra la generazione precedente di processori e la generazione della famiglia di processori scalabili Xeon.
I più recenti miglioramenti del BIOS e del microcodice Intel migliorano la gestione degli errori della memoria abilitando funzionalità RAS di memoria aggiuntive come Adaptive Double Device Data Correction (ADDDC Sparing) e Post Packet Repair (PPR). ADDDC Sparing e PPR sono ora la configurazione RAS di memoria predefinita sui server Cisco UCS M5 con processori scalabili Intel Xeon.
Ulteriori informazioni sulle funzionalità RAS della memoria, ad esempio ADDDC e PPR, sono disponibili nel seguente documento: Panoramica tecnica della memoria Cisco UCS HX M5 - Funzioni RAS della memoria.
Release Certification Matrix (RCM) interessata
- Versioni RCM precedenti alla 7.0.3.0
- Versioni RCM precedenti alla 6.7.9.0
Versioni RCM precedenti alla 6.5.16.0.
Blade UCS M5 e server rack UCS M5 integrati
Cisco UCS 4.1(1d) o versione successiva espande la copertura dei guasti di memoria. Questa versione e le versioni successive includono funzionalità RAS aggiuntive, Adaptive Double Device Data Correction (ADDDC Sparing) e Post Package Repair (PPR). Sono abilitate e configurate come "Platform Default" per le configurazioni RAS di memoria. Nelle versioni precedenti la configurazione RAS della memoria era impostata su "Massime prestazioni". Il firmware originale che incorporava ADDDC e PPR includeva UCS Manager 4.1(1d), tuttavia è stato identificato un difetto in questa versione che potrebbe influire su più sistemi, vale a dire CSCvr79388. A causa di questo difetto, Cisco ha modificato il firmware minimo richiesto. Si consiglia ora di aggiornare la versione USC alla 4.1(3b) o successiva che include la correzione di questo difetto. La versione UCS 4.1(3b) è nelle versioni RCM riportate di seguito.
Rack UCS M5 standalone
Nelle release 4.1(1d) di Cisco Integrated Manager Controller (IMC) e successive, sono disponibili le funzioni ADDDC (Adaptive Double Device Data Correction) e Post Package Repair (PPR). Sono abilitate e configurate come "Platform Default" per le configurazioni RAS di memoria. Nelle versioni precedenti la configurazione RAS della memoria era impostata su "Massime prestazioni". Lo stesso bug riscontrato in UCSM versione 4.1(1d) influisce anche sulla versione CIMC 4.1(1d). La versione iniziale di CIMC con la correzione, 4.1(3b), è inclusa nelle versioni di RCM elencate di seguito.
Impostazioni del BIOS richieste
- Per i server gestiti da UCS Manager con BIOS POLICY per la configurazione RAS impostata su "Platform Default", non sono necessarie modifiche per rendere effettiva la riserva di ADDDC.
- Per i server gestiti da UCS Manager con BIOS POLICY for RAS configuration NON impostata su "Platform Default", la policy deve essere modificata in ADDDC Sparing (o Platform Default) per sfruttare i vantaggi di ADDDC.
- Per i server standalone (gestiti da non UCS Manager), non sono necessarie modifiche per rendere effettiva la riserva di ADDDC.
Release Certification Matrix (RCM), inclusa la correzione per la versione 4.1(3b)
- RCM versione 7.0.3.0 e successive per i seguenti sistemi
- VxBlock 340, 350, 540, 540-40G, 740 e 1000
- Estensione tecnica per l'elaborazione
- RCM versione 6.7.9.0 e successive per i seguenti sistemi
- Vblock 240, 340, 350, 540 e 740
- VxBlock 240, 340, 350, 540, 540-40G, 740 e 1000
- Estensione tecnica per l'elaborazione
- RCM versione 6.5.16.0 e successive per i seguenti sistemi
- Vblock 240, 340, 350, 540 e 740
- VxBlock 240, 340, 350, 540, 740 e 1000
*Nota* I numeri di release di RCM possono variare in base al sistema VxBlock. Fare riferimento alla versione di RCM prima di aggiornare il sistema VxBlock per verificare la corretta conformità del codice.
IMPORTANTE. Eseguire l'upgrade solo se direttamente interessato dal problema menzionato.
Per ulteriori dettagli sul problema descritto in questo articolo, fare riferimento a Cisco Field Notice: Avviso sul campo: FN - 70432
ID difetto CSCvq38078
Per ulteriori informazioni, guardare questo video: