System VxBlock: Ulepszono funkcje pamięci RAS dla platform Cisco UCS M5

Summary: Ze względu na błędy pamięci DIMM i zmiany w architekturze w obsłudze błędów pamięci w procesorach Intel Xeon Scalable (wcześniej pod nazwą kodową "Skylake Server") i Intel Xeon Scalable drugiej generacji (wcześniej pod nazwą kodową "Cascade Lake Server"), klienci Cisco UCS M5, u których wystąpiły błędy pamięci DIMM, mogą doświadczać większej liczby niemożliwych do skorygowania błędów pamięci w czasie uruchomienia niż w poprzednich generacjach z domyślnym trybem RAS pamięci SDDC. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Opis problemu

Serwery Cisco UCS M5 z niektórymi skalowalnymi procesorami Intel Xeon mogą doświadczać większej liczby nienaprawialnych błędów pamięci w czasie uruchomienia niż poprzednie generacje w przypadku domyślnej konfiguracji RAS (Memory Reliability, Availability, and Serviceability Reliability Single Device Correction, SDDC).


Tło

W przypadku procesorów Intel Xeon Scalable i Xeon Scalable drugiej generacji wprowadzono zmiany w SDDC. SDDC to podstawowa funkcja Intel RAS dostępna na wszystkich platformach Cisco. W wyniku tych zmian architektury i błędów modułów pamięci DIMM (Memory Dual Inline Memory Module) istnieje różnica w tym, które błędy będą korygowane między poprzednią generacją procesorów a generacją procesorów Xeon Scalable.

Najnowsze udoskonalenia mikrokodu Intel i systemu BIOS usprawniają zarządzanie błędami pamięci, umożliwiając korzystanie z dodatkowych funkcji RAS pamięci, takich jak adaptacyjna korekcja danych podwójnego urządzenia (ADDDC Sparing) i naprawa pakietów (PPR). Oszczędzanie ADDDC i PPR są teraz domyślną konfiguracją RAS pamięci na serwerach Cisco UCS M5 ze skalowalnymi procesorami Intel Xeon.

Dodatkowe informacje na temat funkcji RAS pamięci, takich jak ADDDC i PPR, można znaleźć w następującym dokumencie:  Omówienie techniczne pamięci Cisco UCS HX M5 — funkcje pamięci RAS.

Macierz certyfikacji wydania (RCM), której dotyczy problem

  • Wersje RCM przed 7.0.3.0
  • Wersje RCM przed 6.7.9.0

Wersje RCM starsze niż 6.5.16.0.
 

Kasety UCS M5 i zintegrowane serwery UCS M5 montowane w szafie serwerowej

Cisco UCS 4.1 (1d) lub nowszy rozszerza zakres ochrony pamięci przed błędami. Ta wersja i nowsze wersje zawierają dodatkowe funkcje RAS, adaptacyjną korekcję danych podwójnego urządzenia (ADDDC Sparing) i naprawę po pakiecie (PPR). Są one włączone i skonfigurowane jako "Domyślne dla platformy" dla konfiguracji RAS pamięci. We wcześniejszych wersjach konfiguracja pamięci RAS była ustawiona na "Maksymalna wydajność". Oryginalne oprogramowanie wewnętrzne, które zawierało ADDDC i PPR, zawierało UCS Manager 4.1(1d), jednak w tej wersji zidentyfikowano usterkę, która może mieć wpływ na wiele systemów, a mianowicie CSCvr79388. Z powodu tej usterki firma Cisco zmieniła minimalne wymagane oprogramowanie sprzętowe. Teraz zaleca się uaktualnienie USC do wersji 4.1(3b) lub nowszej, która zawiera poprawkę tego błędu. Wersja UCS 4.1(3b) znajduje się w poniższych wersjach RCM.


Autonomiczne szafy serwerowe UCS M5

W kontrolerze Cisco Integrated Manager Controller (IMC) w wersji 4.1(1d) i nowszych dostępne są funkcje adaptacyjnej korekcji danych podwójnego urządzenia (ADDDC Sparing) i Post Package Repair (PPR). Są one włączone i skonfigurowane jako "Domyślne dla platformy" dla konfiguracji RAS pamięci.  We wcześniejszych wersjach konfiguracja pamięci RAS była ustawiona na "Maksymalna wydajność".  Ten sam błąd, który znaleziono w UCSM w wersji 4.1(1d), dotyczy również wersji CIMC 4.1(1d). Początkowa wersja CIMC z poprawką, 4.1(3b), jest zawarta w wydaniach RCM wymienionych poniżej.


Wymagane ustawienia systemu BIOS

  • W przypadku serwerów zarządzanych przez menedżera UCS, dla których zasady systemu BIOS dla konfiguracji RAS są ustawione na "Domyślna platforma", żadne zmiany nie są wymagane, aby funkcja ADDDC Sparing została wprowadzona.
  • W przypadku serwerów zarządzanych przez program UCS Manager, dla których zasada BIOS dla konfiguracji RAS NIE jest ustawiona na "Domyślna platforma", zasada musi zostać zmieniona na ADDDC Sparing (lub Platform Default), aby korzystać z ADDDC.
  • W przypadku serwerów autonomicznych (innych niż zarządzane przez UCS Manager) nie są wymagane żadne zmiany, aby ADDDC Sparing zostały wprowadzone.


Macierz certyfikacji wydania (RCM), w tym poprawka dla wersji 4.1(3b)

  • RCM w wersji 7.0.3.0 lub nowszej dla następujących systemów:
    • VxBlock 340, 350, 540, 540-40G, 740 i 1000
    • Rozszerzenie techniczne dla zasobów obliczeniowych
  • RCM w wersji 6.7.9.0 lub nowszej dla następujących systemów
    • Vblock 240, 340, 350, 540 i 740
    • VxBlock 240, 340, 350, 540, 540-40G, 740 i 1000
    • Rozszerzenie techniczne dla zasobów obliczeniowych
  • RCM w wersji 6.5.16.0 lub nowszej dla następujących systemów
    • Vblock 240, 340, 350, 540 i 740
    • VxBlock 240, 340, 350, 540, 740 i 1000

*Nuta* Numery wersji RCM mogą się różnić w zależności od systemu VxBlock. Przed aktualizacją systemu VxBlock należy zapoznać się z wersją RCM, aby zapewnić odpowiednią zgodność z kodem. 

WAŻNE! Uaktualnij tylko wtedy, gdy wspomniany problem dotyczy bezpośrednio!

Aby uzyskać dodatkowe informacje dotyczące problemu opisanego w tym artykule, należy zapoznać się z Cisco Field Notice: Uwaga dotycząca pola: FN — 70432
Identyfikator usterki CSCvq38078


. Aby uzyskać więcej informacji, obejrzyj ten film:

Affected Products

VxBlock and vBlock Systems Series
Article Properties
Article Number: 000191333
Article Type: How To
Last Modified: 19 Nov 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.