VxBlock: Recursos de RAS de memória aprimorados para plataformas Cisco UCS M5

Summary: Devido a erros de DIMM de memória e alterações de arquitetura no manuseio de erros de memória em processadores escaláveis Intel Xeon (anteriormente com o codinome "Skylake Server") e processadores escaláveis Intel Xeon de 2ª geração (anteriormente com o codinome "Cascade Lake Server"), os clientes do Cisco UCS M5 que experimentam erros de DIMM de memória podem experimentar uma taxa mais alta de erros de memória incorrigíveis em tempo de execução do que nas gerações anteriores com o modo RAS de memória SDDC padrão. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Descrição do problema

Os servidores Cisco UCS M5 com determinados processadores escaláveis Intel Xeon podem apresentar uma taxa mais alta de erros de memória incorrigíveis em tempo de execução do que as gerações anteriores com a configuração padrão de confiabilidade, disponibilidade e facilidade de manutenção (RAS) da memória SDDC (Single Device Data Correction).


Informações gerais

Os processadores escaláveis Intel Xeon e os processadores escaláveis Xeon de 2ª geração implementaram alterações no SDDC. O SDDC é um recurso Intel RAS fundamental disponível em todas as plataformas Cisco. Como resultado dessas alterações de arquitetura e erros de módulo de memória dupla em linha (DIMM), há uma diferença em que os erros serão corrigidos entre a geração anterior de processadores e a geração da família de processadores escaláveis Xeon.

Os aprimoramentos mais recentes do BIOS e do microcódigo da Intel melhoram o gerenciamento de erros de memória, habilitando recursos adicionais de RAS de memória, como a correção de dados de dispositivo duplo adaptável (ADDDC Sparing) e o pós-reparo de pacotes (PPR). A reserva de ADDDC e o PPR agora são a configuração RAS de memória padrão em servidores Cisco UCS M5 com processadores escaláveis Intel Xeon.

Informações adicionais sobre os recursos RAS da memória, como ADDDC e PPR, podem ser encontradas no seguinte documento:  Visão geral técnica da memória Cisco UCS HX M5 – Recursos RAS da memória.

Matriz de certificação de versão (RCM) afetada

  • Versões do RCM anteriores à 7.0.3.0
  • Versões do RCM anteriores à 6.7.9.0

Versões do RCM anteriores à 6.5.16.0.
 

Blades UCS M5 e servidores em rack UCS M5 integrados

O Cisco UCS 4.1(1d) ou posterior expande a cobertura de falha de memória. Esta versão e versões posteriores incluem recursos RAS adicionais, Adaptive Double Device Data Correction (ADDDC Sparing) e Post Package Repair (PPR). Eles são ativados e configurados como "padrão da plataforma" para configurações de RAS de memória. As versões anteriores tinham a configuração de RAS de memória definida como "Desempenho máximo". O firmware original que incorporava ADDDC e PPR incluía o UCS Manager 4.1(1d), no entanto, foi identificado um defeito nesta versão que pode afetar vários sistemas, ou seja, CSCvr79388. Devido a esse defeito, a Cisco alterou o firmware mínimo necessário. Agora é recomendável atualizar a versão USC para 4.1(3b) ou posterior, que incluem a correção para esse defeito. A versão UCS 4.1(3b) está nas versões RCM abaixo.


Racks UCS M5 independentes

No Cisco Integrated Manager Controller (IMC) versão 4.1(1d) e posterior, os recursos Adaptive Double Device Data Correction (ADDDC Sparing) e Post Package Repair (PPR) estão disponíveis. Eles são ativados e configurados como "padrão da plataforma" para configurações de RAS de memória.  As versões anteriores tinham a configuração de RAS de memória definida como "Desempenho máximo".  O mesmo bug encontrado no UCSM versão 4.1(1d) também afeta a versão CIMC 4.1(1d). A versão inicial do CIMC com a correção, 4.1(3b), está incluída nas versões do RCM listadas abaixo.


Configurações necessárias do BIOS

  • Para servidores gerenciados pelo UCS Manager com a POLÍTICA do BIOS para configuração RAS definida como "Platform Default", nenhuma alteração é necessária para que a reserva do ADDDC entre em vigor.
  • Para servidores gerenciados pelo UCS Manager com a POLÍTICA do BIOS para configuração RAS NÃO definida como "Padrão da plataforma", a política deve ser alterada para Reserva de ADDDC (ou Padrão da plataforma) para aproveitar o ADDDC.
  • Para servidores independentes (não gerenciados pelo UCS Manager), nenhuma alteração é necessária para que a reserva do ADDDC entre em vigor.


Matriz de certificação de versão (RCM), incluindo correção para a versão 4.1(3b)

  • RCM versão 7.0.3.0 e posterior para os seguintes sistemas:
    • VxBlock 340, 350, 540, 540-40G, 740 e 1000
    • Extensão técnica para computação
  • RCM versão 6.7.9.0 e posterior para os seguintes sistemas:
    • Vblock 240, 340, 350, 540 e 740
    • VxBlock 240, 340, 350, 540, 540-40G, 740 e 1000
    • Extensão técnica para computação
  • RCM versão 6.5.16.0 e posterior para os seguintes sistemas:
    • Vblock 240, 340, 350, 540 e 740
    • VxBlock 240, 340, 350, 540, 740 e 1000

*Nota* Os números de versão da RCM podem ser diferentes de acordo com o sistema VxBlock. Consulte a versão do RCM antes de fazer upgrade do sistema VxBlock para garantir a conformidade adequada com o código. 

IMPORTANTE! Atualize somente se for afetado diretamente pelo problema mencionado!

Para obter detalhes adicionais sobre o problema descrito neste artigo, consulte o Aviso de campo da Cisco: Aviso de campo: FN - 70432
ID do defeito CSCvq38078


Veja este vídeo para obter mais detalhes:

Affected Products

VxBlock and vBlock Systems Series
Article Properties
Article Number: 000191333
Article Type: How To
Last Modified: 19 تشرين الثاني 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.