VxBlock:改进了 Cisco UCS M5 平台的内存 RAS 功能

Summary: 由于英特尔至强可扩展处理器(之前代号为“Skylake 服务器”)和第二代英特尔至强可扩展处理器(之前代号为“Cascade Lake 服务器”)上的内存 DIMM 错误和内存错误处理的体系结构更改,遇到内存 DIMM 错误的 Cisco UCS M5 客户可能会遇到比使用默认 SDDC 内存 RAS 模式的前几代客户更高的运行时无法纠正内存错误率。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

问题描述

使用默认单设备数据纠正 (SDDC) 内存可靠性、可用性和可维护性 (RAS) 配置时,配备某些英特尔至强可扩展处理器的 Cisco UCS M5 服务器可能会遇到比前几代更高的运行时无法纠正内存错误率。


背景

英特尔至强可扩展处理器和第二代至强可扩展处理器在 SDDC 中实施了更改。SDDC 是所有 Cisco 平台上提供的一项基本英特尔 RAS 功能。由于这些体系结构更改和内存双列直插式内存模块 (DIMM) 错误,上一代处理器与至强可扩展处理器系列之间存在差异。

最新的英特尔微码和 BIOS 增强功能通过启用额外的内存 RAS 功能(如自适应双设备数据纠正 (ADDDC Sparing) 和数据包后修复 (PPR))来改进内存错误的管理。ADDDC 备盘和 PPR 现在是配备英特尔至强可扩展处理器的 Cisco UCS M5 服务器上的默认内存 RAS 配置。

有关内存 RAS 功能(如 ADDDC 和 PPR)的其他信息,请参阅以下文档:  Cisco UCS HX M5 内存技术概述 — 内存 RAS 功能

受影响的版本认证矩阵 (RCM)

  • 7.0.3.0 之前的 RCM 版本
  • 6.7.9.0 之前的 RCM 版本

6.5.16.0 之前的 RCM 版本。
 

UCS M5 刀片式服务器和集成式 UCS M5 机架式服务器

Cisco UCS 4.1(1d) 或更高版本扩展了内存故障覆盖范围。此版本及更高版本包括额外的 RAS 功能、自适应双设备数据纠正 (ADDDC Sparing) 和开机自检软件包修复 (PPR)。对于内存 RAS 配置,它们已启用并配置为“平台默认值”。早期版本的内存 RAS 配置设置为“最大性能”。合并ADDDC和PPR的原始固件包括UCS Manager 4.1(1d),但是在此版本中发现了一个缺陷,该缺陷可能会影响多个系统,即CSCvr79388。由于此缺陷,Cisco 已更改所需的最低固件。现在建议将 USC 版本升级到 4.1(3b) 或更高版本,其中包括此缺陷的修复。UCS 4.1(3b) 版本在下面的 RCM 版本中。


独立 UCS M5 机架

在Cisco Integrated Manager控制器(IMC)版本4.1(1d)及更高版本中,自适应双设备数据纠正(ADDDC备用)和开机自检软件包修复(PPR)功能可用。对于内存 RAS 配置,它们已启用并配置为“平台默认值”。  早期版本的内存 RAS 配置设置为“最大性能”。  在UCSM版本4.1(1d)中发现的相同错误也会影响CIMC 4.1(1d)版本。带有修复的初始CIMC版本4.1(3b)包含在下面列出的RCM版本中。


所需的 BIOS 设置

  • 对于将RAS配置的BIOS策略设置为“平台默认值”的UCS Manager托管服务器,无需进行任何更改即可使ADDDC备盘生效。
  • 对于将RAS配置的BIOS策略未设置为“平台默认值”的UCS Manager托管服务器,必须将策略更改为ADDDC Sparing(或平台默认值)才能利用ADDDC。
  • 对于独立(非UCS管理器托管)服务器,无需进行任何更改即可使ADDDC备盘生效。


版本认证矩阵 (RCM),包括版本 4.1(3b) 的修复

  • 适用于以下系统的 RCM 版本 7.0.3.0 及更高版本
    • VxBlock 340、350、540、540-40G、740 和 1000
    • 计算技术扩展
  • 适用于以下系统的 RCM 版本 6.7.9.0 及更高版本
    • Vblock 240、340、350、540 和 740
    • VxBlock 240、340、350、540、540-40G、740 和 1000
    • 计算技术扩展
  • 适用于以下系统的 RCM 版本 6.5.16.0 及更高版本
    • Vblock 240、340、350、540 和 740
    • VxBlock 240、340、350、540、740 和 1000

*注意* 每个 VxBlock 系统的 RCM 版本号可能有所不同。在升级 VxBlock 系统之前参考 RCM 版本,以确保正确的代码合规性。

重要提示!仅当受到上述问题的直接影响时才升级!

有关本文中所述问题的更多详细信息,请参阅 Cisco 现场通知:现场通知:FN - 70432
缺陷 ID CSCvq38078


有关更多详细信息,请观看此视频:

Affected Products

VxBlock and vBlock Systems Series
Article Properties
Article Number: 000191333
Article Type: How To
Last Modified: 19 تشرين الثاني 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.