VxBlock: Cisco UCS M5 플랫폼에 대한 향상된 메모리 RAS 기능
Summary: 인텔 제온 스케일러블 프로세서(이전 코드명 "Skylake Server") 및 2세대 인텔 제온 스케일러블 프로세서(이전 코드명 "Cascade Lake Server")에서 메모리 DIMM 오류 및 메모리 오류 처리의 아키텍처 변경으로 인해 메모리 DIMM 오류가 발생하는 Cisco UCS M5 고객은 기본 SDDC 메모리 RAS 모드를 사용하는 이전 세대에서 경험한 것보다 더 높은 비율의 수정할 수 없는 런타임 메모리 오류를 경험할 수 있습니다. ...
Instructions
문제 설명
특정 인텔 제온 스케일러블 프로세서가 탑재된 Cisco UCS M5 서버는 기본 SDDC(Single Device Data Correction) RAS(Memory Reliability, Availability, and Serviceability) 구성을 사용하는 이전 세대보다 수정할 수 없는 런타임 메모리 오류 비율이 높을 수 있습니다.
배경
인텔 제온 스케일러블 프로세서와 2세대 제온 스케일러블 프로세서가 SDDC에 변경 사항을 구현했습니다. SDDC는 모든 Cisco 플랫폼에서 사용할 수 있는 기본 인텔 RAS 기능입니다. 이러한 아키텍처 변경 및 메모리 DIMM(Dual Inline Memory Module) 오류로 인해 이전 세대 프로세서와 제온 스케일러블 프로세서 제품군 세대 간에 수정되는 오류에 차이가 있습니다.
최신 인텔 마이크로코드 및 BIOS 개선 사항은 ADDDC 스페어링(Adaptive Double Device Data Correction) 및 PPR(Post Packet Repair)과 같은 추가 메모리 RAS 기능을 활성화하여 메모리 오류 관리를 개선합니다. ADDDC 스페어링 및 PPR은 이제 인텔 제온 스케일러블 프로세서가 탑재된 Cisco UCS M5 서버의 기본 메모리 RAS 구성입니다.
ADDDC 및 PPR과 같은 메모리 RAS 기능에 대한 자세한 내용은 다음 문서에서 확인할 수 있습니다. Cisco UCS HX M5 메모리 기술 개요 - 메모리 RAS 기능.
영향을 받는 RCM(Release Certification Matrix)
- 7.0.3.0 이전의 RCM 릴리스
- 6.7.9.0 이전의 RCM 릴리스
6.5.16.0 이전의 RCM 릴리스
UCS M5 블레이드 및 통합 UCS M5 랙 서버
Cisco UCS 4.1(1d) 이상은 메모리 장애 범위를 확장합니다. 이 릴리스 이상 버전에는 추가 RAS 기능, ADDDC 스페어링(Adaptive Double Device Data Correction) 및 PPR(Post Package Repair)이 포함되어 있습니다. 메모리 RAS 구성에 대해 "Platform Default"로 활성화 및 구성됩니다. 이전 릴리스에서는 메모리 RAS 구성이 "최대 성능"으로 설정되었습니다. ADDDC 및 PPR을 통합한 원래 펌웨어에는 UCS Manager 4.1(1d)이 포함되어 있었지만 이 버전에서는 여러 시스템(CSCvr79388)에 영향을 줄 수 있는 결함이 확인되었습니다. 이 결함으로 인해 Cisco는 필요한 최소 펌웨어를 변경했습니다. 이제 이 결함에 대한 수정 사항이 포함된 USC 버전을 4.1(3b) 이상으로 업그레이드하는 것이 좋습니다. UCS 4.1(3b) 릴리스는 아래의 RCM 버전에 있습니다.
독립 실행형 UCS M5 랙
Cisco IMC(Integrated Manager Controller) 릴리스 4.1(1d) 이상에서는 ADDDC 스페어링(Adaptive Double Device Data Correction) 및 PPR(Post Package Repair) 기능을 사용할 수 있습니다. 메모리 RAS 구성에 대해 "Platform Default"로 활성화 및 구성됩니다. 이전 릴리스에서는 메모리 RAS 구성이 "최대 성능"으로 설정되었습니다. UCSM 버전 4.1(1d)에서 발견된 동일한 버그는 CIMC 4.1(1d) 버전에도 영향을 미칩니다. 이 수정 사항이 포함된 초기 CIMC 버전인 4.1(3b)는 아래 나열된 RCM 릴리스에 포함되어 있습니다.
필수 BIOS 설정
- RAS 구성에 대한 BIOS 정책이 "플랫폼 기본값"으로 설정된 UCS Manager 관리 서버의 경우 ADDDC 스페어링을 적용하기 위해 변경할 필요가 없습니다.
- RAS 구성에 대한 BIOS 정책이 "플랫폼 기본값"으로 설정되지 않은 UCS Manager 관리 서버의 경우 ADDDC를 활용하려면 정책을 ADDDC 스페어링(또는 플랫폼 기본값)으로 변경해야 합니다.
- 독립 실행형(UCS Manager가 관리하지 않는) 서버의 경우 ADDDC 스페어링을 적용하기 위해 변경할 필요가 없습니다.
릴리스 4.1(3b)에 대한 수정 사항을 포함한 RCM(Release Certification Matrix)
- 다음 시스템에 대한 RCM 릴리스 7.0.3.0 이상
- VxBlock 340, 350, 540, 540-40G, 740 및 1000
- 컴퓨팅을 위한 Tech Extension
- 다음 시스템에 대한 RCM 릴리스 6.7.9.0 이상
- Vblock 240, 340, 350, 540 및 740
- VxBlock 240, 340, 350, 540, 540-40G, 740 및 1000
- 컴퓨팅을 위한 Tech Extension
- 다음 시스템에 대한 RCM 릴리스 6.5.16.0 이상
- Vblock 240, 340, 350, 540 및 740
- VxBlock 240, 340, 350, 540, 740 및 1000
*메모* RCM 릴리스 번호는 VxBlock 시스템별로 다를 수 있습니다. VxBlock 시스템을 업그레이드하기 전에 RCM 버전을 참조하여 적절한 규정 준수를 보장하십시오.
중요! 언급된 문제의 직접적인 영향을 받는 경우에만 업그레이드하십시오!
이 문서에 설명된 문제에 대한 자세한 내용은 Cisco Field Notice를 참조하십시오. 현장 알림: FN - 70432
결함 ID CSCvq38078
자세한 내용은 이 비디오를 참조하십시오.