VxBlock: Cisco UCS M5 プラットフォームのメモリ RAS 機能の改善
Summary: Intel Xeon スケーラブル プロセッサ(旧コードネーム「Skylake Server」)および第 2 世代 Intel Xeon スケーラブル プロセッサ(旧コードネーム「Cascade Lake Server」)のメモリ DIMM エラーとメモリ エラー処理のアーキテクチャの変更により、メモリ DIMM エラーが発生した Cisco UCS M5 のお客様は、デフォルトの SDDC メモリ RAS モードを使用する前世代よりも、ランタイム修正不能なメモリ エラーの発生率が高くなる可能性があります。 ...
Instructions
問題の説明
特定の Intel Xeon スケーラブル プロセッサを搭載した Cisco UCS M5 サーバでは、デフォルトの Single Device Data Correction(SDDC)メモリの信頼性、可用性、および保守性(RAS)設定では、旧世代よりもランタイム修正不能なメモリ エラーの割合が高くなる可能性があります。
背景
インテルXeonスケーラブル プロセッサーと第2世代Xeonスケーラブル プロセッサーでは、SDDCに変更が実装されました。SDDCは、すべてのCiscoプラットフォームで利用可能な基本的なインテルRAS機能です。これらのアーキテクチャの変更とメモリー デュアル インライン メモリー モジュール(DIMM)エラーの結果として、旧世代のプロセッサーとXeonスケーラブル プロセッサー ファミリーの世代では、エラーが修正される違いが生じます
最新のインテル マイクロコードとBIOSの機能拡張により、Adaptive Double Device Data Correction(ADDDCスペアリング)やPost Packet Repair(PPR)などの追加のメモリーRAS機能が有効になり、メモリー エラーの管理が向上します。インテル Xeon スケーラブル プロセッサーを搭載したCisco UCS M5サーバーでは、ADDDCスペアリングとPPRがデフォルトのメモリーRAS構成になりました。
ADDDCやPPRなどのメモリーRAS機能の詳細については、次のドキュメントを参照してください。 Cisco UCS HX M5 メモリ技術概要 - メモリ RAS 機能.
影響を受けるリリース認定マトリックス(RCM)
- 7.0.3.0 より前の RCMリリース
- RCM 6.7.9.0 より前の リリース
6.5.16.0 より前の RCMリリース。
UCS M5ブレードおよび統合UCS M5ラック サーバー
Cisco UCS 4.1(1d) 以降では、メモリ障害のカバレッジが拡張されています。このリリース以降のバージョンには、追加のRAS機能、Adaptive Double Device Data Correction(ADDDCスペアリング)、およびポスト パッケージ修復(PPR)が含まれています。これらは、メモリーRAS構成の「プラットフォーム デフォルト」として有効化され、構成されています。以前のリリースでは、メモリーRAS構成が「最大限のパフォーマンス」に設定されていました。ADDDC と PPR を組み込んだ元のファームウェアには UCS Manager 4.1(1d) が含まれていましたが、このバージョンでは、複数のシステム(CSCvr79388)に影響を与える可能性のある欠陥が特定されました。この不具合により、シスコは最低限必要なファームウェアを変更しました。この不具合の修正を含む USC バージョンを 4.1(3b) 以降にアップグレードすることをお勧めします。UCS 4.1(3b) リリースは、以下の RCM バージョンに含まれています。
スタンドアロンUCS M5ラック
Cisco Integrated Manager Controller(IMC)リリース 4.1(1d) 以降では、Adaptive Double Device Data Correction(ADDDC Sparing)および Post Package Repair(PPR)機能を使用できます。これらは、メモリーRAS構成の「プラットフォーム デフォルト」として有効化され、構成されています。 以前のリリースでは、メモリーRAS構成が「最大限のパフォーマンス」に設定されていました。 UCSMバージョン4.1(1d)で見つかったのと同じバグは、CIMC 4.1(1d)バージョンにも影響します。修正を含む最初の CIMC バージョンである 4.1(3b) は、次にリストされている RCM リリースに含まれています
必要なBIOS設定
- RAS構成のBIOSポリシーが「プラットフォームのデフォルト」に設定されているUCS Manager管理対象サーバーの場合、ADDDCスペアリングを有効にするために変更は必要ありません。
- RAS構成のBIOSポリシーが「プラットフォームのデフォルト」に設定されていないUCS Manager管理対象サーバーの場合、ADDDCを利用するには、ポリシーをADDDCスペアリング(またはプラットフォームのデフォルト)に変更する必要があります。
- スタンドアロン(UCS Manager で管理されていない)サーバの場合、ADDDC スペアリングを有効にするために変更は必要ありません。
リリース4.1(3b)の修正を含むリリース認定マトリックス(RCM)
- RCMリリース7.0.3.0以降 (次のシステム用)
- VxBlock 340、350、540、540-40G、740、1000
- コンピューティング向けのテクノロジー拡張
- RCMリリース6.7.9.0 以降 (次のシステム用)
- Vblock 240、340、350、540、740
- VxBlock 240、340、350、540、540-40G、740、1000
- コンピューティング向けのテクノロジー拡張
- RCMリリース6.5.16.0 以降 (次のシステム用)
- Vblock 240、340、350、540、740
- VxBlock 240、340、350、540、740、1000
*手記* RCMのリリース番号は、VxBlock systemごとに異なる場合があります。VxBlock systemをアップグレードする前にRCMのバージョンを参照して、適切なコード コンプライアンスを確保してください。
重要:前述の問題の影響を直接受ける場合にのみアップグレードしてください
この記事に記載されている問題の詳細については、「Cisco Field Notice: Field Notice: FNの - 70432
欠陥 ID CSCvq38078
詳細については、次のビデオを参照してください。