PowerEdge 14Gインテルおよび15Gサーバー: 修正可能なエラーしきい値イベントの管理

摘要: この記事では、インテル ベースの14Gおよび15G PowerEdgeサーバー、およびAMDベースの15G PowerEdgeサーバーに取り付けられているDDR4 RDIMMまたはLRDIMMで、修正可能なエラーしきい値イベント(MEM0802またはMEM5104)を管理するための最新の推奨事項について説明します。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

注:この記事は、64x5や74x5プラットフォームなどの14G AMDベースのPowerEdgeサーバーには適用されません。DIMM自体がサポートしている場合でも、ポスト パッケージ修復の自動再インストール機能がないためです。

エンタープライズクラスのメモリー全体にわたる信頼性、アクセス性、保守性(RAS)機能の進化を通じて、Dellはお客様に透明性を提供する上で保守的なアプローチを採用してきました。この進化が続くにつれて、Dellのエラー報告に対するアプローチも変化し、主に情報提供を目的とした通知と比較して、より緊急の対応を必要とする通知に重点を置くことができます

DRAMベースのメモリー ジオメトリーが縮小し続け、お客様が求めるパフォーマンスの向上が進むにつれて、均一なスケーリングの一環として、修正可能なエラーの数が自然に増加することが予想されます。

原因

グローバル サーバー業界では、DIMMごとの修正可能なエラーの中には不可避なものがあり、メモリー モジュールの交換や即時再起動による自動再インストールの必要さえないという、Dellが共有している理解が広く受け入れられています。

解决方案

再起動して自己修復することなく、修正可能なエラーを報告しているシステムの運用を継続しても、修正不能なエラーが発生するリスクが高まり、予期しないダウンタイムが発生するリスクが高まりません。業界の他の企業は、メモリ処理が修正可能なエラーを報告しないことを公にしています

14GインテルPowerEdge BIOSバージョン2.5.4以降では、「Correctable Error Logging」と呼ばれるBIOS設定が追加され、お客様が選択した場合は、修正可能なエラーの報告を無効にするオプションが用意されています(多くのお客様がそうしています)。ログを記録しなくても、BIOSは修正可能なしきい値イベントの自動再インストールをスケジュールし続けます。このスケジュールされた自動再インストールは、その後のシステムの再起動時に自動的に実行されます

業界とお客様からの継続的なフィードバックを踏まえるために、2022年3月以降、Dell PowerEdge BIOSアップデートでは、[Correctable Error Logging]BIOS設定がデフォルトで無効に変更されます。修正可能なメモリーしきい値イベントを引き続き確認したいお客様の場合は、このBIOSオプションを再度有効にすることができます。このBIOS設定の変更が含まれるBIOSバージョンは次のとおりです。

  • 14Gインテル プラットフォーム - BIOSバージョン2.13.3以降
  • 15G AMDプラットフォーム - BIOSバージョン2.6.5以降
  • 15Gインテル プラットフォーム - BIOSバージョン1.5.5以降

システムの再起動によるDDR4 DIMM自己修復のメリット:

  • システムから取り外さずにDDR4 DIMMを修復できます。Dell製のすべてのDDR4 DIMMは、メモリー自己修復機能をサポートしています。
 
注:14G AMD PowerEdgeサーバーには、この自動再インストール機能はありません。
 
  • DRAMに組み込まれた使用可能なスペア行を使用し、電気的フュージングによって不良行を正常な行に永続的に置き換えます。
  • その後のメモリーの再トレーニングでは、センター ポイントを再調整することで「データ アイ」を最適化し、メモリー バスが最高レベルのシグナル インテグリティで動作することを保証します。

[Correctable Error Logging]BIOS 設定が有効になっている場合の修正可能なしきい値イベントの場合、メモリーしきい値イベントが発生した場合、デル・テクノロジーズでは、スケジュールされたメモリーの自動再インストールまたは自己修正を実行できるように、お客様の定期的なメンテナンス スケジュールで再起動することを推奨します。再起動後、関連づけられているDIMMの自動再インストールの成功または失敗イベントがログに記録されます。

[Correctable Error Logging]BIOS設定を無効にした場合は、お客様の定期メンテナンス スケジュールに従って再起動することをお勧めします。再起動すると、スケジュール済みの自動再インストール操作が自動的に実行されます。自動再インストールまたは自己修正操作が失敗した場合、システムはイベント(MEM0805またはMEM7114タイプのイベント)をログに記録し、影響を受けたDIMMを物理的に交換することをお勧めします

推奨事項:
Dellメモリー エンジニアリングでは、古いBIOSバージョン(2022年3月ブロック リリースの前)を使用しているPowerEdgeサーバーのお客様に、[Correctable Error Logging]BIOS設定を [Disabled]に変更することをお勧めします。これにより、サーバー インフラストラクチャ全体で散発的な修正可能なメモリーしきい値イベント(MEM0802やMEM5104タイプのイベントなど)が排除され、サーバーの再起動を推奨することで、自動再インストールや自己修正の実行が推奨されます。前述したように、スケジュールされた自動再インストールまたは自己修正操作は、サーバーの再起動時に自動的に実行され、障害が報告されます

[Correctable Error Logging]BIOS設定は、サーバーをF2設定で再起動するか、 iDRAC WebUIを使用して変更できます

F2システム設定からBIOS設定を変更するには、次の手順を実行します。

  • F2設定で停止しているサーバーを再起動します。
  • [BIOS Settings]>[Memory Settings]で、[Correctable Error Logging]を[Disabled]に変更します。
  • BIOS設定を保存しF2設定を終了します

iDRAC WebUIを使用してBIOS設定を変更するには、次の手順を実行します。

  • iDRAC WebUIへのログイン
  • [Configuration>BIOS Settings]で、[Memory Settings]セクションを展開します
  • [Correctable Error Logging]設定を[Disabled]に変更します
  • [ Apply ]ボタンをクリックして、[Memory Settings]を保存します
  • [Apply and Reboot]ボタン(すぐに再起動する場合)または[At Next Reboot]ボタンを選択して BIOSの変更を適用することを忘れないでください。

メモリー関連の既存の記事およびホワイトペーパーは、この推奨される変更を反映するように更新されます。
 

注:承認されたお客様向けメッセージングは、この記事にファイルとして添付されています。Managing Correctable Error Notices Dec 2021 v1.pdf」の出力です。


この記事は、新しい情報が利用可能になると更新されます。

受影响的产品

Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, PowerEdge XR2, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R840, OEMR R940, OEMR R940xa, Poweredge C4140, PowerEdge C6420, PowerEdge C6520 , PowerEdge C6525, PowerEdge MX740C, PowerEdge MX750c, PowerEdge MX840C, PowerEdge R350, PowerEdge R440, PowerEdge R450, PowerEdge R540, PowerEdge R550, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T340, PowerEdge T350, PowerEdge T360, PowerEdge T440, PowerEdge T550, PowerEdge T560, PowerEdge T640, PowerEdge XE2420, PowerEdge XE7420, PowerEdge XE7440, PowerEdge XE8545, PowerEdge XR11, PowerEdge XR12, PowerEdge XR4510c, PowerEdge XR4520c, VxFlex Ready Node R740xd, Dell EMC vSAN R740 Ready Node, Dell EMC vSAN R740xd Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840 ...

产品

Dell EMC XC Series XC6420 Appliance, Dell EMC XC Core 6420 System, Storage Spaces Direct R440 Ready Node, Storage Spaces Direct R640 Ready Node, Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, OEMR R340, OEMR R440 , PowerEdge XR2, OEMR R540, OEMR R640, OEMR XL R640, OEMR R650, OEMR R650xs, OEMR R6515, OEMR R6525, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R750, OEMR R750xa, OEMR R750xs, OEMR R7515, OEMR R7525, OEMR R840, OEMR R940, OEMR R940xa, OEMR T440, OEMR T550, OEMR T640, OEMR XL T640, OEMR XL R340, PowerEdge C6420, PowerEdge C6525, PowerEdge MX740C, PowerEdge MX840C, PowerEdge R340, PowerEdge R540, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T440, PowerEdge T550, PowerEdge T640, PowerFlex appliance R650, PowerFlex appliance R6525, Powerflex appliance R750, PowerFlex custom node R650, PowerFlex custom node R6525, PowerFlex custom node R750, VxFlex Ready Node R640, VxFlex Ready Node R740xd, Dell EMC vSAN R750 Ready Node, Dell EMC vSAN R7515 Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R640, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840, Dell EMC XC Core XC7525 ...
文章属性
文章编号: 000194574
文章类型: Solution
上次修改时间: 07 11月 2025
版本:  5
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。