メイン コンテンツに進む
  • すばやく簡単にご注文が可能
  • 注文内容の表示、配送状況をトラック
  • 会員限定の特典や割引のご利用
  • 製品リストの作成とアクセスが可能
  • 「Company Administration(会社情報の管理)」では、お使いのDell EMCのサイトや製品、製品レベルでのコンタクト先に関する情報を管理できます。

スワップ テストによるPowerEdgeシステムのメモリー エラーのトラブルシューティング

概要: メモリーDIMMをスワップして、Dell Technologies PowerEdgeサーバーのメモリー エラーをトラブルシューティングします。

この記事は自動翻訳されたものである可能性があります。品質に関するフィードバックがある場合は、このページの下部にあるフォームを使用してお知らせください。

文書の内容


現象

メモ: この記事は、Xeonスケーラブル プロセッサーを搭載した新しいシステムには適用されません。新しいシステムの場合は、この記事「インテルXeonスケーラブル プロセッサー搭載Dell PowerEdgeサーバーでのDDR4自己修復とは」を確認してください。

スワップ テストによるPowerEdgeシステムのメモリー エラーのトラブルシューティング

1つまたは複数のメモリーDIMMの位置でシングルビット エラー(SBE)および/またはマルチビット エラー(MBE)が報告された場合、原因がDIMM自体にあるとは限らないため、障害がどこにあるかを正確に判断するには、いくつかの簡単なトラブルシューティングを実行する必要があります。R715のiDRACインターフェイスに表示されるメモリー エラーの例については、 図1 を参照してください。

iDRAC 6ログ
図1: iDRAC 6ログに表示されるメモリー エラー (英語のみ)

メモリーの問題を切り分けるということは、メモリーDIMMを異なるメモリー ソケット、チャネル、バンク、コントローラーにスワップすることを意味します。障害を絞り込むためにDIMMを交換する方法はいくつかあります。障害が発生したDIMMまたはソケットを特定するには、これらの方法を複数使用する必要がある場合があります。以下に、これらのメソッドの表現を示します。分かりやすく説明するために、障害が発生したDIMMはA1、または画像の青でマークされたセットのいずれかであると仮定します。

障害が発生したDIMMまたはDIMMを識別するには、DIMMを個別にではなく、グループ(チャネルまたはバンク別)でスワップする方法が最適です。
故障したDIMMまたは複数のDIMMを含むDIMMのグループを特定したら、単一のDIMMの移動を使用して、障害が発生したDIMMを識別できます。


方法1:

DIMM A1(青でマーク)とDIMM A9(赤でマーク)をスワップして、このDIMMを別のメモリー チャネルおよびバンクで試します

DIMM A1からA9
図2:DIMM A1とDIMM A9のスワップ
 

方法2:

DIMM A1(青でマーク)をDIMM B1(赤でマーク)とスワップすると、DIMMはまったく異なるメモリー コントローラー(CPU)に配置されます。

DIMM A1からB1
図3: DIMM A1とDIMM B1のスワップ
 

方法3:

DIMMのバンク全体(A1、A2、A3:青でマーク)を別のバンク(B1、B2、B3:赤でマーク)とスワップすると、新しいメモリー コントローラーで、新しいバンクのDIMMのバンク全体がテストされます。

DIMMA 123からB123
図4: DIMM A1、A2、A3とDIMM B1、B2、B3のスワップ
 

方法4

DIMMのチャネル全体(A1、A4、A7:青でマーク)を別のチャネル(B1、B2、B3:赤でマーク)とスワップして、新しいチャネルと新しいメモリー コントローラーでDIMMのチャネル全体をテストします。

DIMM A147からB147
図5: DIMM A1、A4、A7とDIMM B1、B4、B7のスワップ
 

DIMMのスワップ後の結果の解釈

一般的に、DIMMエラーはエラーで識別されたDIMMに追従する傾向があります。たとえば、DIMM A1に関するSBEレポートでは、このDIMMを別のDIMMとスワップすると、次のいずれかになります。

  1. エラー メッセージは報告されなくなり、問題が解決されます
  •   これは、メモリーを抜き差ししたことで問題が解決したことを示します
  1. エラー メッセージがDIMMに追従する(DIMM A1はDIMM B1とスワップされ、今度はエラー メッセージはDIMM B1に対して報告されます)
  • これは、このDIMMに障害が発生している可能性が最も高く、交換が必要であることを示しています。
  1. エラー メッセージはDIMMソケットに追従します(DIMM A1はDIMM B1とスワップされ、エラー メッセージは引き続きDIMM A1に対して報告されます)
  • これは、システム ボードまたはCPUに障害が発生している可能性が最も高いことを示しています
  • CPUを交換すると、交換が必要なコンポーネントを確認できます
  • 問題がCPUに問題がある場合(CPUをスワップした後にエラー メッセージが移動する)、CPUを交換します
  • DIMMソケットに問題が解決しない場合は、システム ボードを交換します
  1. エラー メッセージがDIMMまたはソケットに追従しない(スワップ後に別のDIMMに対してエラーが報告される)
  • これは、異なるDIMM(1枚または複数枚)が不良である可能性が最も高いことを示します
 
メモ: また、ファームウェアのレベルを最新の状態に保つことをお勧めします。これにより、メモリー エラーが発生するリスクを軽減し、DIMMの寿命を延ばすことができます。
詳細については、Dellナレッジベース記事 「Dell Repository Manager(DRM)」を参照してください

原因

-

解決方法

-

文書のプロパティ


影響を受ける製品

PowerEdge

最後に公開された日付

15 4月 2024

バージョン

8

文書の種類

Solution