Passer au contenu principal
  • Passer des commandes rapidement et facilement
  • Afficher les commandes et suivre l’état de votre expédition
  • Profitez de récompenses et de remises réservées aux membres
  • Créez et accédez à une liste de vos produits
  • Gérer vos sites, vos produits et vos contacts au niveau des produits Dell EMC à l’aide de la rubrique Gestion des informations de l’entreprise.

スワップ テストによるPowerEdgeシステムのメモリー エラーのトラブルシューティング

Résumé: メモリーDIMMをスワップして、Dell Technologies PowerEdgeサーバーのメモリー エラーをトラブルシューティングします。

Cet article a peut-être été traduit automatiquement. Si vous avez des commentaires concernant sa qualité, veuillez nous en informer en utilisant le formulaire au bas de cette page.

Contenu de l’article


Symptômes

メモ: この記事は、Xeonスケーラブル プロセッサーを搭載した新しいシステムには適用されません。新しいシステムの場合は、この記事「インテルXeonスケーラブル プロセッサー搭載Dell PowerEdgeサーバーでのDDR4自己修復とは」を確認してください。

スワップ テストによるPowerEdgeシステムのメモリー エラーのトラブルシューティング

1つまたは複数のメモリーDIMMの位置でシングルビット エラー(SBE)および/またはマルチビット エラー(MBE)が報告された場合、原因がDIMM自体にあるとは限らないため、障害がどこにあるかを正確に判断するには、いくつかの簡単なトラブルシューティングを実行する必要があります。R715のiDRACインターフェイスに表示されるメモリー エラーの例については、 図1 を参照してください。

iDRAC 6ログ
図1: iDRAC 6ログに表示されるメモリー エラー (英語のみ)

メモリーの問題を切り分けるということは、メモリーDIMMを異なるメモリー ソケット、チャネル、バンク、コントローラーにスワップすることを意味します。障害を絞り込むためにDIMMを交換する方法はいくつかあります。障害が発生したDIMMまたはソケットを特定するには、これらの方法を複数使用する必要がある場合があります。以下に、これらのメソッドの表現を示します。分かりやすく説明するために、障害が発生したDIMMはA1、または画像の青でマークされたセットのいずれかであると仮定します。

障害が発生したDIMMまたはDIMMを識別するには、DIMMを個別にではなく、グループ(チャネルまたはバンク別)でスワップする方法が最適です。
故障したDIMMまたは複数のDIMMを含むDIMMのグループを特定したら、単一のDIMMの移動を使用して、障害が発生したDIMMを識別できます。


方法1:

DIMM A1(青でマーク)とDIMM A9(赤でマーク)をスワップして、このDIMMを別のメモリー チャネルおよびバンクで試します

DIMM A1からA9
図2:DIMM A1とDIMM A9のスワップ
 

方法2:

DIMM A1(青でマーク)をDIMM B1(赤でマーク)とスワップすると、DIMMはまったく異なるメモリー コントローラー(CPU)に配置されます。

DIMM A1からB1
図3: DIMM A1とDIMM B1のスワップ
 

方法3:

DIMMのバンク全体(A1、A2、A3:青でマーク)を別のバンク(B1、B2、B3:赤でマーク)とスワップすると、新しいメモリー コントローラーで、新しいバンクのDIMMのバンク全体がテストされます。

DIMMA 123からB123
図4: DIMM A1、A2、A3とDIMM B1、B2、B3のスワップ
 

方法4

DIMMのチャネル全体(A1、A4、A7:青でマーク)を別のチャネル(B1、B2、B3:赤でマーク)とスワップして、新しいチャネルと新しいメモリー コントローラーでDIMMのチャネル全体をテストします。

DIMM A147からB147
図5: DIMM A1、A4、A7とDIMM B1、B4、B7のスワップ
 

DIMMのスワップ後の結果の解釈

一般的に、DIMMエラーはエラーで識別されたDIMMに追従する傾向があります。たとえば、DIMM A1に関するSBEレポートでは、このDIMMを別のDIMMとスワップすると、次のいずれかになります。

  1. エラー メッセージは報告されなくなり、問題が解決されます
  •   これは、メモリーを抜き差ししたことで問題が解決したことを示します
  1. エラー メッセージがDIMMに追従する(DIMM A1はDIMM B1とスワップされ、今度はエラー メッセージはDIMM B1に対して報告されます)
  • これは、このDIMMに障害が発生している可能性が最も高く、交換が必要であることを示しています。
  1. エラー メッセージはDIMMソケットに追従します(DIMM A1はDIMM B1とスワップされ、エラー メッセージは引き続きDIMM A1に対して報告されます)
  • これは、システム ボードまたはCPUに障害が発生している可能性が最も高いことを示しています
  • CPUを交換すると、交換が必要なコンポーネントを確認できます
  • 問題がCPUに問題がある場合(CPUをスワップした後にエラー メッセージが移動する)、CPUを交換します
  • DIMMソケットに問題が解決しない場合は、システム ボードを交換します
  1. エラー メッセージがDIMMまたはソケットに追従しない(スワップ後に別のDIMMに対してエラーが報告される)
  • これは、異なるDIMM(1枚または複数枚)が不良である可能性が最も高いことを示します
 
メモ: また、ファームウェアのレベルを最新の状態に保つことをお勧めします。これにより、メモリー エラーが発生するリスクを軽減し、DIMMの寿命を延ばすことができます。
詳細については、Dellナレッジベース記事 「Dell Repository Manager(DRM)」を参照してください

Cause

-

Résolution

-

Propriétés de l’article


Produit concerné

PowerEdge

Dernière date de publication

15 avr. 2024

Version

8

Type d’article

Solution