Data Domain:障害または障害エラーのあるメモリー カードまたはDIMM

Summary: このドキュメントは、エラーまたは障害の特定と解決パスの提供に役立つように提供されています。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Data Domain (DD)システムは、システム メモリー ハードウェア(DIMM)のステータスを監視します。DIMM関連のエラーが発生した場合は、適切なアラート通知が送信されます。

適用対象:
  • すべてのData Domainシステム
  • Data Domain Operating System (DDOS)のすべてのソフトウェア バージョン
DDOSによって送信される可能性のあるアラート通知:
DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert. 
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)

Cause

Data Domainシステムに取り付けられているDIMMには、修正可能なメモリー エラーをオンザフライで修正できるエラー チェック コード(ECC)が備わっています。エラーしきい値に違反すると、DDOSが障害を特定し、適切なアラートがシステムに生成されます。

修正不可能なメモリー エラーは、システムの再起動を引き起こす可能性があり、ハード メモリー障害と見なされます。単一のDIMMまたはメモリー ライザーに障害が発生すると、システム ダウン イベントが発生し、ファイル システムが有効にならない場合があります。これは、物理メモリーの大部分がData Domainファイル システム(DDFS)プロセスによって使用されるためです。

メモ: その他の症状やアラートが、メモリー エラーをマスクする場合があります(たとえば、CPUマシン チェック エラー)。詳細なログ分析とトラブルシューティングが必要になる場合があります。

Resolution

メモ: Dell PowerEdgeベースのシステムでDIMMエラーが報告された場合、リカバリーのための最初のアクションは、Data Domainユニットを再起動することです。これにより、DIMMをリカバリーするためのPPR(POSTパッケージ修復)が開始されます。

アラートの原因を特定し、影響を受けるコンポーネントのDIMM、CPU、またはマザーボードを特定し、必要に応じてパーツを交換するように努める必要があります。

可能であれば、サポート バンドルを収集し、契約しているサービス プロバイダーとサービス リクエストを作成します。次のビデオは、サポート バンドルを収集する方法を示しています。「Gather a Support Bundleこのハイパーリンクをクリックすると、デル・テクノロジーズ以外のWebサイトにアクセスします。

解決のガイドライン:

  • Dell PowerEdgeベースのシステムでは、システムの再起動を開始して、自動POSTパッケージ修復(PPR)を容易にします。DIMMのリカバリー用。
    • BIOSファームウェアの改善により、PPRはDIMMの修正可能および修正不能なエラーを回復できます(リファレンス)
  • 現在のシステム状態をDIMMの障害またはアラートの前のAuto-Supportと比較する
  • メモリーをチェックするための便利なDD-CLI (SSH)コマンド:
# alerts show current
# system show meminfo
# enclosure show memory
# log view debug/messages.engineering  ('q' to quit)
  • DDOSオフライン診断を使用して、障害をテストおよび特定する。Dell Supportに移動して、『Dell EMC Data Domain Operating System 6.x Offline Diagnostics Suite User Guide』にアクセスします。
  • 可能であれば、物理的なトラブルシューティング方法を実行して、障害のあるコンポーネントを排除して特定します(文書化された交換ガイドと手順を使用)。
  • DIMMを取り付け直します。両側が正しくラッチされていることを確認します。
  • DIMMを、別のスロット、チャネル、バンク、コントローラーの正常なDIMMと交換します。
  • メモリー/DIMMの障害が疑われるためにシステムがダウンしている(起動しない)場合は、最小限の起動オプションを試してみます(周辺機器またはカードを取り外し、DIMM x 1をスロット「0」に残したままにします)。

Additional Information

リファレンス:

Affected Products

Data Domain, Integrated Data Protection Appliance Family

Products

PowerProtect Data Protection Appliance, Data Domain, Data Domain Deduplication Storage Systems, PowerProtect Data Protection Hardware
Article Properties
Article Number: 000204330
Article Type: Solution
Last Modified: 03 Mar 2025
Version:  11
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.