Data Domain:コントローラのアップグレード後の再起動ループ - メモリ不足で強制終了可能なプロセスがない

Summary: コントローラーのアップグレード後、ファイル システム(FS)を有効にしてから5分以内にシステムが再起動し続けます。根本原因は、カーネル パニックを引き起こすメモリ不足(OOM)状態です。無効なレジストリー設定が原因でシステムが「メモリー不足」と報告する。これは、システムを削除することで解決できます。MEM_HUGETLB=FALSE」レジストリキーを入力し、システムを再起動します。 ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

現象:

  • コントローラーのアップグレード後にDDが再起動し続けます。ファイル システム(FS)が有効になっている場合、DDは5分以内に再起動します。
    • FSを無効にして、再起動ループ(カーネルパニック)を回避します
  • カーネル パニック メッセージがログに記録されます。
  • メモリー不足エラーがログに記録されています。
    • kern.info: 'カーネルパニック - 同期していません: メモリ不足で、強制終了可能なプロセスがありません。

Kern.info は、「メモリ不足」エラーを示しています。

Aug 26 14:45:05 xxxx kernel: [ 1332.027261] (E4)Out of memory: Kill process 4769 (java) score 1 or sacrifice child
Aug 26 14:45:05 xxxx kernel: [ 1332.044831] (E4)Out of memory: Kill process 22332 (sms) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.305280] (E4)Out of memory: Kill process 6131 (sms) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.321218] (E4)Out of memory: Kill process 5647 (lwsmd) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.324153] (E4)Out of memory: Kill process 22442 (dd_usm) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.325088] (E4)Out of memory: Kill process 25402 (dd_ha_vol-ha_li) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.326060] (E4)Out of memory: Kill process 22459 (csmd) score 0 or sacrifice child
Aug 26 14:45:12 xxxx kernel: [ 1338.519181] (E4)Out of memory: Kill process 6415 (lwsmd) score 0 or sacrifice child
Aug 26 14:45:12 xxxx kernel: [ 1338.522521] (E4)Out of memory: Kill process 6412 (sms) score 0 or sacrifice child

Cause

コントローラーのアップグレード(DD9300からDD9900など)後も、システムが再起動し続けます。DDがループで再起動するのを防ぐために、ファイル システムが無効になりました。
カーネル ログには、複数のメモリー不足(OOM)エラーが表示され、カーネル パニックとその後の再起動がトリガーされます。

この問題の根本原因は、システムが正常に機能するために使用できるメモリが不足していることです。これには、次のようないくつかの理由が考えられますが、これらに限定されません。

  • システム ソフトウェアのメモリー リーク
  • 特定のプロセスまたはサービスに割り当てられたメモリが不足しています
  • 過剰なメモリー使用率につながるシステム構成が正しくない
  • メモリー モジュールやその他のコンポーネントの障害など、ハードウェアの問題
  • 無効なレジストリー キーが設定されている可能性があります。サポートはこのキーを削除する必要があります。制。MEM_HUGETLB=FALSEです。

メモリー不足の正確な原因を特定し、それに応じて対処するには、さらに調査する必要があります。 

システム ログとエラー メッセージを確認して、メモリーを過剰に消費し、OOMエラーを引き起こしている可能性のある特定のプロセスまたはサービスを特定します
また、システムのメモリー使用量と構成を確認すると、問題の原因となっている可能性がある誤った構成やハードウェアの問題を特定するのに役立ちます
例えば:DIMMが見つからないか配置が間違っていると、サポートされていない構成になる可能性があります。これにより、FSの起動が妨げられます。

Resolution

  1. メモリー使用量やシステム構成の誤りに関連するエラー メッセージや警告がないか、システム ログを確認します。これらに応じて対処します。
  2. それでも問題が解決しない場合は、Dellサポートに連絡してサポートを受けることを検討してください。問題のトラブルシューティングに役立つ、関連するシステム ログまたは診断情報を提供してください。
    • サポート バンドルと関連するコア|アップロードするカーネル ダンプ ファイル

Affected Products

Data Domain

Products

Data Protection
Article Properties
Article Number: 000228075
Article Type: Solution
Last Modified: 01 Nov 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.