Data Domain:予期しないDDFS(Data Domainファイルシステム)の再起動が発生した - EVT-FILESYS-00008/FILESYS-00008またはEVT-FILESYS-00010/FILESYS-00010またはEVT-FILESYS-00011/FILESYS-00011アラートのいずれか

概要: このナレッジベース記事では、予期しないファイルシステムの再起動が発生した場合に、発生する可能性のあるアラートと、優先順位付けするために収集する情報について説明します。

この記事は次に適用されます: この記事は次には適用されません: この記事は、特定の製品に関連付けられていません。 すべての製品パージョンがこの記事に記載されているわけではありません。

現象



DDFSプロセスは、DDOS(Data Domainオペレーティング システム)の重複排除ファイルシステムの動作を管理する主要なプロセスです。

このプロセスで問題が発生した場合は、次のいずれかのアラートが作成されます。
  • EVT-FILESYS-00008 / FILESYS-00008
  • EVT-FILESYS-00010 / FILESYS-00010
  • EVT-FILESYS-00011 / FILESYS-00011
上記のアラートは、予期しない問題が発生し、原因を確認するため、さらに情報が必要であることを示しています。

アラートは、Data Domainシステム上で構成されたアラート メカニズム(Eメール/snmp経由)を介して送信されます。また、アラートは「alerts show history」出力にも表示されます。

原因

このプロセスは、次のようなさまざまな条件で再起動することがあります。
  • 直接的なパニック。つまり、明示的なコードのバグ。
  • 内部タイムアウトが発生した。DDFSには内部ハートビート監視スレッド(hmonと呼ばれる)があり、DDFSプロセス内のさまざまなサブシステムの正常性を監視しています。hmonによりサブシステムのいずれかがハングしているまたは長時間待機していると確認された場合、DDFSプロセスを終了します。
  • 外部タイムアウトが発生した。ddr_statedと呼ばれるプロセスは、ハートビート メカニズムによってDDFSプロセスを外部的に監視する役割を担います。DDFSが特定の時間内にddr_statedにハートビートを送信しない場合、ddr_statedは、DDFSがハングしていると判断し、DDFSプロセスを終了します。
  • プロセスが許可されているよりも多くのメモリーを要求する。
  • 内部の正常性チェックに失敗した。
上記のいずれかの状況が発生すると、ファイルシステムは自動的に再起動して通常の運用を再開しようとします。

DDFSの再起動中に、リストア/バックアップなど、進行中の操作(読み取り/書き込みなど)は中断され、再起動する必要があります。ほとんどのバックアップ アプリケーションは、読み取り/書き込みが中断されたことを認識し、これらの操作を自動的に再開することができます。

予期しないDDFSの再起動が発生すると、次の処理が行われます。
  • プロセスが停止されます。
  • プロセスが使用していたメモリー フットプリントは、コア ダンプ デバイスに書き込まれる「コア ファイル」に書き込まれます。これは、いずれかのヘッド ユニット ディスク上の特別な領域です。コア ファイルには、予期しない再起動が発生した原因をデバッグするために必要な情報が含まれています。
  • 前述の手順が完了すると、DDFSプロセスを再開できます。
  • 同時に、つまりDDFSを再起動したら、コア ファイルをコア ダンプ デバイスからDDOSファイル システムに抽出し、アクセスできるようにする必要があります。このタスクを実行するプロセスは「savecore」と呼ばれます。
  • savecoreは、/ddvar/coreに最初の一時ディレクトリーを作成します。ディレクトリー名は「app-<コア ファイルが発生した日時>」となります。
  • DDFSは、システム上のメモリーの大部分を使用するため、DDFSのメモリー フットプリントのサイズが大きくなることがあります。コア ファイルに書き込まれるデータ量を最小限にするために、savecoreはコア ダンプ デバイスからの読み取りを行い、コア ファイルができるだけ小さくなるようにgzipを介してこの情報を渡し、「core-incomplete.gz」という名前のファイルへの書き込みを開始します。
  • この処理が完了すると、一時ディレクトリーが削除され、コア ファイルが/ddvar/coreに置かれ、名前が変更されます。コア ファイルの命名規則は次のとおりです。
    • プロセス名。
    • プロセスID。
    • 文字列「core」。
    • UNIXエポック形式でコアが生成された日付/時刻。
    • たとえば、DDFSのコア ファイルは「ddfs.core.14226.1469256407.gz」と命名できます。
メモリー フットプリントが大きいため、コア ファイルの作成は即時ではなく、完了までに数分かかる場合があります。

解決方法

前述したように、コア ファイルの作成は即時に行われないため、コア ファイルの作成が完了したことを確認するために、NFSまたはCIFS共有を介して/ddvar/coreディレクトリーを定期的にチェックすることができます。

コア ファイルの作成が完了したら、予期しない再起動の原因を優先順位付けするために、2つの情報が必要になります。コードは次のとおりです。
  1. 新しいサポート バンドル。サポート バンドルの収集とアップロードの方法については、次の記事を参照してください:https://support.emc.com/kb/323283
  2. 問題が発生したときに生成されたコア ファイル。コア ファイルのアップロードおよびアクセスに使用できるさまざまな方法については、次のナレッジベース記事を参照してください:https://support.emc.com/kb/457974
サポート ケースに上記の項目をアップロードしてください。

対象製品

Data Domain

製品

Data Domain, DD OS, Data Domain Virtual Edition
文書のプロパティ
文書番号: 000064290
文書の種類: Solution
最終更新: 19 9月 2022
バージョン:  4
質問に対する他のDellユーザーからの回答を見つける
サポート サービス
お使いのデバイスがサポート サービスの対象かどうかを確認してください。