Data Domain:发生意外的 DDFS(Data Domain 文件系统)重新启动并发出警报 EVT-FILESYS-00008 / FILESYS-00008 或 EVT-FILESYS-00010 / FILESYS-00010 或 EVT-FILESYS-00011 / FILESYS-00011

概要: 本知识库文章介绍了发生意外的文件系统重新启动时的情况、可能出现的警报以及出于分类目的需要捕获的信息。

この記事は次に適用されます: この記事は次には適用されません: この記事は、特定の製品に関連付けられていません。 すべての製品パージョンがこの記事に記載されているわけではありません。

現象



DDFS 进程是负责 DDOS(Data Domain 操作系统)重复数据消除文件系统操作的主要进程。

如果此进程遇到问题,将会创建以下警报之一:
  • EVT-FILESYS-00008 / FILESYS-00008
  • EVT-FILESYS-00010 / FILESYS-00010
  • EVT-FILESYS-00011 / FILESYS-00011
上面的警报表明出现意外问题,并且需要更多信息来确定原因。

该警报将通过 Data Domain 系统上配置的警报机制发送(即电子邮件/snmp)。警报也将显示在“alerts show history”输出中。

原因

此进程可以通过多种方式重新启动,例如:
  • 直接死机,即明确的代码错误。
  • 发生内部超时。DDFS 具有内部心跳监视线程(称为 hmon),用于监视 DDFS 进程内的各个子系统的运行状况。如果 hmon 发现子系统挂起或等待时间过长,就会终止 DDFS 进程。
  • 发生外部超时。名为 ddr_stated 的进程负责通过心跳机制对 DDFS 进程进行外部监视。如果 DDFS 未在特定持续时间内向 ddr_stated 发送心跳,ddr_stated 会假定 DDFS 已挂起并终止 DDFS 进程。
  • 进程请求的内存超出允许的数量。
  • 内部完备性检查失败。
当发生以上任意一种情况时,文件系统会尝试自动重新启动以恢复正常操作。

在 DDFS 重新启动期间,任何正在进行的操作,如恢复/备份(即读写操作),将中断并需要重新启动。大多数备份应用程序能够识别读写中断,并自动重新启动这些操作。

发生意外的 DDFS 重新启动时,会发生以下情况:
  • 进程暂停。
  • 进程使用的内存占用被写入一个“核心文件”,该文件将被写入核心转储设备,这是其中一个头单元磁盘上的特殊区域。核心文件包含调试意外重新启动原因所需的信息。
  • 上述步骤完成后,DDFS 过程可以重新启动。
  • 同时(即 DDFS 正在重新启动时),需要将核心文件从核心转储设备解压到 DDOS 文件系统,以便可以访问它。完成此任务的进程称为“savecore”。
  • Savecore 在 /ddvar/core 中创建一个初始临时目录。目录名称为“app-<核心文件生成的日期和时间>”。
  • 由于 DDFS 使用系统上的大部分内存,因此 DDFS 的内存占用可能很大。为了尽可能减少写入核心文件的数据量,savecore 从核心转储设备中读取数据,通过 gzip 传递此信息,以确保核心文件尽可能小,并开始写入名为“core-incomplete.gz”的文件。
  • 此过程完成后,临时目录将被删除,/ddvar/core 中的核心文件被重命名。核心文件的命名约定如下:
    • 进程名称。
    • 进程 ID。
    • 字符串“core”。
    • 核心生成的日期/时间(Unix 时间戳格式)。
    • 例如,DDFS 的核心文件可以命名为“ddfs.core.14226.1469256407.gz”。
由于内存占用较大,因此核心文件的创建不是即时的,可能需要数分钟才能完全完成。

解決方法

如上所述,核心文件的创建不是即时的,可以通过 NFS 或 CIFS 共享定期检查 /ddvar/core 目录,以确定核心文件创建完成的时间。

核心文件创建完成后将需要两个文件,以便对意外重启的原因进行分类。这些代码是:
  1. 新的支持包。请参阅以下文章了解如何捕获和上载支持包:https://support.emc.com/kb/323283
  2. 出现问题时生成的核心文件。请参阅以下知识库文章,了解可用于上传和访问核心文件的各种方法:https://support.emc.com/kb/457974
请将上述文件上传到支持案例。

対象製品

Data Domain

製品

Data Domain, DD OS, Data Domain Virtual Edition
文書のプロパティ
文書番号: 000064290
文書の種類: Solution
最終更新: 19 9月 2022
バージョン:  4
質問に対する他のDellユーザーからの回答を見つける
サポート サービス
お使いのデバイスがサポート サービスの対象かどうかを確認してください。