Data Domain:发生意外的 DDFS(Data Domain 文件系统)重新启动并发出警报 EVT-FILESYS-00008 / FILESYS-00008 或 EVT-FILESYS-00010 / FILESYS-00010 或 EVT-FILESYS-00011 / FILESYS-00011

Summary: 本知识库文章介绍了发生意外的文件系统重新启动时的情况、可能出现的警报以及出于分类目的需要捕获的信息。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms



DDFS 进程是负责 DDOS(Data Domain 操作系统)重复数据消除文件系统操作的主要进程。

如果此进程遇到问题,将会创建以下警报之一:
  • EVT-FILESYS-00008 / FILESYS-00008
  • EVT-FILESYS-00010 / FILESYS-00010
  • EVT-FILESYS-00011 / FILESYS-00011
上面的警报表明出现意外问题,并且需要更多信息来确定原因。

该警报将通过 Data Domain 系统上配置的警报机制发送(即电子邮件/snmp)。警报也将显示在“alerts show history”输出中。

Cause

此进程可以通过多种方式重新启动,例如:
  • 直接死机,即明确的代码错误。
  • 发生内部超时。DDFS 具有内部心跳监视线程(称为 hmon),用于监视 DDFS 进程内的各个子系统的运行状况。如果 hmon 发现子系统挂起或等待时间过长,就会终止 DDFS 进程。
  • 发生外部超时。名为 ddr_stated 的进程负责通过心跳机制对 DDFS 进程进行外部监视。如果 DDFS 未在特定持续时间内向 ddr_stated 发送心跳,ddr_stated 会假定 DDFS 已挂起并终止 DDFS 进程。
  • 进程请求的内存超出允许的数量。
  • 内部完备性检查失败。
当发生以上任意一种情况时,文件系统会尝试自动重新启动以恢复正常操作。

在 DDFS 重新启动期间,任何正在进行的操作,如恢复/备份(即读写操作),将中断并需要重新启动。大多数备份应用程序能够识别读写中断,并自动重新启动这些操作。

发生意外的 DDFS 重新启动时,会发生以下情况:
  • 进程暂停。
  • 进程使用的内存占用被写入一个“核心文件”,该文件将被写入核心转储设备,这是其中一个头单元磁盘上的特殊区域。核心文件包含调试意外重新启动原因所需的信息。
  • 上述步骤完成后,DDFS 过程可以重新启动。
  • 同时(即 DDFS 正在重新启动时),需要将核心文件从核心转储设备解压到 DDOS 文件系统,以便可以访问它。完成此任务的进程称为“savecore”。
  • Savecore 在 /ddvar/core 中创建一个初始临时目录。目录名称为“app-<核心文件生成的日期和时间>”。
  • 由于 DDFS 使用系统上的大部分内存,因此 DDFS 的内存占用可能很大。为了尽可能减少写入核心文件的数据量,savecore 从核心转储设备中读取数据,通过 gzip 传递此信息,以确保核心文件尽可能小,并开始写入名为“core-incomplete.gz”的文件。
  • 此过程完成后,临时目录将被删除,/ddvar/core 中的核心文件被重命名。核心文件的命名约定如下:
    • 进程名称。
    • 进程 ID。
    • 字符串“core”。
    • 核心生成的日期/时间(Unix 时间戳格式)。
    • 例如,DDFS 的核心文件可以命名为“ddfs.core.14226.1469256407.gz”。
由于内存占用较大,因此核心文件的创建不是即时的,可能需要数分钟才能完全完成。

Resolution

如上所述,核心文件的创建不是即时的,可以通过 NFS 或 CIFS 共享定期检查 /ddvar/core 目录,以确定核心文件创建完成的时间。

核心文件创建完成后将需要两个文件,以便对意外重启的原因进行分类。这些代码是:
  1. 新的支持包。请参阅以下文章了解如何捕获和上载支持包:https://support.emc.com/kb/323283
  2. 出现问题时生成的核心文件。请参阅以下知识库文章,了解可用于上传和访问核心文件的各种方法:https://support.emc.com/kb/457974
请将上述文件上传到支持案例。

Affected Products

Data Domain

Products

Data Domain, DD OS, Data Domain Virtual Edition
Article Properties
Article Number: 000064290
Article Type: Solution
Last Modified: 19 Sept 2022
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.