Data Domain:发生意外的 DDFS(Data Domain 文件系统)重新启动并发出警报 EVT-FILESYS-00008 / FILESYS-00008 或 EVT-FILESYS-00010 / FILESYS-00010 或 EVT-FILESYS-00011 / FILESYS-00011
概要: 本知识库文章介绍了发生意外的文件系统重新启动时的情况、可能出现的警报以及出于分类目的需要捕获的信息。
この記事は次に適用されます:
この記事は次には適用されません:
この記事は、特定の製品に関連付けられていません。
すべての製品パージョンがこの記事に記載されているわけではありません。
現象
DDFS 进程是负责 DDOS(Data Domain 操作系统)重复数据消除文件系统操作的主要进程。
如果此进程遇到问题,将会创建以下警报之一:
- EVT-FILESYS-00008 / FILESYS-00008
- EVT-FILESYS-00010 / FILESYS-00010
- EVT-FILESYS-00011 / FILESYS-00011
该警报将通过 Data Domain 系统上配置的警报机制发送(即电子邮件/snmp)。警报也将显示在“alerts show history”输出中。
原因
此进程可以通过多种方式重新启动,例如:
在 DDFS 重新启动期间,任何正在进行的操作,如恢复/备份(即读写操作),将中断并需要重新启动。大多数备份应用程序能够识别读写中断,并自动重新启动这些操作。
发生意外的 DDFS 重新启动时,会发生以下情况:
- 直接死机,即明确的代码错误。
- 发生内部超时。DDFS 具有内部心跳监视线程(称为 hmon),用于监视 DDFS 进程内的各个子系统的运行状况。如果 hmon 发现子系统挂起或等待时间过长,就会终止 DDFS 进程。
- 发生外部超时。名为 ddr_stated 的进程负责通过心跳机制对 DDFS 进程进行外部监视。如果 DDFS 未在特定持续时间内向 ddr_stated 发送心跳,ddr_stated 会假定 DDFS 已挂起并终止 DDFS 进程。
- 进程请求的内存超出允许的数量。
- 内部完备性检查失败。
在 DDFS 重新启动期间,任何正在进行的操作,如恢复/备份(即读写操作),将中断并需要重新启动。大多数备份应用程序能够识别读写中断,并自动重新启动这些操作。
发生意外的 DDFS 重新启动时,会发生以下情况:
- 进程暂停。
- 进程使用的内存占用被写入一个“核心文件”,该文件将被写入核心转储设备,这是其中一个头单元磁盘上的特殊区域。核心文件包含调试意外重新启动原因所需的信息。
- 上述步骤完成后,DDFS 过程可以重新启动。
- 同时(即 DDFS 正在重新启动时),需要将核心文件从核心转储设备解压到 DDOS 文件系统,以便可以访问它。完成此任务的进程称为“savecore”。
- Savecore 在 /ddvar/core 中创建一个初始临时目录。目录名称为“app-<核心文件生成的日期和时间>”。
- 由于 DDFS 使用系统上的大部分内存,因此 DDFS 的内存占用可能很大。为了尽可能减少写入核心文件的数据量,savecore 从核心转储设备中读取数据,通过 gzip 传递此信息,以确保核心文件尽可能小,并开始写入名为“core-incomplete.gz”的文件。
- 此过程完成后,临时目录将被删除,/ddvar/core 中的核心文件被重命名。核心文件的命名约定如下:
- 进程名称。
- 进程 ID。
- 字符串“core”。
- 核心生成的日期/时间(Unix 时间戳格式)。
- 例如,DDFS 的核心文件可以命名为“ddfs.core.14226.1469256407.gz”。
解決方法
如上所述,核心文件的创建不是即时的,可以通过 NFS 或 CIFS 共享定期检查 /ddvar/core 目录,以确定核心文件创建完成的时间。
核心文件创建完成后将需要两个文件,以便对意外重启的原因进行分类。这些代码是:
核心文件创建完成后将需要两个文件,以便对意外重启的原因进行分类。这些代码是:
- 新的支持包。请参阅以下文章了解如何捕获和上载支持包:https://support.emc.com/kb/323283
- 出现问题时生成的核心文件。请参阅以下知识库文章,了解可用于上传和访问核心文件的各种方法:https://support.emc.com/kb/457974
対象製品
Data Domain製品
Data Domain, DD OS, Data Domain Virtual Edition文書のプロパティ
文書番号: 000064290
文書の種類: Solution
最終更新: 19 9月 2022
バージョン: 4
質問に対する他のDellユーザーからの回答を見つける
サポート サービス
お使いのデバイスがサポート サービスの対象かどうかを確認してください。