Data Domain: Произошел неожиданный перезапуск DDFS (Data Domain File System) с оповещением EVT-FILESYS-00008 / FILESYS-00008, EVT-FILESYS-00010 / FILESYS-00010 или EVT-FILESYS-00011 / FILESYS-00011

Summary: В этой статье базы знаний объясняется, что происходит при неожиданном перезапуске файловой системы, какие предупреждения могут возникнуть и какую информацию нужно собрать для определения проблемы. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms



Процесс DDFS является основным процессом, ответственным за работу файловой системы дедупликации DDOS (Data Domain Operating System).

Если в процессе возникает проблема, создается одно из следующих оповещений:
  • EVT-FILESYS-00008 / FILESYS-00008
  • EVT-FILESYS-00010 / FILESYS-00010
  • EVT-FILESYS-00011 / FILESYS-00011
Приведенные выше оповещения указывают на непредвиденную неисправность и на необходимость получения дополнительной информации для определения причины.

Оповещение будет отправлено с помощью настроенного в системе Data Domain механизма доставки оповещений, т.е. по электронной почте/snmp. Оповещение также появится в выводе «alerts show history».

Cause

Этот процесс может быть перезапущен несколькими способами, например:
  • Непосредственно паника, т.е. явная ошибка кода.
  • Внутренняя ошибка истечения времени ожидания. DDFS имеет внутренний поток мониторинга тактовых импульсов (называемый hmon), который контролирует состояние различных подсистем в рамках процесса DDFS. Если hmon определяет, что подсистема зависла или находится в состоянии ожидания слишком долго, она прекращает процесс DDFS.
  • Обнаружена внешняя ошибка истечения времени ожидания. Процесс ddr_stated отвечает за внешний мониторинг процесса DDFS с помощью механизма тактового импульса. Если DDFS не отправляет тактовый импульс в ddr_stated в течение определенного периода времени, ddr_stated предполагает, что процесс DDFS завис и прекращает его.
  • Процесс запрашивает больше памяти, чем разрешено.
  • Произошел сбой внутренней проверки готовности к работе.
При возникновении любого из этих условий файловая система пытается автоматически перезапустить систему, чтобы возобновить нормальную работу. 

Во время перезапуска DDFS все текущие операции, такие как восстановление/резервное копирование, т.е. операции чтения/записи, будут прерваны и должны быть перезапущены. Большинство приложений резервного копирования могут распознавать прерывание операций чтения/записи и автоматически перезапускать эти операции.

При неожиданном перезапуске DDFS происходит следующее.
  • Процесс останавливается.
  • Объем памяти, который использовался процессом, записывается в «файл ядра», который будет записан на устройство дампа ядра, которое представляет собой специальную область на одном из дисков головного блока. Файл ядра содержит необходимую информацию для отладки причины неожиданного перезапуска.
  • После завершения вышеуказанного шага процесс DDFS может перезапуститься.
  • Параллельно, т.е. после перезапуска DDFS, файл ядра необходимо извлечь из устройства дампа ядра в файловую систему DDOS, чтобы получить к нему доступ. Процесс, который выполняет эту задачу, называется «savecore».
  • Savecore создает исходный временный каталог в /ddvar/core. Имя каталога будет называться «app-<date and time the core file occurred>».
  • Поскольку DDFS использует большую часть памяти в системе, объем используемой DDFS памяти может быть большим. Чтобы свести к минимуму объем данных, записываемых в файл ядра, функция savecore считывает данные с устройства дампа ядра, передает эту информацию через gzip, чтобы обеспечить как можно меньший размер файла ядра и начинает запись в файл под названием «core-incomplete.gz».
  • После завершения этого процесса временный каталог будет удален, а файл ядра будет помещен в /ddvar/core и переименован. Для файла ядра используется следующий принцип именования.
    • Имя процесса.
    • Идентификатор процесса.
    • Запись «core».
    • Дата/время, когда ядро было создано в формате «эпохи UNIX».
    • Так, например, файл ядра для DDFS может называться «ddfs.core.14226.1469256407.gz».
Из-за большого объема памяти создание файла ядра не является мгновенным и на его полное завершение может потребоваться несколько минут.

Resolution

Как упоминалось выше, создание файла ядра не является мгновенным, каталог /ddvar/core можно периодически проверять через общий ресурс NFS или CIFS, чтобы определить, когда будет завершено создание файла ядра. 

После завершения создания файла ядра необходимо указать две единицы информации, чтобы определить, что вызвало неожиданный перезапуск. Они перечислены ниже:
  1. Новый пакет поддержки. См. следующую статью о том, как собрать и загрузить пакет поддержки: https://support.emc.com/kb/323283
  2. Файл ядра создается при возникновении проблемы. Ознакомьтесь со следующей статьей базы знаний о различных методах, которые можно использовать для загрузки и доступа к файлу ядра: https://support.emc.com/kb/457974
Загрузите указанные выше элементы в обращение в службу поддержку.

Affected Products

Data Domain

Products

Data Domain, DD OS, Data Domain Virtual Edition
Article Properties
Article Number: 000064290
Article Type: Solution
Last Modified: 19 Sept 2022
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.