Data Domain: Произошел неожиданный перезапуск DDFS (Data Domain File System) с оповещением EVT-FILESYS-00008 / FILESYS-00008, EVT-FILESYS-00010 / FILESYS-00010 или EVT-FILESYS-00011 / FILESYS-00011
Summary: В этой статье базы знаний объясняется, что происходит при неожиданном перезапуске файловой системы, какие предупреждения могут возникнуть и какую информацию нужно собрать для определения проблемы. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Процесс DDFS является основным процессом, ответственным за работу файловой системы дедупликации DDOS (Data Domain Operating System).
Если в процессе возникает проблема, создается одно из следующих оповещений:
- EVT-FILESYS-00008 / FILESYS-00008
- EVT-FILESYS-00010 / FILESYS-00010
- EVT-FILESYS-00011 / FILESYS-00011
Оповещение будет отправлено с помощью настроенного в системе Data Domain механизма доставки оповещений, т.е. по электронной почте/snmp. Оповещение также появится в выводе «alerts show history».
Cause
Этот процесс может быть перезапущен несколькими способами, например:
Во время перезапуска DDFS все текущие операции, такие как восстановление/резервное копирование, т.е. операции чтения/записи, будут прерваны и должны быть перезапущены. Большинство приложений резервного копирования могут распознавать прерывание операций чтения/записи и автоматически перезапускать эти операции.
При неожиданном перезапуске DDFS происходит следующее.
- Непосредственно паника, т.е. явная ошибка кода.
- Внутренняя ошибка истечения времени ожидания. DDFS имеет внутренний поток мониторинга тактовых импульсов (называемый hmon), который контролирует состояние различных подсистем в рамках процесса DDFS. Если hmon определяет, что подсистема зависла или находится в состоянии ожидания слишком долго, она прекращает процесс DDFS.
- Обнаружена внешняя ошибка истечения времени ожидания. Процесс ddr_stated отвечает за внешний мониторинг процесса DDFS с помощью механизма тактового импульса. Если DDFS не отправляет тактовый импульс в ddr_stated в течение определенного периода времени, ddr_stated предполагает, что процесс DDFS завис и прекращает его.
- Процесс запрашивает больше памяти, чем разрешено.
- Произошел сбой внутренней проверки готовности к работе.
Во время перезапуска DDFS все текущие операции, такие как восстановление/резервное копирование, т.е. операции чтения/записи, будут прерваны и должны быть перезапущены. Большинство приложений резервного копирования могут распознавать прерывание операций чтения/записи и автоматически перезапускать эти операции.
При неожиданном перезапуске DDFS происходит следующее.
- Процесс останавливается.
- Объем памяти, который использовался процессом, записывается в «файл ядра», который будет записан на устройство дампа ядра, которое представляет собой специальную область на одном из дисков головного блока. Файл ядра содержит необходимую информацию для отладки причины неожиданного перезапуска.
- После завершения вышеуказанного шага процесс DDFS может перезапуститься.
- Параллельно, т.е. после перезапуска DDFS, файл ядра необходимо извлечь из устройства дампа ядра в файловую систему DDOS, чтобы получить к нему доступ. Процесс, который выполняет эту задачу, называется «savecore».
- Savecore создает исходный временный каталог в /ddvar/core. Имя каталога будет называться «app-<date and time the core file occurred>».
- Поскольку DDFS использует большую часть памяти в системе, объем используемой DDFS памяти может быть большим. Чтобы свести к минимуму объем данных, записываемых в файл ядра, функция savecore считывает данные с устройства дампа ядра, передает эту информацию через gzip, чтобы обеспечить как можно меньший размер файла ядра и начинает запись в файл под названием «core-incomplete.gz».
- После завершения этого процесса временный каталог будет удален, а файл ядра будет помещен в /ddvar/core и переименован. Для файла ядра используется следующий принцип именования.
- Имя процесса.
- Идентификатор процесса.
- Запись «core».
- Дата/время, когда ядро было создано в формате «эпохи UNIX».
- Так, например, файл ядра для DDFS может называться «ddfs.core.14226.1469256407.gz».
Resolution
Как упоминалось выше, создание файла ядра не является мгновенным, каталог /ddvar/core можно периодически проверять через общий ресурс NFS или CIFS, чтобы определить, когда будет завершено создание файла ядра.
После завершения создания файла ядра необходимо указать две единицы информации, чтобы определить, что вызвало неожиданный перезапуск. Они перечислены ниже:
После завершения создания файла ядра необходимо указать две единицы информации, чтобы определить, что вызвало неожиданный перезапуск. Они перечислены ниже:
- Новый пакет поддержки. См. следующую статью о том, как собрать и загрузить пакет поддержки: https://support.emc.com/kb/323283
- Файл ядра создается при возникновении проблемы. Ознакомьтесь со следующей статьей базы знаний о различных методах, которые можно использовать для загрузки и доступа к файлу ядра: https://support.emc.com/kb/457974
Affected Products
Data DomainProducts
Data Domain, DD OS, Data Domain Virtual EditionArticle Properties
Article Number: 000064290
Article Type: Solution
Last Modified: 19 Sept 2022
Version: 4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.