Data Domain: Unerwarteter Neustart von DDFS (Data Domain File System) ist mit einer der Warnmeldungen EVT-FILESYS-00008 / FILESYS-00008 oder EVT-FILESYS-00010 / FILESYS-00010 oder EVT-FILESYS-00011 / FILESYS-00011 aufgetreten
Summary: In diesem Wissensdatenbank-Artikel wird erläutert, warum ein unerwarteter Dateisystem-Neustart auftritt, welche möglichen Warnmeldungen erzeugt werden und welche Informationen für die Fehlerbehebung erfasst werden müssen. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Der DDFS-Prozess ist der Hauptprozess, der für die Ausführung des DDOS (Data Domain Operating System)-Deduplizierungs-Dateisystems verantwortlich ist.
Wenn bei diesem Prozess ein Problem auftritt, wird eine der folgenden Warnmeldung erzeugt:
- EVT-FILESYS-00008 / FILESYS-00008
- EVT-FILESYS-00010 / FILESYS-00010
- EVT-FILESYS-00011 / FILESYS-00011
Die Warnmeldung wird über den auf dem Data Domain-System konfigurierten Warnmeldungsmechanismus gesendet, d. h. per E-Mail/SNMP. Die Warnmeldung wird auch in der Ausgabe „alerts show history“ angezeigt.
Cause
Dieser Prozess kann aus verschiedenen Gründen neu gestartet werden, z. B.:
Während des DDFS-Neustarts werden alle laufenden Vorgänge wie z. B. Wiederherstellungen/Backups, d. h. Lese-/Schreibvorgänge, unterbrochen und müssen neu gestartet werden. Die meisten Backupanwendungen können erkennen, dass die Lese-/Schreibvorgänge unterbrochen wurden, und starten diese Vorgänge automatisch neu.
Wenn ein unerwarteter DDFS-Neustart auftritt, geschieht Folgendes:
- Eine direkte Panik, d. h. ein expliziter Codefehler.
- Eine interner Timeout ist aufgetreten. DDFS verfügt über einen internen Heartbeat-Überwachungs-Thread (genannt hmon), der die Integrität der verschiedenen Subsysteme im DDFS-Prozess überwacht. Wenn hmon feststellt, dass entweder ein Subsystem nicht mehr reagiert oder zu lange gewartet hat, wird der DDFS-Prozess beendet.
- Eine externer Timeout ist aufgetreten. Ein Prozess namens ddr_stated ist für die externe Überwachung des DDFS-Prozesses über einen Heartbeat-Mechanismus verantwortlich. Wenn DDFS innerhalb eines bestimmten Zeitraums keinen Heartbeat an ddr_stated sendet, nimmt ddr_stated an, dass DDFS nicht mehr reagiert und beendet den DDFS-Prozess.
- Der Prozess erfordert mehr Arbeitsspeicher als zulässig.
- Eine interne Plausibilitätsprüfung ist fehlgeschlagen.
Während des DDFS-Neustarts werden alle laufenden Vorgänge wie z. B. Wiederherstellungen/Backups, d. h. Lese-/Schreibvorgänge, unterbrochen und müssen neu gestartet werden. Die meisten Backupanwendungen können erkennen, dass die Lese-/Schreibvorgänge unterbrochen wurden, und starten diese Vorgänge automatisch neu.
Wenn ein unerwarteter DDFS-Neustart auftritt, geschieht Folgendes:
- Der Prozess wird angehalten.
- Die Speicherkapazität, die der Prozess verwendet hat, wird in eine „Core-Datei“ geschrieben, die auf ein Core-Speicherabbildgerät geschrieben wird. Hierbei handelt es sich um einen speziellen Bereich auf einer der Festplatten der Haupteinheit. Eine Core-Datei enthält die erforderlichen Informationen, um den Fehler zu beheben, der den unerwarteten Neustart ausgelöst hat.
- Sobald der obige Schritt abgeschlossen ist, kann der DDFS-Prozess neu gestartet werden.
- Gleichzeitig, d. h., nachdem DDFS neu gestartet wurde, muss die Core-Datei aus dem Core-Speicherabbildgerät in ein DDOS-Dateisystem extrahiert werden, damit darauf zugegriffen werden kann. Der Prozess, der diese Aufgabe durchführt, wird als „savecore“ bezeichnet.
- Savecore erstellt ein erstes temporäres Verzeichnis unter /ddvar/core. Der Verzeichnisname lautet „app-<Datum und Zeit, an dem die Core-Datei erstellt wurde>“.
- Da DDFS den Großteil des Arbeitsspeichers auf dem System verwendet, kann der Speicherbedarf für DDFS sehr groß sein. Um die Menge der in die Core-Datei geschriebenen Daten zu reduzieren, liest savecore vom Core-Speicherabbildgerät und leitet diese Informationen über gzip weiter, um sicherzustellen, dass die Core-Datei so klein wie möglich ist, und schreibt dann in eine Datei mit dem Namen „core-incomplete.gz“.
- Nachdem dieser Prozess abgeschlossen ist, wird das temporäre Verzeichnis entfernt, die Core-Datei wird unter /ddvar/core abgelegt und umbenannt. Die Namenskonvention für eine Core-Datei lautet wie folgt:
- Prozessname
- Prozess-ID
- Zeichenfolge „core“
- Datum/Zeit, an dem der Core erzeugt wurde in einem UNIX-Epoch-Format
- Zum Beispiel könnte der Name einer Core-Datei für DDFS „ddfs.core.14226.1469256407.gz“ lauten.
Resolution
Wie oben erwähnt, erfolgt die Erstellung der Core-Datei nicht unmittelbar. Das /ddvar/core-Verzeichnis kann über eine NFS- oder CIFS-Freigabe regelmäßig überprüft werden, um festzustellen, wann die Erstellung der Core-Datei abgeschlossen ist.
Nachdem die Core-Datei fertig erstellt wurde, sind zwei Informationselemente erforderlich, um die Ursache für den unerwarteten Neustart zu beheben. Diese sind:
Nachdem die Core-Datei fertig erstellt wurde, sind zwei Informationselemente erforderlich, um die Ursache für den unerwarteten Neustart zu beheben. Diese sind:
- Ein neues Support-Bundle. Informationen zum Erfassen und Hochladen eines Support-Bundles finden Sie im folgenden Artikel: https://support.emc.com/kb/323283
- Die Core-Datei, die beim Auftreten des Problems erzeugt wurde. Informationen zu den verschiedenen Methoden für das Hochladen und den Zugriff auf eine Core-Datei finden Sie im folgenden Wissensdatenbank-Artikel: https://support.emc.com/kb/457974
Affected Products
Data DomainProducts
Data Domain, DD OS, Data Domain Virtual EditionArticle Properties
Article Number: 000064290
Article Type: Solution
Last Modified: 19 Sept 2022
Version: 4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.