Data Domain: Unerwarteter Neustart von DDFS (Data Domain File System) ist mit einer der Warnmeldungen EVT-FILESYS-00008 / FILESYS-00008 oder EVT-FILESYS-00010 / FILESYS-00010 oder EVT-FILESYS-00011 / FILESYS-00011 aufgetreten
概要: In diesem Wissensdatenbank-Artikel wird erläutert, warum ein unerwarteter Dateisystem-Neustart auftritt, welche möglichen Warnmeldungen erzeugt werden und welche Informationen für die Fehlerbehebung erfasst werden müssen. ...
この記事は次に適用されます:
この記事は次には適用されません:
この記事は、特定の製品に関連付けられていません。
すべての製品パージョンがこの記事に記載されているわけではありません。
現象
Der DDFS-Prozess ist der Hauptprozess, der für die Ausführung des DDOS (Data Domain Operating System)-Deduplizierungs-Dateisystems verantwortlich ist.
Wenn bei diesem Prozess ein Problem auftritt, wird eine der folgenden Warnmeldung erzeugt:
- EVT-FILESYS-00008 / FILESYS-00008
- EVT-FILESYS-00010 / FILESYS-00010
- EVT-FILESYS-00011 / FILESYS-00011
Die Warnmeldung wird über den auf dem Data Domain-System konfigurierten Warnmeldungsmechanismus gesendet, d. h. per E-Mail/SNMP. Die Warnmeldung wird auch in der Ausgabe „alerts show history“ angezeigt.
原因
Dieser Prozess kann aus verschiedenen Gründen neu gestartet werden, z. B.:
Während des DDFS-Neustarts werden alle laufenden Vorgänge wie z. B. Wiederherstellungen/Backups, d. h. Lese-/Schreibvorgänge, unterbrochen und müssen neu gestartet werden. Die meisten Backupanwendungen können erkennen, dass die Lese-/Schreibvorgänge unterbrochen wurden, und starten diese Vorgänge automatisch neu.
Wenn ein unerwarteter DDFS-Neustart auftritt, geschieht Folgendes:
- Eine direkte Panik, d. h. ein expliziter Codefehler.
- Eine interner Timeout ist aufgetreten. DDFS verfügt über einen internen Heartbeat-Überwachungs-Thread (genannt hmon), der die Integrität der verschiedenen Subsysteme im DDFS-Prozess überwacht. Wenn hmon feststellt, dass entweder ein Subsystem nicht mehr reagiert oder zu lange gewartet hat, wird der DDFS-Prozess beendet.
- Eine externer Timeout ist aufgetreten. Ein Prozess namens ddr_stated ist für die externe Überwachung des DDFS-Prozesses über einen Heartbeat-Mechanismus verantwortlich. Wenn DDFS innerhalb eines bestimmten Zeitraums keinen Heartbeat an ddr_stated sendet, nimmt ddr_stated an, dass DDFS nicht mehr reagiert und beendet den DDFS-Prozess.
- Der Prozess erfordert mehr Arbeitsspeicher als zulässig.
- Eine interne Plausibilitätsprüfung ist fehlgeschlagen.
Während des DDFS-Neustarts werden alle laufenden Vorgänge wie z. B. Wiederherstellungen/Backups, d. h. Lese-/Schreibvorgänge, unterbrochen und müssen neu gestartet werden. Die meisten Backupanwendungen können erkennen, dass die Lese-/Schreibvorgänge unterbrochen wurden, und starten diese Vorgänge automatisch neu.
Wenn ein unerwarteter DDFS-Neustart auftritt, geschieht Folgendes:
- Der Prozess wird angehalten.
- Die Speicherkapazität, die der Prozess verwendet hat, wird in eine „Core-Datei“ geschrieben, die auf ein Core-Speicherabbildgerät geschrieben wird. Hierbei handelt es sich um einen speziellen Bereich auf einer der Festplatten der Haupteinheit. Eine Core-Datei enthält die erforderlichen Informationen, um den Fehler zu beheben, der den unerwarteten Neustart ausgelöst hat.
- Sobald der obige Schritt abgeschlossen ist, kann der DDFS-Prozess neu gestartet werden.
- Gleichzeitig, d. h., nachdem DDFS neu gestartet wurde, muss die Core-Datei aus dem Core-Speicherabbildgerät in ein DDOS-Dateisystem extrahiert werden, damit darauf zugegriffen werden kann. Der Prozess, der diese Aufgabe durchführt, wird als „savecore“ bezeichnet.
- Savecore erstellt ein erstes temporäres Verzeichnis unter /ddvar/core. Der Verzeichnisname lautet „app-<Datum und Zeit, an dem die Core-Datei erstellt wurde>“.
- Da DDFS den Großteil des Arbeitsspeichers auf dem System verwendet, kann der Speicherbedarf für DDFS sehr groß sein. Um die Menge der in die Core-Datei geschriebenen Daten zu reduzieren, liest savecore vom Core-Speicherabbildgerät und leitet diese Informationen über gzip weiter, um sicherzustellen, dass die Core-Datei so klein wie möglich ist, und schreibt dann in eine Datei mit dem Namen „core-incomplete.gz“.
- Nachdem dieser Prozess abgeschlossen ist, wird das temporäre Verzeichnis entfernt, die Core-Datei wird unter /ddvar/core abgelegt und umbenannt. Die Namenskonvention für eine Core-Datei lautet wie folgt:
- Prozessname
- Prozess-ID
- Zeichenfolge „core“
- Datum/Zeit, an dem der Core erzeugt wurde in einem UNIX-Epoch-Format
- Zum Beispiel könnte der Name einer Core-Datei für DDFS „ddfs.core.14226.1469256407.gz“ lauten.
解決方法
Wie oben erwähnt, erfolgt die Erstellung der Core-Datei nicht unmittelbar. Das /ddvar/core-Verzeichnis kann über eine NFS- oder CIFS-Freigabe regelmäßig überprüft werden, um festzustellen, wann die Erstellung der Core-Datei abgeschlossen ist.
Nachdem die Core-Datei fertig erstellt wurde, sind zwei Informationselemente erforderlich, um die Ursache für den unerwarteten Neustart zu beheben. Diese sind:
Nachdem die Core-Datei fertig erstellt wurde, sind zwei Informationselemente erforderlich, um die Ursache für den unerwarteten Neustart zu beheben. Diese sind:
- Ein neues Support-Bundle. Informationen zum Erfassen und Hochladen eines Support-Bundles finden Sie im folgenden Artikel: https://support.emc.com/kb/323283
- Die Core-Datei, die beim Auftreten des Problems erzeugt wurde. Informationen zu den verschiedenen Methoden für das Hochladen und den Zugriff auf eine Core-Datei finden Sie im folgenden Wissensdatenbank-Artikel: https://support.emc.com/kb/457974
対象製品
Data Domain製品
Data Domain, DD OS, Data Domain Virtual Edition文書のプロパティ
文書番号: 000064290
文書の種類: Solution
最終更新: 19 9月 2022
バージョン: 4
質問に対する他のDellユーザーからの回答を見つける
サポート サービス
お使いのデバイスがサポート サービスの対象かどうかを確認してください。