Data Domain: FS-Prozess-PANIC im Inode-Cache, wenn der Arbeitsspeicher im Cache-Elementpool knapp wird
Resumen: In einigen aktuellen DDOS-Versionen (bestätigt in 7.7.4, 7.9.0.10 und 7.10.0, wenn DDOS 7.7.3 betroffen ist) wurde ein Fehler festgestellt, durch den ein FS-Prozess-PANIC im Inode-Cachecode auftreten kann, wenn je nach Workload ein Cacheelementpool nicht genügend Arbeitsspeicher für weitere Zuweisungen hat. ...
Este artículo se aplica a
Este artículo no se aplica a
Este artículo no está vinculado a ningún producto específico.
No se identifican todas las versiones del producto en este artículo.
Síntomas
Für dieses Problem gibt es keine Verschlechterung oder Vorabwarnung, die sich in Form eines FS-Prozessfehlers (PANIC) manifestieren wird. Danach würde der Prozess neu gestartet und automatisch wieder in Ordnung sein.
Aufgrund des ausgeführten Codepfads kann der FS-Prozess auf verschiedene Weise zu einem SCHWERWIEGENDEN FEHLER führen, einschließlich der folgenden:
Aufgrund des ausgeführten Codepfads kann der FS-Prozess auf verschiedene Weise zu einem SCHWERWIEGENDEN FEHLER führen, einschließlich der folgenden:
PANIC: ddr/sm/ddfs/ddfs_mtree.c: ddfs_mtree_list: 829: !((dd_errno(e) == ENOENT) || (dd_errno(e) == DD_ERR_FM_EATTRNOENT) || (dd_errno(e) == DD_ERR_STALE)) PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4872: Fatal Error PANIC: ddr/fv/file_verify.c: file_verify_update_snap_attr: 4446: Fatal Error PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4860: Fatal Error
In den Protokolldateien des DATEISYSTEM-Prozesses (ddfs.info) die folgenden Meldungen werden vor jedem Prozessabsturz gefunden:
01/17 20:21:59.292947 [7fbbf4f98f50] dd_cache_elem_reclaim: Evict count=256, Visited count=257, Skipped elem count=0, Skipped bucket count=0, Time threshold=1539816333626910. (99% full) Complete=True 01/17 20:22:04.662303 [7fbb031ad4f0] ERROR: FM fm_iget:355 - fm_iget failed to allocate elem in dd_cache 5001
Meldungen, die darauf hinweisen, dass der interne Prozess zu 99 % voll war, konnten dann keine weiteren Elemente zuweisen, was zu einem Prozessabsturz führte.
HINWEIS: Dieses Problem betrifft bekanntermaßen nur die folgenden Versionen:
- DDOS 7.7.3.x: Nicht vollständig bestätigt
- DDOS 7.7.4.x
- DDOS 7.9.0.10
- DDOS 7.10.0.x
Causa
Für jeden Dateivorgang wie Lese-/Schreibvorgänge wird eine Inode-Struktur aus dem dd_cache Elementpool zugewiesen.
Wenn dieser Cache voll ist und eine neue Anforderung eingeht, wird ein Element aus diesem Cache entfernt und die neue Anforderung wird erfüllt.
Diese Entfernung basiert auf einer Zeitrichtlinie (ein Element wird entfernt, wenn in den letzten x Sekunden nicht darauf zugegriffen wurde).
Falls dieser Cache zu heiß wird (auf alle Elemente wurde innerhalb der letzten x Sekunden zugegriffen) und auch nach mehreren Erneuten Versuchen keine Elemente gelöscht werden können, gibt fm_iget DD_ERR_NOMEM zurück.
Einige Aufrufer dieser Elementpoolzuweisung können den Fehler nicht ordnungsgemäß behandeln und führen daher dazu, dass der FS-Prozess zu PANIC führt und der Speicherauszugskern "fm_iget" funktioniert, gibt einen Fehler zurück. Aus diesem Grund gibt es einige verschiedene PANIC-Signaturen, die dem zugrunde liegenden Codefehler entsprechen.
Wenn dieser Cache voll ist und eine neue Anforderung eingeht, wird ein Element aus diesem Cache entfernt und die neue Anforderung wird erfüllt.
Diese Entfernung basiert auf einer Zeitrichtlinie (ein Element wird entfernt, wenn in den letzten x Sekunden nicht darauf zugegriffen wurde).
Falls dieser Cache zu heiß wird (auf alle Elemente wurde innerhalb der letzten x Sekunden zugegriffen) und auch nach mehreren Erneuten Versuchen keine Elemente gelöscht werden können, gibt fm_iget DD_ERR_NOMEM zurück.
Einige Aufrufer dieser Elementpoolzuweisung können den Fehler nicht ordnungsgemäß behandeln und führen daher dazu, dass der FS-Prozess zu PANIC führt und der Speicherauszugskern "fm_iget" funktioniert, gibt einen Fehler zurück. Aus diesem Grund gibt es einige verschiedene PANIC-Signaturen, die dem zugrunde liegenden Codefehler entsprechen.
Resolución
Das grundlegende Codeproblem, das zu diesen Fs-Prozessabstürzen führt, wurde mit DDOS-168410 in den folgenden Versionen (und allen späteren Versionen in denselben Codezweigen) behoben:
Wenn Sie eine Version mit dem Problem ausführen (die oben aufgeführten), aber noch keinen unerwarteten Absturz des Fs-Prozesses erlebt haben, der den Symptomen in diesem Wissensdatenbankartikel entspricht, empfehlen wir, den Workaround nicht proaktiv anzuwenden und stattdessen ein Upgrade auf eine der oben genannten Versionen (oder einen ihrer Nachfolger) durchzuführen, um die neuesten Updates und Codekorrekturen in Anspruch zu nehmen.
- DDOS 7.7.5.1
- DDOS 7.10.1.0
- DDOS 7.11.0
Wenn Sie eine Version mit dem Problem ausführen (die oben aufgeführten), aber noch keinen unerwarteten Absturz des Fs-Prozesses erlebt haben, der den Symptomen in diesem Wissensdatenbankartikel entspricht, empfehlen wir, den Workaround nicht proaktiv anzuwenden und stattdessen ein Upgrade auf eine der oben genannten Versionen (oder einen ihrer Nachfolger) durchzuführen, um die neuesten Updates und Codekorrekturen in Anspruch zu nehmen.
Productos afectados
Data DomainPropiedades del artículo
Número del artículo: 000207919
Tipo de artículo: Solution
Última modificación: 21 dic 2023
Versión: 17
Encuentre respuestas a sus preguntas de otros usuarios de Dell
Servicios de soporte
Compruebe si el dispositivo está cubierto por los servicios de soporte.