Data Domain: FS-Prozess-PANIC im Inode-Cache, wenn der Arbeitsspeicher im Cache-Elementpool knapp wird
摘要: In einigen aktuellen DDOS-Versionen (bestätigt in 7.7.4, 7.9.0.10 und 7.10.0, wenn DDOS 7.7.3 betroffen ist) wurde ein Fehler festgestellt, durch den ein FS-Prozess-PANIC im Inode-Cachecode auftreten kann, wenn je nach Workload ein Cacheelementpool nicht genügend Arbeitsspeicher für weitere Zuweisungen hat. ...
本文适用于
本文不适用于
本文并非针对某种特定的产品。
本文并非包含所有产品版本。
症状
Für dieses Problem gibt es keine Verschlechterung oder Vorabwarnung, die sich in Form eines FS-Prozessfehlers (PANIC) manifestieren wird. Danach würde der Prozess neu gestartet und automatisch wieder in Ordnung sein.
Aufgrund des ausgeführten Codepfads kann der FS-Prozess auf verschiedene Weise zu einem SCHWERWIEGENDEN FEHLER führen, einschließlich der folgenden:
Aufgrund des ausgeführten Codepfads kann der FS-Prozess auf verschiedene Weise zu einem SCHWERWIEGENDEN FEHLER führen, einschließlich der folgenden:
PANIC: ddr/sm/ddfs/ddfs_mtree.c: ddfs_mtree_list: 829: !((dd_errno(e) == ENOENT) || (dd_errno(e) == DD_ERR_FM_EATTRNOENT) || (dd_errno(e) == DD_ERR_STALE)) PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4872: Fatal Error PANIC: ddr/fv/file_verify.c: file_verify_update_snap_attr: 4446: Fatal Error PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4860: Fatal Error
In den Protokolldateien des DATEISYSTEM-Prozesses (ddfs.info) die folgenden Meldungen werden vor jedem Prozessabsturz gefunden:
01/17 20:21:59.292947 [7fbbf4f98f50] dd_cache_elem_reclaim: Evict count=256, Visited count=257, Skipped elem count=0, Skipped bucket count=0, Time threshold=1539816333626910. (99% full) Complete=True 01/17 20:22:04.662303 [7fbb031ad4f0] ERROR: FM fm_iget:355 - fm_iget failed to allocate elem in dd_cache 5001
Meldungen, die darauf hinweisen, dass der interne Prozess zu 99 % voll war, konnten dann keine weiteren Elemente zuweisen, was zu einem Prozessabsturz führte.
HINWEIS: Dieses Problem betrifft bekanntermaßen nur die folgenden Versionen:
- DDOS 7.7.3.x: Nicht vollständig bestätigt
- DDOS 7.7.4.x
- DDOS 7.9.0.10
- DDOS 7.10.0.x
原因
Für jeden Dateivorgang wie Lese-/Schreibvorgänge wird eine Inode-Struktur aus dem dd_cache Elementpool zugewiesen.
Wenn dieser Cache voll ist und eine neue Anforderung eingeht, wird ein Element aus diesem Cache entfernt und die neue Anforderung wird erfüllt.
Diese Entfernung basiert auf einer Zeitrichtlinie (ein Element wird entfernt, wenn in den letzten x Sekunden nicht darauf zugegriffen wurde).
Falls dieser Cache zu heiß wird (auf alle Elemente wurde innerhalb der letzten x Sekunden zugegriffen) und auch nach mehreren Erneuten Versuchen keine Elemente gelöscht werden können, gibt fm_iget DD_ERR_NOMEM zurück.
Einige Aufrufer dieser Elementpoolzuweisung können den Fehler nicht ordnungsgemäß behandeln und führen daher dazu, dass der FS-Prozess zu PANIC führt und der Speicherauszugskern "fm_iget" funktioniert, gibt einen Fehler zurück. Aus diesem Grund gibt es einige verschiedene PANIC-Signaturen, die dem zugrunde liegenden Codefehler entsprechen.
Wenn dieser Cache voll ist und eine neue Anforderung eingeht, wird ein Element aus diesem Cache entfernt und die neue Anforderung wird erfüllt.
Diese Entfernung basiert auf einer Zeitrichtlinie (ein Element wird entfernt, wenn in den letzten x Sekunden nicht darauf zugegriffen wurde).
Falls dieser Cache zu heiß wird (auf alle Elemente wurde innerhalb der letzten x Sekunden zugegriffen) und auch nach mehreren Erneuten Versuchen keine Elemente gelöscht werden können, gibt fm_iget DD_ERR_NOMEM zurück.
Einige Aufrufer dieser Elementpoolzuweisung können den Fehler nicht ordnungsgemäß behandeln und führen daher dazu, dass der FS-Prozess zu PANIC führt und der Speicherauszugskern "fm_iget" funktioniert, gibt einen Fehler zurück. Aus diesem Grund gibt es einige verschiedene PANIC-Signaturen, die dem zugrunde liegenden Codefehler entsprechen.
解决方案
Das grundlegende Codeproblem, das zu diesen Fs-Prozessabstürzen führt, wurde mit DDOS-168410 in den folgenden Versionen (und allen späteren Versionen in denselben Codezweigen) behoben:
Wenn Sie eine Version mit dem Problem ausführen (die oben aufgeführten), aber noch keinen unerwarteten Absturz des Fs-Prozesses erlebt haben, der den Symptomen in diesem Wissensdatenbankartikel entspricht, empfehlen wir, den Workaround nicht proaktiv anzuwenden und stattdessen ein Upgrade auf eine der oben genannten Versionen (oder einen ihrer Nachfolger) durchzuführen, um die neuesten Updates und Codekorrekturen in Anspruch zu nehmen.
- DDOS 7.7.5.1
- DDOS 7.10.1.0
- DDOS 7.11.0
Wenn Sie eine Version mit dem Problem ausführen (die oben aufgeführten), aber noch keinen unerwarteten Absturz des Fs-Prozesses erlebt haben, der den Symptomen in diesem Wissensdatenbankartikel entspricht, empfehlen wir, den Workaround nicht proaktiv anzuwenden und stattdessen ein Upgrade auf eine der oben genannten Versionen (oder einen ihrer Nachfolger) durchzuführen, um die neuesten Updates und Codekorrekturen in Anspruch zu nehmen.
受影响的产品
Data Domain文章属性
文章编号: 000207919
文章类型: Solution
上次修改时间: 21 12月 2023
版本: 17
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。